logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

清华大学团队YOLOE的基础理论知识

该模型支持文本提示、视觉提示及全自动检测三种模式,在保留YOLO系列骨干网络、特征金字塔和分割/回归头的基础上,创新性地优化了视觉-文本语义对齐机制,通过轻量级辅助网络提升开放场景下目标识别的泛化能力,同时采用解耦式视觉提示编码降低计算复杂度,兼顾检测精度与实时性,成功打破传统模型对预定义类别的依赖,为自动驾驶、机器人视觉等动态开放环境提供灵活可靠的视觉理解解决方案。PAN的核心思想是在FPN的基

#人工智能
YOLOV11 OBB对旋转目标或字符方向的识别流程

2. 在YOLO的项目文件中的ultralytics----->cfg------>models------>11------>yolo11-obb.yaml中的类别数量进行修改,源文件的类别数量是80,改成你自己的数量就可以.Step1:通过"Open Dir"按钮选择包含待标注图像的文件夹,系统会自动加载所有图像文件。1. 在在文件夹datasets下创建文件VOC-LZY-OBB.yaml内

人工智能模型DeepSeek-V3和DeepSeek-R1的区别

以低成本和高通用性见长,适合广泛的应用场景;通过强化学习实现了专业领域的推理突破,适合需要深度推理和复杂逻辑分析的任务。两者的互补性体现了DeepSeek在技术路径上的多样性,既满足通用需求,又推动前沿推理能力的发展。

文章图片
#人工智能
人工智能模型DeepSeek-V3和DeepSeek-R1的区别

以低成本和高通用性见长,适合广泛的应用场景;通过强化学习实现了专业领域的推理突破,适合需要深度推理和复杂逻辑分析的任务。两者的互补性体现了DeepSeek在技术路径上的多样性,既满足通用需求,又推动前沿推理能力的发展。

文章图片
#人工智能
手眼协调的运动物体抓取------具身智能机器人的感知-决策- 执行-监督的技术闭环

基于神经符号的具身智能机器人通过感知、决策、执行和监督四个关键环节构建起技术闭环,从而实现高效、智能的任务执行。监督模块的主要任务是实时监测感知、决策和执行三个环节的运行状态,评估系统的整体性能,并根据需要进行调整和优化。基于神经符号的决策系统结合了神经网络的深度学习能力和符号系统的逻辑推理能力,能够处理复杂的任务逻辑和动态环境变化。是三者协同的最终“成果”。这四个技术环节紧密耦合,共同构成了一个

#机器人#人工智能
人工智能模型DeepSeek-V3和DeepSeek-R1的区别

以低成本和高通用性见长,适合广泛的应用场景;通过强化学习实现了专业领域的推理突破,适合需要深度推理和复杂逻辑分析的任务。两者的互补性体现了DeepSeek在技术路径上的多样性,既满足通用需求,又推动前沿推理能力的发展。

文章图片
#人工智能
Yolov8/Yolov11实例分割训练自有数据集

yolov8和yolov11的实例分割需将json转为yolo的txt格式的文件转换代码如下:label_format-seg.py。4)img_width和img_height,默认是640,分别指图片宽度和高度,根据实际图像尺寸修改即可。2)需要修改json_dir 的路径,它用来存放 LabelMe标注的JSON文件;注完成后,点击“Save”,保存保存标注信息,生成和图片同名的json文件

海思Hi3516CV610 -----芯片说明

●支持CBR/VBR/ABR/AVBR/CVBR/QVBR/FIXQP/QP MAP 等多种码率控制模式。说明 根据功能不同,将Hi3516CV610分为00B/10B/20B/00S/20S型号。●IVE2.5 升级算子,支持运动侦测,周界防范跟踪,透视变换,视频诊断及多种智能分析应用。●智能编码 2.0,像素升级,存储不加量,4MP30产品一天存储 5GB。●支持MIPI/LVDS/Sub-L

文章图片
#c++#c语言
RK3588的YoloV8模型的量化优化技术

需要结合训练时的伪量化步骤,比如在TensorFlow中插入伪量化节点,然后导出模型,再使用RKNN-Toolkit2进行转换,这时候可能不需要再做量化,或者需要调整参数。1、缘由:将YOLOV8训练出的模型pt转换为onnx后再通过一定数量的样本图像进行量化,虽然可通过增加量化样本图像的方法得到一定的改善,但是增加太多的样本数量出现量化不能完成的现象(100多张),会发现识别精度也很难上去。也就

文章图片
#人工智能
海思Hi3516CV610 -----芯片说明

●支持CBR/VBR/ABR/AVBR/CVBR/QVBR/FIXQP/QP MAP 等多种码率控制模式。说明 根据功能不同,将Hi3516CV610分为00B/10B/20B/00S/20S型号。●IVE2.5 升级算子,支持运动侦测,周界防范跟踪,透视变换,视频诊断及多种智能分析应用。●智能编码 2.0,像素升级,存储不加量,4MP30产品一天存储 5GB。●支持MIPI/LVDS/Sub-L

文章图片
#c++#c语言
到底了