登录社区云,与社区用户共同成长
邀请您加入社区
告别手动标注,AI聊天式标注让数据标注从33小时缩短到3.3小时。像聊天一样标注,效率提升显著。
RetrySQL是一种创新的Text-to-SQL技术,通过在训练数据中注入"错误-修正"推理链条,使小参数量模型具备自我纠错能力。该技术通过推理步骤生成、重试数据制备和模型持续预训练三个步骤实现,显著提升了模型在BIRD和SPIDER等基准测试中的性能。1.5B参数的RetrySQL模型表现接近甚至超过部分大模型,为小参数量模型的工业化应用开辟了新路径,重新定义了AI编程开发的训练范式。
本文系统讲解了卷积在图像处理中的核心原理与应用。首先对比全连接网络的局限性,引出卷积通过"局部连接+权值共享"处理图像的优势。详细拆解卷积的数学定义、边界填充问题及三大核心性质(叠加性、平移不变性、平移实现性)。重点分析三种去噪方法:平均滤波(简单但产生振铃效应)、高斯滤波(工程首选,无振铃且边缘保留好)和中值滤波(专治椒盐噪声)。在边缘提取方面,阐述了"原图-平滑图
本项目基于YOLOv8深度学习目标检测算法,开发了一套高效、精准的水藻检测系统,专门用于识别水体中的藻类分布情况。系统仅针对1个类别(水藻)进行检测,采用704张训练集图像和344张验证集图像进行模型训练,结合数据增强、迁移学习和模型优化技术,实现了较高的检测精度和鲁棒性。该系统可部署于无人机、水下机器人或固定监控设备,实时监测水体藻类生长状况,为水质管理、环境保护和生态研究提供智能化解决方案。
本项目基于YOLOv8目标检测算法,开发了一套高效、准确的辣椒叶片病害智能检测系统。系统可自动识别并分类5种辣椒叶片状态,包括黄单胞菌病(xanthomonas)、花叶病(mosaic)、健康叶片(healthy)、尾孢菌病(cercospora)和卷叶病(leaf curl)。数据集包含训练集1796张和验证集462张图像,通过数据增强、模型优化和迁移学习等技术,实现了高精度的病害检测。该系统可
RAG 全称是 Retriеval-Augmented Generation(检索增强生成),它是一种结合了信息检索与文本生成的技术架构。简单来说,就是让大模型在回答问题前,先去“查阅资料”,然后基于查到的内容进行回答。工作流程:用户提问 → 向量检索 → 拼接提示 → 生成回答。这种模式有效缓解了大模型“胡说八道”(幻觉)的问题。
本届CES以“AI Inside Every Hardware”为主题,吸引4300家参展商,其中中国展商占比22%,在AI算力、具身智能等领域表现突出。英伟达提出“物理AI”理念,推动技术从参数竞争转向场景化落地。
Canny算法是图像边缘检测的行业标准,由John F. Canny于1986年提出。其优势在于高精度、强抗噪性和良好鲁棒性,能精准定位到像素级边缘。算法包含四个核心步骤:高斯滤波去噪、梯度计算、非极大值抑制细化边缘、双阈值检测连接边缘。本文详细讲解了C#实现过程,包括创建高斯核、Sobel算子计算梯度、非极大值抑制处理等关键代码。通过代码示例展示了如何将理论转化为实践,最终生成清晰的边缘检测图像
令人惊叹!基于Qwen-Image-Edit打造的DiffThinker,将图像编辑扩散模型变成了多模态视觉推理模型,视觉思维能力竟然将GPT-5和Gemini-3-Flash远远甩在身后。DiffThinker让AI像人类一样直接在视觉空间中构思解题路径,彻底抛弃了文本中介的冗余,以生成式图像推理,开启了机器视觉思维的新可能。
《LTX-2进阶视频生成指南》摘要:本文深入解析AI视频生成工具LTX-2的进阶使用技巧,帮助创作者突破基础应用瓶颈。重点内容包括:1)针对营销、教育、社交媒体和电影级内容的不同prompt策略;2)4K/50FPS参数优化方案与性能模式选择;3)多镜头序列的种子锁定与转场技术;4)常见问题解决方案(运动模糊、角色一致性等);5)专业工作流集成建议。通过真实案例演示,展示如何将技术参数与创意需求结
综合评估,基于视觉分析的高速公路车速实时监测方案在技术上是可行且日益成熟的。它不仅仅是一个测速工具的替代品,更是构建“可感知、可计算、可管控”的下一代智慧高速公路神经系统的关键感知层。其成功实施,将推动高速公路管理从“响应式”向“预见式”、从“分段式”向“一体化”深刻转型。未来,该方案可与车路协同技术深度融合,为自动驾驶车辆提供超视距的道路状态信息;也可与气象数据结合,实现基于能见度和路面湿滑状态
YOLOv5解析:PyTorch时代的工程化典范 YOLOv5是Ultralytics公司于2020年发布的基于PyTorch的目标检测框架,尽管存在命名争议,但其工程化实现、易用性和活跃社区使其成为最流行的检测框架之一。主要特点包括: 模块化架构:采用Focus模块(后改为6×6卷积)、CSP结构和SPPF模块,平衡性能与速度 多尺度模型:提供5种规模的预训练模型(n/s/m/l/x),参数从1
随着信息技术的快速发展,数字化浪潮正在深刻改变着各行各业的生产方式和服务模式。在这一背景下,传统行业面临着前所未有的转型机遇与挑战。本报告旨在全面分析数字化转型对传统行业的影响,探讨转型过程中面临的主要问题,并提出切实可行的解决方案。
本文提供了一份YOLO模型速度优化的系统检查清单,按照模型轻量化→推理优化→硬件优化→验证的优先级排序。清单包含每项优化的具体操作、验证方法和验收标准,要求精度损失控制在3%以内。优化顺序遵循先软件后硬件的原则,每轮仅优化1-2个点并验证效果。清单详细列出了从模型选择、量化、剪枝到推理格式转换、参数调优等全流程优化项,并强调必须记录基线数据,每轮优化后都要进行速度、精度和稳定性验证。通过这份清单,
此类行为不仅容易导致犬只走失、受伤或发生交通事故,更可能因犬只失控而引发邻里纠纷,甚至造成人身伤害,尤其对儿童、老人及怕犬人士构成潜在威胁。尽管多地已出台相关管理条例,明确要求携犬出户时必须使用牵引绳,但由于缺乏高效、常态化的监管手段,违规行为仍难以被实时发现与取证。因此,探索利用计算机视觉技术,特别是基于深度学习的实时目标检测算法,对公共区域中“遛狗未牵绳”行为进行自动识别与预警,成为提升城市宠
本文详细解析了FRST(Fast Radial Symmetry Transform)算法,一种用于检测图像中径向对称兴趣点的有效方法。通过对图像梯度的方向与幅值进行分析,算法利用每个边缘像素沿梯度方向投票至潜在圆心位置的机制,构建方向投影图On和幅度投影图Mn,并结合二者生成对称响应图Sn。通过高斯平滑抑制噪声并融合多尺度结果S=∑Sn,实现对不同尺寸径向对称结构的鲁棒检测。文章还探讨了关键参数
AI技术正在重塑视觉设计行业。从最初的恐慌到如今的接纳,设计师们逐渐认识到AI的核心价值在于"学习规律"而非创造。商业实践中,成功的关键在于将人类需求准确"翻译"为AI指令,并通过工具链实现可控输出。未来设计将呈现"AI创意发生器+设计师落地裁判"的合作模式,AI拓展创意边界,人类把控品牌调性与细节。技术发展并未改变设计本质,而是淘汰了仅
第五届计算机、人工智能与控制工程研讨会(CAICE 2026)将于2026年1月23-25日在杭州隆重举行!大会面向基础与前沿、学科与产业,建立起前沿的学术交流平台,将汇聚国内外专家、学者和企业界优秀人才,围绕着计算机、人工智能与控制工程、网络与信息安全技术等相关学科领域,探究学术界和产业界面临的机遇与挑战,以期推动相关研究与应用的发展,推进学科发展和促进人才培养。
低空经济 #无人机 #5G网络 #深度学习 #IEEE #论文分享 #通信工程 #机器学习 #RadioMap #网络优化。: 低空网络、解耦表示学习、RSRP、覆盖地图预测、AI for Communication、radiomap。的蓬勃发展(无人机物流、低空监控等),准确预测。:150m、300m、500m三个高度层。:南昌训练 → 赣州测试(不同厂商设备):江西南昌三个区域,共计约9.4万
数据标注质量是AI项目成功的关键因素。研究表明,超过60%的AI项目失败源于数据标注问题,包括标注准确性、一致性和完整性问题。常见的陷阱包括认知偏差导致的标注错误、标注标准不统一、数据不平衡以及标注工具限制。这些质量问题会显著降低模型性能,放大项目成本。解决方案包括采用AI辅助标注工具(如TjMakeBot)、建立详细标注规范、实施质量保证流程以及平衡数据集。高质量的数据标注虽然前期投入较大,但能
智能割草机器人技术正经历从RTK+视觉方案向激光雷达方案的转型。传统方案存在卫星信号依赖、光照敏感等缺陷,难以满足复杂庭院环境需求。激光雷达凭借全天候工作、高精度感知和主动避障等优势,显著提升了建图效率、路径规划和地形适应能力。随着固态激光雷达技术的成熟,行业呈现多传感融合趋势,推动产品从单一功能向庭院智能生态演进。技术竞争重点正从价格转向场景适配能力,激光雷达方案有望加速智能割草机的普及,开启庭
一年一度的AAAI Fellow计划又成为了人工智能领域大家关注的焦点。本次发布的2026年名单中,共有12位知名学者当选,其中包含了四位著名华人学者。2026年AAAI Fellow名单火热出炉!其中4位华人学者获选。每年,人工智能促进协会AAAI通过其Fellow计划表彰一批在人工智能领域做出重大、持续贡献的个人。通常情况下,只有在该领域贡献十年或更长时间的会员才有机会被选为Fellow。Fe
本项目基于先进的YOLOv12目标检测算法,开发了一套高性能的船舶图像分类与检测系统。该系统能够精准地识别和定位图像或视频流中的船舶,并将其自动分类为五大特定类别:集装箱船(Container Ship)、邮轮(Cruise Ship)、军用船舶(Military Ship)、滚装船(RORO) 和 油轮(Tanker)。YOLOv12作为YOLO系列的最新迭代,在检测速度与精度上实现了显著提升,
本项目基于YOLOv10目标检测算法开发了一套专注于森林与野外环境的火灾火焰及烟雾识别系统。模型采用YOLOv10进行训练,能够实现高精度、低延迟的实时火灾预警检测。系统针对森林、山区、草原等开阔野外场景中的早期火情进行监控,可有效识别两类目标:'fire'(明火火焰)和'smoke'(烟雾),适用于无人机巡检、固定监控点等多种部署环境。模型在复杂自然背景下仍能保持较高的召回率和准确率,显著提升了
带屏拓展坞,手机副屏,机箱副屏,无线图传,AI算力卡,MINILED算法,电竞高刷方案,视频信号转换方案,AR/VR显示方案,便携显示器方案,液晶屏驱动方案,DLP投影方案带屏拓展坞,拓展坞副屏,桌搭拓展坞,副屏桌面拓展坞,副屏拓展坞
在CNN学习训练过程中,不是一次来处理一整张图片,而是先将图片划分为多个小的块,内核 kernel (或过滤器或特征检测器)每次只查看图像的一个块,这一个小块就称为 patch,然后过滤器移动到图像的另一个patch,以此类推。patch可以通俗地理解为图像块,当需要处理的图像分辨率太大而资源受限(比如显存、算力等)时,就可以将图像划分成一个个小块,这些小的图像块就是patch。划分patch只是
蓝耘元生代这个平台啊,在我看来就像是一个超级大的技术宝库。它整合了好多先进的技术和工具,能让我们在上面搞各种开发和研究。感觉它就像是一个充满魔法的舞台,能让我们的想法和创意尽情地展现出来。而且听说它在很多领域都有应用,像人工智能、大数据啥的,都能在这个平台上找到用武之地。登录与注册:打开浏览器,访问蓝耘 GPU 智算云平台官网(新用户需先进行注册,注册成功后即可享受免费体验 18 小时算力的优惠。
01这个开源动漫生成器让你的照片秒变手绘日漫尽管最近 2019 年的图灵奖颁给了计算机图形学、颁给了皮克斯 3D 动画,但很多人可能认为二维动漫更有意思...
不久前,我为一个大学项目训练了一个目标检测模型,但说实话,除了它需要很多计算力以及需要长时间观察我的训练模型,我不记得其他太更多的东西了。最近我对这些话题重拾了兴趣,我决定重新开始学习,...
算法江湖,风云再起强者集结,大战在即如果你算力超群又有一颗勇于挑战的心速来参加ECV2022极市计算机视觉开发者榜单大赛,一展身手!进入ECV2022官网报名:http://mtw.so/5NrI2JECV2022极市计算机视觉开发者榜单大赛(以下简称“ECV2022”)由是由青岛市人民政府指导,青岛西海岸新区管委、青岛市工业和信息化局、青岛市委台港澳办、青岛市城市管理局和山东极视角科技有限公司联
文章来源:天翼云网站量子位 | 公众号 QbitAI本文介绍了英特尔®至强®处理器在AI推理领域的优势,如何使用一键部署的镜像进行纯CPU环境下基于AMX加速后的DeepSeek-R1 7B蒸馏模型推理,以及纯CPU环境下部署DeepSeek-R1 671B满血版模型实践。大模型因其参数规模庞大、结构复杂,通常需要强大的计算资源来支持其推理过程,这使得算力成为大模型应用的核心要素。随着DeepSe
计算机视觉爱好者,有自己的算力(8块2080Ti),熟练运用pytorch深度学习框架,擅长图像分类、目标检测、图像分割应用。有需要的小伙伴可以加我微信tiankongdecheng1
最意外的是小算台纳管系统的‘简单好用’—— 车间工人也能通过仪表盘看懂算力状态,不用再等 IT 团队远程排查。现在生产线的 AI 质检,比老质检师傅的‘火眼金睛’还靠谱。
F-PointNet 提出了直接处理点云数据的方案,但这种方式面临着挑战,比如:如何有效地在三维空间中定位目标的可能位置,即如何产生 3D 候选框,假如全局搜索将会耗费大量算力与时间。F-PointNet是在进行点云处理之前,先使用图像信息得到一些先验搜索范围,这样既能提高效率,又能增加准确率。
由于图像数据的结构复杂,数据量大,考虑到用没有超强算力的电脑运行程序的时候,为了简化模型结构,对数据进行压缩,摄像头传来的图像先设置为80*60。修改后导入模型和设置参数的代码如下:import abcimport globimport osimport sysfrom types import LambdaTypefrom collections import dequefrom collect
计算机视觉
——计算机视觉
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net