登录社区云,与社区用户共同成长
邀请您加入社区
本文提出了一种改进YOLO26网络模型的BGBFusion方法,通过融合YCbCr和RGB色彩空间的特征来提升目标检测性能。BGBFusion模块包含相位整合模块(PIM)和交互注意力模块(IAM),分别在频域和空域实现特征引导,有效增强了边缘纹理并抑制了背景噪声。该方法在雾霾、夜间等低对比度场景下显著降低了漏检/误检率,同时保持较小的计算开销。文章详细介绍了模块结构、原理和实现代码,并提供了两种
本文介绍了Vercel AI SDK 6的高级特性,包括如何构建智能Agent和多模态应用。主要内容包括: 使用ToolLoopAgent封装智能体,使其成为可复用的模块,并演示了一个研究员Agent的实例。 Loop Control机制,通过stopWhen和prepareStep精确控制Agent的执行流程。 多模态能力,让AI能够处理图像输入,以发票识别为例展示实现方法。 DevTools调
本文聚焦餐饮行业AI的数据标注方法,阐述了高质量标注对构建食品识别数据集的关键作用。文章首先介绍AI在智能结算、营养分析等场景的应用,随后详细讲解菜品分类、食材检测、份量估计和营养成分分析四大任务的标注策略,包括分类体系搭建、边界框标注技巧、参照物辅助估计等。通过智慧食堂结算系统、营养分析APP、食品安全检测三个实战案例,展示标注技术在实际项目中的应用效果。最后推荐TjMakeBot餐饮标注工具,
滑动窗口优化基于Ceres Solver实现,优化问题构建遵循稀疏性最大化原则。参数块按物理意义划分为机器人基座位姿(6维SE(3)流形)、臂部关节角(N维欧氏空间)、相机外参(6维)、IMU零偏(6维)及特征点逆深度(1维)。每类参数块关联独立的局部参数化,SE(3)参数块通过实现四元数归一化约束。残差块设计涵盖重投影误差、IMU预积分约束、关节编码器一致性及层级相对位姿约束四类。重投影误差代价
商用系统,稳定永远比功能重要。先把流拉稳、推理稳、不崩溃,再去加花里胡哨的功能。我见过太多项目,功能做了一大堆,结果一上线就崩,最后全废了;Java做AI推理完全没问题。别被网上的Python教程忽悠了,商用企业级场景里,Java的生态、稳定性、集成能力,是Python比不了的;误报是智能监控的死敌。一定要把告警过滤做到极致,不然客户天天被告警轰炸,你的项目迟早要黄;别自己造轮子。
本文分享了一个用于道路缺陷检测的深度学习数据集,包含6000张高分辨率图像,涵盖8类常见道路缺陷(裂缝、井盖、坑洼等)。数据集采用YOLO格式标注,已划分为训练集(70%)、验证集(20%)和测试集(10%),覆盖多种道路类型和天气条件。数据采集遵循多场景、多缺陷类型原则,经过严格的质量控制和标注验证流程。该数据集可直接用于目标检测模型的训练与评估,为道路巡检智能化提供数据支持。下载链接:http
恶性疟原虫显微镜图像数据集分享 摘要:本文分享了一个针对恶性疟原虫检测的高质量显微镜图像数据集,包含2700张标注图像(YOLO格式),已划分为训练集、验证集和测试集。该数据集具有以下特点:1)专注恶性疟原虫单一类别检测;2)涵盖不同放大倍数、染色条件和感染阶段的多样图像;3)专业医学标注确保准确性。适用于目标检测模型训练、医学AI研究、临床辅助诊断等场景。数据集可通过百度网盘获取(链接:http
Service@Resource@Resource@Override// 1. 查询用户信息throw new UsernameNotFoundException("用户不存在");// 2. 查询用户拥有的权限// 3. 封装UserDetails(Spring Security标准).password(sysUser.getPassword()) // 密码需提前加密(BCrypt)
数据集核心:工业级螺丝数据集需覆盖不同光照/角度/缺陷类型,按8:1:1划分,标注时缺陷区域要精准;模型适配重新计算小锚框适配螺丝尺寸;用Focal Loss解决样本不平衡;小目标增强(Mosaic=1.0、缩小旋转/缩放幅度);工业评估:重点关注召回率(≥99%,避免漏检)和FPS(≥10,适配产线);部署优化:模型轻量化(ONNX简化+FP16),边缘端用ONNX Runtime/Tensor
AI驱动保险理赔秒级响应 本文揭示了AI在保险理赔中的落地路径:通过数据清洗、轻量级模型和实时系统实现秒级响应。关键点包括: 数据预处理:标准化文本/图像数据,将处理时间从小时级压缩至分钟级 模型优化:采用随机森林等轻量算法,实现<1ms的单次推理延迟 系统设计:构建高并发处理流程,支持自动赔付与人工审核无缝切换 行业实践表明,AI可将90%简单理赔自动化处理,同时将欺诈检测准确率提升至95
我们完成了基于YOLOv11的钢材表面缺陷检测从数据到部署的全流程实践。整个过程不仅涵盖了模型训练、损失监控与性能评估的核心技术环节,更展现了AI为传统工业质检带来的精准与效率提升。
PCA十年演进:从统计工具到智能计算基石(2015-2025) 过去十年,主成分分析(PCA)经历了三次技术跨越:从大规模矩阵分解(2015-2018)到深度表征重构(2019-2022),最终发展为2025年的智能计算原生算子。核心突破包括:eBPF实现内核级实时特征过滤、大模型语义压缩(1024D→128D)和1.58-bit边缘计算优化。技术角色从传统统计分析工具转变为支撑实时边缘感知和LL
摘要: K-means算法在2015-2025年间经历了三大技术演进:1)工程化加速期(2015-2018),通过K-means++和分布式计算优化大数据处理;2)GPU深度聚类期(2019-2022),结合Faiss和神经网络提升高维数据处理能力;3)2025年进入智算原生时代,实现eBPF内核级流式聚类和多模态语义对齐,成为大模型数据清洗和实时分析的核心组件。其应用从传统客户分群扩展到RAG系
摘要:本文探讨了利用大型语言模型(LLM)优化机器学习超参数的新方法。传统超参数优化方法如网格搜索和随机搜索存在计算量大、效率低的问题,而LLM通过其上下文理解能力和生成式推理,能够智能地生成高质量参数组合。文章展示了LLM优化流程的闭环反馈机制,并提供了完整的代码实现方案(基于OpenAI API和Scikit-learn),包括参数生成函数和优化主循环。实验表明,该方法可显著提升优化效率,同时
本项目基于YOLOv10目标检测算法开发了一套专门用于水下生物识别的智能检测系统,旨在实现对五种常见水下生物(海胆、海参、扇贝、海星和水草)的自动识别与定位。系统采用改进的YOLOv10模型架构,针对水下环境的特殊性进行了优化调整,在自构建的数据集上取得了优异的检测性能。该数据集包含7600张高质量标注图像,其中训练集5320张、验证集1520张、测试集760张,涵盖了各种水下场景和光照条件。本项
◆ 投稿前可通过CrossCheck, Turnitin、iThenticate任一查重系统进行查重,否则由文章重复率引起的被拒搞将由作者自行承担责任,涉嫌抄袭的论文将不被出版。所有的投稿都必须经过2-3位组委会专家审稿,经过严格的审稿之后,最终所有录用的论文将提交至。东北石油大学电气信息工程学院、黑龙江省复杂系统优化控制与智能分析重点实验室。第八届信息科学、电气与自动化工程国际学术会议(ISEA
当前,人工智能应用正加速从云端向边缘侧与终端设备渗透。在这一趋势下,成为关键需求。专为神经网络计算设计的因其在能效比上的巨大优势,已成为边缘AI芯片的核心组件。与此同时,凭借其更小的体积、更快的速度以及对硬件更低的依赖,在移动端、IoT设备和工业嵌入式场景中展现出强大的应用潜力。将小模型部署于NPU,旨在充分发挥两者优势,实现的AI赋能。然而,从训练完成的模型到在NPU上高效、精准地运行,中间存在
本数据集收录了来自中药材识别实际场景中的100个类别图像,总计9200张高质量样本图。这些图像已按照train/val分组格式进行整理,适用于主流深度学习框架(如PyTorch、TensorFlow、YOLO等)的训练与验证流程。图像分辨率清晰,涵盖了不同拍摄角度、光照条件和背景下的实物图像,既体现了真实场景的复杂性,又保证了语义的代表性。中药文化源远流长,是中华民族的瑰宝。随着人工智能技术的不断
Python是做算法研究、快速验证的利器,但企业级落地的核心是“适配现有系统、保障稳定性和性能”——这正是Java的主场。本文从技术选型、实战代码到优化避坑,完整拆解了Java部署YOLO的全流程,核心不是“抛弃Python”,而是“用对工具做对事”:Python做模型转换和原型验证,Java做工程化落地和系统集成。真正的企业级AI落地,从来不是炫技,而是把复杂的算法封装成稳定、易用、可扩展的服务
摘要: SLAM技术在过去十年(2015-2025)经历了三大演进阶段:从依赖几何特征的经典SLAM(如ORB-SLAM2),到融合深度学习的语义SLAM(如NeRF-SLAM),再到2025年结合空间计算、eBPF内核级状态估计与物理世界模型的智能系统。如今,SLAM已从单纯定位工具发展为具备毫米级精度、多机协同和语义理解能力的核心技术,通过eBPF实现微秒级位姿分发,并借助CXL 3.0共享地
摘要: 仿真技术从2015到2025年经历了三大演进阶段:从基于物理公式的离线模拟(2015-2018),到服务于AI训练的并行化智算仿真(2019-2022),再到2025年由世界模型驱动的神经仿真时代。核心突破包括:计算效率从慢于实时提升至万倍超实时;模拟方式从解析方程升级为生成式AI构建的物理直觉模型;通过eBPF实现内核级虚实闭环优化,解决安全与对齐问题。2025年的仿真已成为具备内核感知
摘要: 2015-2025年,高性能计算(HPC)经历了从传统通用算力堆叠到AI智算融合的跨越式发展。2015-2018年以多核CPU和P级算力为主,但存在功耗高、利用率低的问题;2019-2022年,GPU和混合精度计算崛起,液冷技术普及;2025年E级算力成为标配,通过CXL 3.0和HBM3e实现内存共享,eBPF技术实现内核级调度,算力利用率提升至75%以上。HPC从科研工具进化为具备AI
过去十年的演进轨迹,是将自主导航从一个**“基于几何特征的寻址程序”重塑为“赋能全球物理智能化、具备内核级权限感知与实时物理自洽能力的通用移动引擎”**。你在纠结为什么你的机器人遇到一面白墙就会因为“丢图”而原地打转。你在利用 eBPF 审计下的端到端导航系统,放心地让机器人去任何从未见过的地方,并看着它在内核级的守护下,安全、精准且具智慧地完成每一次跨越。
MATLAB仿真UR5机器人simulink simscape 自制建模正向运动学,逆向运动学关节空间轨迹规划 五次多项式轨迹规划笛卡尔空间轨迹规划 直线插补还包含机器人工具箱建立的模型对比在机器人研究领域,MATLAB是一款极为强大的工具,它提供了丰富的函数库和仿真环境,能让我们对机器人的运动学和轨迹规划进行深入的研究与分析。
在自动驾驶、工业巡检、仓储机器人等场景中,纯2D目标检测(如YOLOv9 2D版)仅能输出平面坐标,无法获取目标的深度、体积、空间位置自动驾驶场景:无法判断目标与车辆的实际距离,易引发碰撞风险;工业巡检场景:无法定位设备缺陷的3D位置,仅能看到平面区域;仓储场景:无法计算货物的3D尺寸,盘点精度低。点云数据传输耗时高(Python处理点云→C#展示,数据格式转换耗时≥20ms);实时性差(纯Pyt
本项目基于YOLOv10目标检测算法开发了一套高精度的扑克牌识别检测系统,能够准确识别和定位52种标准扑克牌(包括13个点数×4种花色)。系统在包含24,233张图像的数据集上进行了训练和验证,其中训练集21,203张,验证集2,020张,测试集1,010张。该系统可实时检测扑克牌的种类、位置和数量,可广泛应用于赌场监控、扑克游戏自动计分、魔术教学分析、智能机器人抓取等多个领域,具有重要的实用价值
本项目基于YOLOv8目标检测算法开发了一套专业的篮球比赛场景智能分析系统,能够实时检测和识别比赛中的9类关键元素:篮球(Ball)、篮筐(Hoop)、比赛节次(Period)、运动员(Player)、裁判(Ref)、进攻计时器(Shot Clock)、队名(Team Name)、球队得分(Team Points)和剩余时间(Time Remaining)。系统使用包含1,196张标注图像的数据集
智慧工厂大脑:大模型调度产线资源摘要 本文探讨了大模型技术在智慧工厂产线资源调度中的应用。传统依赖人工经验的生产调度已无法应对复杂需求,而大模型凭借多模态信息处理、复杂约束优化和实时决策能力,正成为新一代工厂"大脑"。系统架构展示了大模型作为核心调度引擎,形成从订单解析到方案执行的闭环优化流程。关键技术包括:1)处理文本、结构化和时序数据的多模态理解能力;2)平衡硬约束、软约束
过去十年的演进轨迹,是将目标检测从一个**“静态图像处理工具”重塑为“赋能全球数字化治理、具备内核级安全感知与实时物理重构能力的数字视网膜”**。你在为模型能准确框出一只“猫”而兴奋。你在利用 eBPF 审计下的检测系统,放心地让 AI 接管繁琐的安全生产监控,并看着它在内核级的守护下,精准、安全地“读懂”这个复杂世界的每一个脉络。
做目标检测开发多年,从YOLOv5到YOLOv8,踩过最多的坑不是模型训练调参,而是落地后的“最后一公里”——传统YOLO系列只能输出目标检测框、类别和置信度,却无法完成“智能分析”,这在实际场景中几乎等于“半成品”。监控场景:YOLO检测到“行人聚集”,但无法判断是正常通行还是异常拥堵,更无法给出预警建议;工业巡检场景:YOLO检测到“设备缺陷”,但无法解读缺陷类型(如裂纹/划痕)、严重程度,也
日志异常检测的终极目标,不是“发现错误”,而是“防止错误发生”。大模型赋予了系统“预知能力”——它不满足于“看到错误”,而是能“理解错误背后的逻辑”。当某条日志中出现“数据库超时”时,它知道这不是偶然,而是风暴来临前的征兆。在数字化生存的时代,每一条日志都是未被利用的预警信号。用大模型挖掘它们,企业不仅能节省百万级停机成本,更能将运维从“救火”升级为“防火”。💡🌟行动建议从100条关键日志开始
建筑工地安全AI技术通过智能监控系统实现安全帽、反光衣、危险行为的实时检测。文章详细介绍了数据标注的核心方法,包括安全装备状态识别、危险行为时序标注、场景上下文理解等关键技术。通过多个实战案例展示了AI系统在大型建筑、高空作业、基坑工程中的应用效果,显著降低了事故率。TjMakeBot平台提供了专业标注工具,助力构建高质量工地安全数据集,推动智慧工地建设,保障建设者安全。
摘要:本文设计了一个融合YOLOv11目标检测与DeepSeek多模态理解的遥感地理空间目标检测系统。系统采用Vue3+SpringBoot+Flask技术栈,结合MySQL数据库和FFmpeg视频处理工具,实现对NWPU遥感数据集中飞机、运动场地等目标的智能检测。系统支持图像/视频批量检测、实时分析、结果可视化及AI建议功能,具有检测精度高、界面友好等特点,可应用于城乡规划、灾害监测等领域。通过
这是混合量化的灵魂,告诉量化器:哪些层不准动,保留FP16。"""判断是否为量化敏感层 → 是则豁免为FP16返回 True=敏感层(FP16),False=可量化(INT8)"""# 1. 检测头回归分支# 2. 小通道1×1卷积# 3. SiLU 激活# 4. 残差ShortcutYOLO26想要在Jetson、RK3588、昇腾、嵌入式NPU上真正落地,FP16/INT8混合量化是唯一最优解
CANN生态下的ops-cv是专为图像处理、目标检测打造的NPU硬件优化算子库,核心实现计算机视觉网络在NPU上的高效加速计算,是CV模型落地Ascend NPU的核心底层组件。该仓库以C++为核心开发语言(占比78.74%),辅以CMake、Shell、Python完成工程构建与轻量调用,封装了CV任务全流程高频算子,针对NPU架构做并行计算优化,无需开发者手动适配硬件,大幅降低YOLO、Fas
通过本次重构,系统完成了从“静态检测工具”到“自进化智能终端”的架构升级。闭环验证:打通了从Detection->Feedback->Review->Training->的全链路。精度提升:实测表明,针对特定站点的环境干扰(如特定色温的灯光误报),通过采集 20-50 张样本并进行 50 Epoch 的加权微调,即可有效消除误报,且未显著降低原有召回率。后续计划引入模型版本控制功能,支持一键回滚至
AutoML模型训练与部署摘要 🚀 本文记录了在H2O AutoML平台上训练和部署机器学习模型的全过程。通过泰坦尼克号生存预测数据集,展示了从数据清洗到模型部署的完整流程。 关键步骤 数据准备:处理缺失值、异常值,进行特征工程 AutoML训练:自动化完成模型选择、调参和评估 模型解释:使用SHAP值分析特征重要性 云端部署:将模型部署为API服务 技术亮点 仅用5行核心代码完成模型训练 模型
《小目标检测的技术挑战与前沿进展》摘要 小目标检测是计算机视觉领域的关键挑战,其应用场景涵盖无人机巡检、医疗影像分析、自动驾驶等多个领域。核心难题包括特征湮灭(32倍下采样后目标信息丢失)、标注困境(极小目标标注困难)和评估偏差(传统指标易被大目标主导)。当前主流解决方案融合15项前沿技术:高分辨率输入与智能缩放、动态多尺度训练、增强型特征金字塔(如BiFPN)、轻量注意力机制等。2023-202
本文通过“环境配置→5行代码实操→代码拆解→效果优化→避坑指南→拓展实操”的流程,带新手快速上手YOLO26物体检测,核心亮点的是“零门槛、无冗余、有深度”——无需深厚的深度学习基础,无需复杂的参数调试,复制代码就能跑通效果,同时通过代码拆解和优化技巧,让新手不仅能“会用”,还能“懂原理”,真正实现“新手速成”。其实YOLO26的入门核心,就是“借助预训练模型,简化搭建流程”,新手不用一开始就纠结
算子库是 CANN 异构计算架构中专门针对计算机视觉(CV)任务设计的加速层。其核心价值在于实现图像预处理(如缩放、色彩转换)和复杂后处理(如 NMS、ROI Align)的,从而彻底消除 Host-Device 间的数据传输瓶颈,并利用硬件的并行特性加速高复杂度、高访存密度的图像操作。
这种模式利用了硬件的多执行单元特性,使得当前块的计算、下一块的数据载入以及前一块的结果写回能够重叠执行。在多核环境下,图引擎会根据算子依赖关系,通过智能调度算法,将计算任务均衡地分配到各个核心,避免出现计算瓶颈或核心空转,实现系统级的能效最大化。这种闭环机制确保了计算栈始终能跑在算法创新的最前沿,通过不断进化的算子集合,最大化释放硬件的计算潜能。在算子开发周期内,必须建立严苛的精度验证流程,通过与
在现代计算机视觉(CV)应用开发中,纯粹追求模型推理算力的时代已经过去。随着神经网络骨干(Backbone)性能的不断攀升,开发者逐渐发现整体系统的性能瓶颈已经转移到了看似简单的图像预处理和后处理环节。正是为解决这一痛点而生,它通过提供一系列高度优化的硬件加速算子,将原本堆滞在 CPU 端的繁琐任务彻底释放到专用的计算单元中。
作为底层通信基础库,巧妙地在 HCCL 集合通信库与底层硬件驱动之间建立了一层标准化的抽象逻辑。在异构环境下,保障计算单元与通信单元之间的数据一致性是巨大的技术挑战。承担了物理链路的重担,整个分布式计算架构表现出了极强的扩展性与前瞻性。在现代异构计算软件栈中,通信库的稳定性与高效性是衡量集群性能的基石。的管理下,每个逻辑编号(Rank)都对应着复杂的物理拓扑映射信息。通信效率的竞争,本质上是对内存
介绍了人体姿态估计、动作识别、时序动作检测和运动轨迹标注四大核心任务,详细阐述了17点关键点方案及其在足球、篮球、网球等运动中的应用。文章提供了专业的标注策略,包括关键点定位原则、可见性标注、运动模糊处理和多人场景处理方法。通过足球比赛分析、健身指导APP和游泳技术分析三个实战案例,展示了AI在体育领域的应用效果。此外,还介绍了TjMakeBot体育标注工具的功能特性,包括姿态标注、动作标注和运动
✅ Ultralytics8.0+PyTorch2.1环境搭建完成,基于Conda管理,无版本冲突,可正常训练与推理;✅ 机器人场景COCO子集整理完毕,共8000张(7000训+1000验),YOLO标准格式,可被Ultralytics正常识别;✅ YOLOv8n基础训练跑通,50轮训练收敛良好,无报错,数据集与模型兼容性验证通过;✅ 小障碍物mAP@0.5=0.68≥65%,达标;模型参数量、
目标检测
——目标检测
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net