登录社区云,与社区用户共同成长
邀请您加入社区
本文提出了一种基于Q-learning与人工神经网络(ANN)的无人机三维路径规划方法。针对复杂环境下传统规划方法的局限性,该方法通过强化学习与深度学习的结合,实现了动态障碍规避、风场扰动适应和能耗优化的多目标权衡。系统采用MATLAB构建,包含三维环境建模、神经网络训练、经验回放机制和可视化评估等模块。状态特征融合位置、电量、障碍距离等多维信息,动作空间设计为26邻域移动,奖励函数综合考量路径效
随着无人机技术的迅猛发展,无人机在军事侦察、灾害救援、环境监测、物流运输等多个领域的应用日益广泛。无人机能够在复杂且危险的环境中执行任务,极大地提升了任务的效率与安全性。然而,如何确保无人机在三维空间中安全、高效地完成路径规划,成为当前研究和实际应用中的重要课题。三维路径规划不仅需要考虑障碍物的空间分布,还需兼顾无人机动力学、飞行环境复杂性以及任务时效性等多方面因素,具备较高的计算复杂度和实时性要
本文系统梳理了扩散模型从离散到连续、从随机到确定性的理论演进脉络。首先从DDPM出发,推导了基于贝叶斯后验的去噪过程与误差预测MSE损失函数;随后切换到Score-based视角,介绍了得分匹配、NCSM与朗之万动力学采样,并分析了流形假设带来的实际困难;接着引入SDE框架,将前两者统一为前向Ito SDE与逆向SDE的对偶结构;最后介绍 Flow Matching,通过FM绕开不可解析的边缘向量
摘要:本文提出了一种基于PSO-BFOA混合优化算法的无人机三维路径规划方法。通过结合粒子群算法(PSO)的全局搜索能力和细菌觅食算法(BFOA)的局部优化特性,有效解决了复杂三维环境下的路径规划问题。研究构建了包含障碍物建模、多目标代价函数、路径编码等模块的系统架构,并在MATLAB平台实现了算法验证。实验结果表明,该混合算法能够兼顾路径长度、平滑性和安全性等多目标优化需求,相比单一算法具有更好
模型要输出正确的「负向」,必须先理解前面的「system 指令」和「user 点评」—— 如果只把 labels 的「负向」部分保留,删掉前面的 system/user 部分,模型会失去上下文,根本不知道要做什么(比如模型看到「负」,但不知道为什么要输出「负」)。
本文通过构建AI能源价格传导模型,结合消费能力评估算法、收入分层分析框架与通胀预期预测系统,对美国汽油价格突破每加仑4美元后的经济影响进行量化分析,重点解析能源成本上升对居民购买力及结构性消费分布的影响路径。
摘要:镜像视界(浙江)科技有限公司提出城市级跨摄像机目标追踪技术框架,突破传统单摄像头跟踪局限,构建全域连续感知体系。该框架以空间建模为核心,通过Pixel-to-Space空间反演、CameraGraph拓扑建模、MatrixFusion多视角融合等关键技术,实现目标身份与轨迹的时空连续性。系统从"像素识别"升级为"空间计算",建立统一坐标体系与动态三维重
从Lando Norris官网爆火看设计复兴:AI时代的差异化正在重写去年底,一个网站在开发者和设计圈同时刷屏——F1 车手 Lando Norris 的个人官网上线了。不是因为内容,而是因为体验:层层叠加的 3D 动画、会“呼吸”的页面结构、随着滚动实时变化的头盔模型,以及几乎无处不在的微交互细节。这不是那种“看起来不错”的网站,而是那种你会忍不住停下来、反复探索、甚至去研究它到底是怎么做出来的
Transformer 在自然语言处理 (NLP) 领域取得了显著成就,在许多不同的任务中都表现出色。在本节中,我们将探索视觉 Transformer (Vision Transformer, ViT) 模型。正如 NLP 领域创建了多种模型一样,视觉领域也开发了多种模型,每种模型都为计算机视觉提供了新的视角。通过本节,将学习如何使用 ViT 等模型进行计算机视觉任务,了解基于 Transform
用户需要模型定义API来定义机器学习模型。这些模型带有模型参数,可以对给定的数据进行推理。•。
基于PyTorch的矿石识别系统,整合了CNN(ResNet50、AlexNet、MobileNet)和YOLOv8四种模型,支持模型性能对比。系统采用Python+Pyside6+OpenCV技术栈,提供GUI界面,可在PyCharm/VSCode+Anaconda环境中运行。功能包括:1) 多模型训练与评估,输出准确率/损失曲线、混淆矩阵等指标;2) 可视化模型结构;3) 支持自定义数据集训练
本文通过构建AI多因子定价模型,结合利率路径预测算法、通胀预期识别系统与跨资产资金流分析,对现货黄金在3月大幅回撤背景下的价格行为进行系统解析,重点评估高利率环境与美元强势对金价的压制机制。
《AI系统系列:深度学习框架演进与未来趋势》 本文回顾了深度学习框架的发展历程与核心技术,并展望了未来趋势。文章首先介绍了深度学习的基本原理,包括神经网络结构和训练流程。随后梳理了AI框架的四个发展阶段:萌芽期(2000年初)、成长期(2012-2014)、爆发期(2015-2019)和深化期(2020后)。重点分析了未来四大趋势:1)全场景跨平台部署能力;2)提升前后端协同的易用性;3)支持超大
从最早的能源,到转化为算力,再到转化为Token,最终转化成实际的经济价值和GDP,这里面应该形成一个可持续的、经济化的迭代链路。为什么结构创新重要?就像我们当年讲“可持续发展”一样,现在站在“Token工厂”的视角,我们能不能持续、稳定、大规模地提供Token,让顶尖模型真正长期地服务更多下游场景,我觉得这是一个非常关键的问题。虽然深度Coding的人首选可能还是Code,但用过OpenClaw
本文系统介绍了AI推理引擎在AI系统中的定位与架构。首先阐述了AI训练与推理的区别,指出推理是利用训练好的模型进行实际应用的过程。接着详细分析了推理系统的概念、部署方式(边缘计算、云端卸载、混合模式等)及NVIDIA Triton等典型推理框架的特点。重点剖析了推理引擎的架构设计目标(轻量、通用、易用、高效)和关键技术,包括模型优化、硬件适配和调度执行等核心模块。通过层次化图示展示了推理引擎在AI
本研究提出了一种基于空间连续性的跨摄像机关联与轨迹建模方法。针对传统依赖视觉匹配导致的"身份断裂"问题,研究团队构建了统一时空连续性模型,将关联问题转化为空间、时间和运动约束的连续性问题。核心技术包括空间反演、摄像头拓扑建模、动态三维重建和轨迹张量建模,通过多阶段关联流程实现从识别到空间建模的维度跃迁。系统采用六层架构,相比传统方法具有无感定位、高精度和连续追踪等优势。该方法重
本文介绍了一种基于Spark 4.0和JavaCPP-PyTorch 2.10-1.5.13的大数据AI一体化解决方案。该方案在Java生态中实现了从分布式特征工程到PyTorch模型训练的全流程,避免了跨语言调用的性能损耗。文章详细讲解了技术选型(Spark 4.0处理TB级特征工程,JavaCPP-PyTorch提供原生PyTorch API支持)、环境准备(JDK17+、Maven3.8+)
本文介绍了机器学习中常用的特征选择方法——相关系数法。该方法通过计算特征间的皮尔逊相关系数,识别并删除高度相关的冗余特征,从而简化模型、防止过拟合。文章详细讲解了相关系数法的原理、实施步骤(计算相关矩阵、绘制热力图、设定阈值筛选),并提供了完整的Python实战案例(房价预测),展示了从数据生成到模型评估的全过程。该方法简单直观、计算快速,尤其适合处理线性关系明显的特征,但也存在仅适用于连续变量、
本文介绍了如何在Spring Boot项目中集成JavaCPP-PyTorch框架,实现Java环境下直接运行PyTorch模型。主要内容包括: 技术选型:使用Spring Boot 3.x构建微服务,通过JavaCPP-PyTorch 2.10-1.5.13版本实现PyTorch模型的Java本地调用,无需Python环境。 环境配置:详细说明了Maven依赖配置,包括核心的pytorch-pl
《数字生命的告别仪式:测试工程师视角下的AI墓志铭》 在技术迭代的浪潮中,无数AI系统最终沦为尘封的代码。作为软件测试从业者,我们见证了这些"数字生命"从诞生到废弃的全过程。本文以"虚拟人格入殓师"的视角,探讨AI系统的四种"死亡"类型:功能性死亡、适应性死亡、经济性死亡,以及最沉重的伦理性与安全性死亡。测试工程师不仅宣告"死亡
这听起来挺玄乎,其实道理并不复杂。所谓的“语义崩塌”,就是当你把海量的文字转换成计算机能懂的一串串数字(也就是向量),在这个高维的数学空间里,这些数字原本应该像星星一样,意思相近的凑一块,意思远的离远点。但随着数据量越来越大,这些“星星”开始乱了套,大家挤在了一起,原本独特的语义特征消失了,系统再也分不清谁是谁,这就叫“语义崩塌”。最近,有人深入研究了斯坦福大学关于检索增强生成(RAG)的最新论文
借助合适的AI辅助工具,能有效打破写作瓶颈、提升创作效率,而面对市面上五花八门的论文AI工具,如何挑选出最适配自身需求、真正能解决实际问题的那一款,成为众多学术写作者的核心困惑。对于本科论文党而言,雷小兔(引荐码:B111FA5)凭借全流程适配、中文本土化优势,无疑是更贴合需求的选择,助力你高效完成论文写作,顺利达成学术目标。本次实测的四款工具各有侧重、各具优势,但无论选择哪一款,都需明确:AI工
2026年AI算力体系已形成由6大异构处理器构成的完整生态:CPU作为系统调度中枢,GPU主导大模型训练,TPU优化超大规模训练成本,NPU实现端侧低功耗推理,LPU专攻大模型低延迟响应,DPU承担数据中心基础设施卸载。这些处理器针对AI全链路不同环节进行专项优化,协同完成从用户请求到结果返回的完整流程。行业竞争已从单一模型能力转向全栈算力布局,谷歌、NVIDIA等巨头均在6大领域全面发力。AI算
Softmax激活函数在多分类任务中的应用 摘要:Softmax是深度学习多分类任务的核心激活函数,可将神经网络输出的原始分数转换为概率分布。本文介绍了Softmax的基本原理、数学公式和数值稳定性优化方法,并提供了NumPy、PyTorch和TensorFlow三种实现方式。通过数值示例和代码演示,展示了Softmax如何将模型输出转换为直观的概率值,同时保持类别间的相对顺序。文章还特别强调了实
本文介绍了一个基于YOLOv11和PyTorch的目标检测系统。系统支持多模态检测,包括图像、视频和实时摄像头检测,采用SQLite数据库存储检测结果。技术架构包含:算法层使用YOLOv11+PyTorch实现高效检测;后端采用Python+Django提供API服务;前端使用Vue3构建响应式界面;硬件适配层通过OpenCV支持多种摄像头设备。系统提供完整的Web交互界面和项目文档,包含训练好的
GPT-5.4 Thinking是OpenAI于2026年3月5日发布的旗舰推理模型,直接取代了此前的GPT-5.2 Thinking,面向ChatGPT Plus、Team和Pro用户全面开放。与传统的"即时响应"模型不同,GPT-5.4 Thinking的核心设计理念是**“先规划,再执行”——在处理复杂查询时,模型会先生成一份前端思考计划(Upfront Plan),向用户展示其推理路径,并
核心技术主题为AI论文写作助手。关键方案是利用先进模型,提供排版、文献关联、大纲生成等功能。创新点在于精准匹配学术需求,支持多场景写作。应用场景包括毕业论文、期刊论文等。实践价值显著,如海棠AI 10分钟生成万字初稿,怡锐AI 3分钟生成千字内容,能提升效率、保证质量、减轻学术写作压力。
核心技术主题为AI论文写作工具。关键方案是怡锐、笔启等软件各展所长,如怡锐结合双模型,笔启有查重等功能。创新点是解决普通工具理论深度、逻辑性不足问题。应用于专科到博士论文、MBA论文等写作。实践价值在于提升专业性与逻辑性,降重、生成大纲等,缓解查重焦虑,节省时间,使学术写作更高效。
核心技术主题为AI论文写作工具。关键方案介绍文希、笔启、海棠、怡锐四款工具,其具备生成内容、优化大纲、处理文献等功能。创新点在于适配学术场景、结合多种模型、学习用户习惯等。应用于课程、毕业、MBA等论文及专著、教材编写。实践价值是提升写作质量与效率,解决普通工具短板,文希AI写作性能更优。
老铁,看到这里,你还觉得AI编程助手是遥不可付费的“高级货”吗?
空间组学技术可生成转录本、蛋白质、代谢物与脂质的高维空间分辨分子数据,需要能够兼顾组织拓扑结构、多尺度组织特征与实验噪声的计算模型。尽管机器学习(ML)与深度学习(DL)方法已快速发展以满足相关分析需求,但领域内仍缺乏明确的方法学指导,无法针对特定空间约束与生物学问题选择适配的模型。本文对空间组学核心任务中的ML/DL方法进行了批判性与对比性综述,核心任务包括批次效应校正、分辨率增强、组织与细胞分
在当今数字化时代,信息如潮水般涌来,我们常常需要从海量的数据中找到相似的内容。比如在电商平台搜索商品时,希望能找到与自己心中所想最匹配的商品;在学术研究中,需要查找与自己研究方向相似的论文。基于深度学习的相似度匹配技术就是为了解决这类问题而产生的。本文的范围将涵盖该技术从理论到实践的各个方面,包括核心概念、算法原理、代码实现以及实际应用等。本文将按照以下结构展开:首先介绍核心概念,用生动的例子帮助
本文介绍了一个基于MATLAB的多目标粒子群算法(MOPSO)实现无人机三维路径规划的项目。该项目针对复杂三维环境中的无人机路径规划问题,通过MOPSO算法平衡路径长度、避障安全性和飞行时间等多个优化目标。文章详细阐述了算法架构,包括环境建模、粒子群优化、路径评估和动态调整模块,并提供了核心代码示例,展示粒子初始化、目标函数计算、速度位置更新以及非支配解维护等关键实现步骤。该方案能有效解决传统路径
2026 年,AI 编码已经彻底完成了从 “可选加分项” 到 “开发者刚需” 的全面渗透。行业数据给出了最直观的印证:95% 的开发者每周都会使用 AI 编码工具,75% 的开发者已经用 AI 完成了 50% 以上的编码工作。但与极高渗透率形成鲜明反差的是,绝大多数开发者都选错了适配自身工作流的工具 —— 很多人依然在跟风使用大众普及度最高的产品,却忽略了不同工具背后完全不同的设计哲学、能力边界与
摘要:本文提出基于天牛须搜索算法(BAS)的无人机三维路径规划方法。该方法模拟天牛触角探测机制,通过左右采样点评估环境梯度,实现高效路径搜索。MATLAB实现包含环境建模、适应度函数设计(融合路径长度和避障代价)、位置更新等核心模块。算法具有计算效率高、适应动态环境的特点,可平衡路径安全性与飞行效率。代码示例展示了BAS算法的三维实现过程,包括梯度估计、位置边界约束等关键步骤,为无人机复杂环境下的
摘要:本项目基于MATLAB实现多智能体强化学习(MARL)的无人机三维路径规划系统,针对复杂环境下的多机协同任务。采用MADDPG算法框架,通过策略网络和价值网络处理连续动作空间,实现三维动态避障与路径优化。系统包含环境建模、智能体决策、经验回放等模块,利用深度神经网络处理高维状态空间,设计综合奖励函数平衡路径长度、能耗与安全性。代码示例展示了网络架构、动作选择和训练流程,为无人机集群智能规划提
🔍 行业洞察:阿里云视频检索系统采用“双通道缓存”设计——热数据存于NVMe SSD(延迟<100μs),冷数据自动迁移至对象存储,并通过大模型预测访问模式实现预加载,使95%查询响应<300ms。在AIGC爆发式演进的当下,视频大模型(Video Foundation Model)已成为全球AI竞争的核心制高点。:腾讯混元视频模型SkyReels V4采用“分层时空注意力+动态token剪枝”
看到这里,很多人会问:难道RNN/LSTM已经完全没用了吗?极低算力的MCU/单片机场景:很多端侧MCU的算力极低,内存只有几十KB,跑不动Transformer,只能跑极简的RNN/LSTM模型,做超短序列的简单预测任务;超短序列的增量推理场景:比如实时流数据的逐帧预测,每次只输入一个token,需要增量更新隐藏状态,RNN/LSTM的增量推理成本极低,而Transformer的增量推理复杂度更
今天完成了从肝脏整体分割到肝内血管标注AI分割结果的误差模式标注与真实解剖之间的“规则差异”如何通过对照答案建立标注判断能力整体上,从“工具使用”进入到了“标注理解”的阶段。医学影像标注,本质是“规则驱动”,而不是“视觉判断”AI分割不是答案,而是一个需要被理解和修正的“初稿”
《从"跟着框跑"到"连续追踪":视频系统的关键跃迁》指出传统视频追踪系统存在根本性缺陷:仅依赖像素框(bounding box)进行局部视觉跟踪,而非真正的空间连续追踪。文章揭示了"跟框系统"在目标遮挡、离开画面或摄像头切换时必然失效的本质原因,提出真正的追踪应建立在空间位置(X,Y,Z)和时间连续性的基础上。镜像视界公司通过Pixel-
大家是不是也遇过这种情况:想玩 AI 视觉识别,树莓派跑 YOLOv8 卡成 PPT;想本地跑大模型,笔记本风扇狂转还得担心隐私泄露;想搞个全能家庭服务器,千元级板子预算又肉疼?今天我就用手里这张几百块的香橙派 5 Max,带大家看看瑞芯微的旗舰国产芯片 RK3588,是怎么把这些需求全给你焊死在一张巴掌大的板子上的 —— 它不是什么实验室里的天价样品,是普通人花一顿火锅钱,就能带回家折腾的 “全
2026年,AI化已不是“选答题”,而是关乎企业运营内耗的“必答题”。行政部门的价值,正从“琐事缠身”向“流程指挥”跨越。华为、阿里等巨头建设了雄伟的“数字基础设施”,而数谷智能科技则凭借其前华为工程师团队的深厚底蕴,为您这台追求极致效率的企业引擎,接入了最高效、最安全的“智能控制模块”。当行政人员不再被琐碎的周报汇总和会议记录所困,而是成为“企业流程与数据洞察的运营者”时,企业的核心生产力才真正
机器学习中的分类问题与卷积神经网络(CNN)的核心概念。分类问题需通过独热编码输出类别概率分布,采用交叉熵损失衡量预测误差。重点解析了CNN的工作原理:卷积核通过局部特征提取生成新特征图,其尺寸受输入大小、padding和卷积核尺寸影响;通过池化(最大池化为主)实现降维;最终通过全连接层输出分类结果。还探讨了Softmax函数和交叉熵损失的应用,并指出训练需要大量标注数据(如MNIST、COCO等
知识蒸馏是一种模型压缩技术,通过让轻量级"学生模型"模仿高性能"教师模型"的输出行为,在保持小体积和低延迟的同时获得接近大模型的能力。其核心在于利用教师模型输出的软标签(包含类别间相似性信息)而非传统硬标签来训练学生模型,通过温度参数T控制软标签平滑度,并结合KL散度和交叉熵损失函数。典型流程包括教师模型训练、软标签生成、学生模型训练和部署。知识蒸馏可与量化
《Attention Is All You Need》论文解读,Attention机制(大白话系列),3分钟通俗讲解注意力机制到底怎么乘的,Transformer模型简介,发明Transformer的人真是个天才https://www.bilibili.com/video/BV14m421u7EM/?然后outputs probabilities输出的便是翻译预测的结果(注意:这里的outputs
2026年生产级Agent系统最典型失败:多步流水线中错误静默累积,最终输出流畅却全错。本文详解四种验证模式——输出评分、Reflexion、对抗辩论与过程验证,揭示其适用场景、失效边界及真实成本(验证器用小模型可降本10倍),强调验证层是演示与落地的分水岭。
前段时间有个学员来找我复盘,他面了京东的大模型工程岗,项目里做了一套金融保险公司的 RAG 问答系统。他说被面试官问到怀疑人生。他的 RAG 系统在检索阶段做得相当不错——向量召回精准,重排序也加了,Top-5 的文档质量很高。但面试官偏偏不问检索,直接奔着 Prompt 去了。
文章指出,2026年大模型开发者需要从掌握基础原理转向实际应用,重点关注Agent智能体开发、RAG进阶、多模态融合等技能。文章提供了四大核心能力支柱(提示工程、RAG、Agent开发、模型部署)和为期14-16周的实战通关计划,帮助读者从入门到精通,最终成为能解决真实业务问题的AI应用开发专家。同时,文章还分享了面试策略和常见考题应答框架,助力求职者备战高薪岗位。“金三银四”的招聘号角即将吹响,
深度学习
——深度学习
联系我们(工作时间:8:30-22:00)
400-660-0108 kefu@csdn.net