logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

生成式AI不只是“聊天画画”,揭秘其与传统AI的本质区别与颠覆性应用

生成式AI与传统判别式AI的核心区别在于:前者学习数据分布以创造新内容(如GPT生成文本、Midjourney作画),后者专注于条件概率判断(如垃圾邮件分类)。生成式AI能重塑推荐系统,将其转化为序列生成任务,突破传统推荐的数据稀疏性和信息茧房局限。这种"创造"能力也为AI应用开辟了新方向,从艺术创作到动态意图理解,展现出颠覆性潜力。

文章图片
#人工智能
Transformer图解

要知道具体的指代,我们需要在理解it的时候同时关注所有的单词,重点是animal、street和tired,然后根据知识(常识)我们知道只有animal才能tired,而street是不能tired的。对于输入的每一个向量(第一层是词的Embedding,其它层是前一层的输出),我们首先需要生成3个新的向量Q、K和V,分别代表查询(Query)向量、Key向量和Value向量。首先把模型看成一个黑

文章图片
#transformer#深度学习#人工智能
探索提示工程 Prompt Engineering的奥妙

AGI是一种能够理解、学习和执行任何人类可以完成的任务的智能。提示工程主要应用于专用人工智能,通过设计和优化提示词,提高人工智能系统的性能和准确性。有效的提示词能够引导AI生成高质量、相关性强的输出。提示词的设计和优化是提示工程的核心。提示工程(Prompt Engineering)是设计和优化提示词以获取理想输出的过程。它涉及理解AI模型的行为和限制,构建精确、明确和上下文相关的提示词。提示工程

文章图片
LoHoVLA技术:让机器人像人类一样思考与行动的统一框架

LoHoVLA:统一长期具身任务的视觉-语言-动作模型 针对机器人执行复杂长期任务时面临的规划与控制脱节问题,复旦、上科大和上海交大团队提出LoHoVLA模型。该创新框架通过共享视觉语言模型表示空间,实现任务分解与动作控制的统一决策,并引入分层闭环机制应对执行误差。实验表明,LoHoVLA在构建的LoHoSet数据集上显著优于传统方法,为机器人的高效任务执行提供新思路。

文章图片
#机器人
【训练优化】显存占满,利用率却惨不忍睹?一文带你打通大模型训练的任督二脉

大模型训练中常见显存占满但GPU利用率低的问题,根源在于数据供给管道存在瓶颈。本文指出三大关键瓶颈:I/O读取速度慢、CPU预处理能力不足以及频繁的小任务分发开销,并提出四步优化方案:使用性能分析工具定位瓶颈、优化数据加载参数(调整num_workers和pin_memory)、改进预处理流程、减少任务碎片化。通过系统性地诊断和优化,可显著提升GPU利用率,实现高效的大模型训练。

文章图片
#人工智能#深度学习#算法
ROS实现无人驾驶控制算法(一)——pure pursuit

轨迹跟踪主要分为两类:基于几何追踪的方法和基于模型预测的方法。而pure pursuit算法就是最基本的基于几何的控制算法,因其鲁棒性高,对路径的要求低而广泛使用,也为后续的standly、LQR、MPC算法打好基础。因为纯追踪算法是基于几何模型的,因此,需要推导出车辆的运动学模型,本文采用的是阿克曼模型(差速模型也会提及)。对于阿克曼转向模型来说,只需要驱动电机控制线速度,以及前轮舵机转角控制转

文章图片
#机器人
AI时代已来,机器人时代还会远吗?

DeepSeek-R1的崛起引发全球AI界关注,其成功并非偶然。DeepSeek-v2作为2024年发布的开源大模型,凭借MOE(混合专家)架构和MLA技术实现高性价比。MOE通过拆分Dense模型为多个专家模型,显著降低激活参数和成本,但面临负载均衡挑战。DeepSeek因前瞻性和硬件资源限制,成功优化MOE方案,使其在性能和价格上超越同类模型。这一创新为AI社区提供了高效可用的技术路径。

文章图片
#人工智能
【机器学习】使用VGG16与K-Means对大量图片进行自动分类

VGG16是由牛津大学Visual Geometry Group(VGG)提出的一种深度卷积神经网络(CNN)模型。它在2014年的ImageNet大规模视觉识别挑战赛(ILSVRC)中表现出色,因其简单而有效的架构而广受欢迎。VGG16的名字来源于其包含16个带权重的层(13个卷积层和3个全连接层)。VGG16结构简介:输入层:224×224像素的RGB图像。卷积块:包含13个卷积层和5个最大池

文章图片
#机器学习#kmeans#分类
NVIDIA Isaac GR00T N1 - 世界首个通用人形机器人基础模型实战

NVIDIA Isaac GR00T N1是全球首个用于通用人形机器人推理和技能的开源基础模型。这种跨实体模型可以接收多模态输入,包括语言和图像,以在各种环境中执行操作任务。GR00T的名称源自"Generalized Robot Operations and Telemetry",代表着其通用化的操作能力和遥测数据处理能力。

文章图片
#机器人
自然语言控制机械臂:ChatGPT与机器人技术的融合创新(上)

pymycobot 提供了大量的机械臂的控制接口,例如关节控制,坐标控制,配套的机械臂的夹爪控制等等,对机械臂变成的初学者是相当有好的。该项目一共分为上下两篇,本篇文章主要内容是整个人工智能系统的设计和构建的过程,未来的下一篇文章将要介绍在开发项目的过程中遇到的而困难,如何解决,以及该项目有什么扩展的性的功能。想象如果有有一天,你命令一个机械臂“帮我收拾一下桌面,将垃圾丢到垃圾桶里”,机械臂就开始

文章图片
#机器人
    共 54 条
  • 1
  • 2
  • 3
  • 6
  • 请选择