logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

超越Transformers!谷歌发布「深度学习架构设计」通用框架Miras|今日热门论文

他们进一步开发了多 agent 框架 LearnAct,其能够自动从演示中提取知识,从而提高任务完成度,集成了三个专业 agent:用于知识提取的 DemoParser、用于相关知识检索的 KnowSeeker 和用于演示增强任务执行的 ActExecutor。实验结果表明,在离线和在线评估中,模型性能都有显著提高。通过实证分析,来自香港科技大学和蚂蚁集团的研究团队揭示了 LRM 行为的一个重要特

#深度学习#人工智能
ICLR 2025 杰出论文 | 模型编辑:必要性、短板与破局法

模型编辑是一个高效更新大模型内部所存储知识(如错误、过时和不安全知识)的技术。与微调相比,它的主要优势有两个:1.可以定向更新任意数量的知识(可少至几条),而不用担心过拟合、灾难性遗忘等问题。2.几乎是无需训练(Training Free)的,实时性强。一个很直观的问题是,在这个微调技术茁壮成长、层出不穷的时代,为什么我们需要模型编辑?上述俩个优势,到底会给它带来怎样的应用空间呢?叶问外传》中有一

#人工智能#深度学习#机器学习
物理AI大时代,一场“视觉数据争夺赛”将上演

大摩认为,正如聊天机器人需要文本数据来训练大语言模型(LLM)一样,物理机器人需要数据来训练其视觉-语言-动作模型(VLA),预计随着算力规模不断扩展且效率提升,AI公司需要大量的视觉数据来创建物理世界的“数字孪生”,视觉数据将成为AI巨头们的竞争焦点。这意味着,当AI技术成熟后,视觉数据将成为极其宝贵的资源。大摩预计,随着算力规模不断扩展且效率提升,AI公司需要大量的视觉数据来创建物理世界的“数

文章图片
#人工智能#机器学习
基本使用 乐聚机器人 科研版

里面有一个基本的说明,在这个站立的示例程序里面用户可以尝试修改机器人躯干的 Yaw , Pictch 角来观察机器人的变化,可以修改执行距离地面的高度来调整机器人的站立高度。2.5 机器人站立之后,按下 r 键,机器人会进入基于速度的步态模式,进入步态之后默认各个方向速度为 0, 使用 a(左)d (右) w(前) d(后) 来改变在 x,y 轴上的速度,来控制机器人前后左右移动。2.7 结束调试

文章图片
#机器人
LaVague:利用 AI 轻松实现任何基于 Web 的任务自动化!( 网页 + Agent框架)

原创 Aitrainee2024年07月19日 07:43湖南Aitrainee | 公众号:AI进修生🌟用于开发 AI Web 代理的大型行动模型框架。Hi,这里是Aitrainee,欢迎阅读本期新文章。,这是一个用于开发AI网页应用的框架,它现在有了一些很酷的新更新,比如可以构建一个能够根据你的简历PNG自动申请工作的代理,这太疯狂了。以前它只能做一些简单的任务,但现在似乎变得更好了,不仅能

#人工智能
分布式训练工具torchrun、accelerate、deepspeed、Megatron

torchrun:适合需要快速上手和简单配置的用户,适用于小规模分布式训练。accelerate:适合使用 Hugging Face 生态系统的用户,尤其是在 NLP 任务中,提供了较为便捷的分布式训练接口。deepspeed:适合对性能和规模有更高要求的用户,提供了丰富的优化功能,适用于大规模模型训练。不同工具的选择取决于具体的需求、模型规模、硬件环境以及用户对配置和优化的熟悉程度。Poe好的,

文章图片
#分布式
解耦视觉编码以实现统一的多模态理解和生成

本文提出了Janus框架,通过解耦视觉编码路径来提升多模态理解与生成性能,并超越现有统一模型。论文题目: Janus: Decoupling Visual Encoding for Unified Multimodal Understanding and Generation论文链接: https://arxiv.org/abs/2410.10486PS: 欢迎大家扫码关注公众号^_^,我们一起在

文章图片
#人工智能
2024全球机器学习技术大会 | aiXcoder分享代码大模型实践经验,提升代码生成质量

这就需要根据企业提供的不同程度数据(代码、业务文档、需求文档、设计文档、测试文档等),并充分考虑行业业务术语与流程规范、行业技术标准与规范、企业技术栈、编程框架等领域知识,在提升代码生成质量的过程中,为了获取更多的上下文信息,RAG是必不可少的预处理工程工具,可以显著降低模型生成幻觉。,去除语句嵌套过深、不良命名规范、资源泄露、数组越界等代码缺陷,确保代码的可维护性、可靠性和安全性。,去除不完整的

文章图片
#机器学习#人工智能
Gemini Exp 1114:有史以来最好的大模型!击败 o1-Preview + Claude 3.5 Sonnet!

不过 Gemini-exp-1114在被问到是谁创造和自己是谁时,竟然回答Anthropic 和 Claude。网友戏称,最让人感到直观的解释就是使用Claude生成的数据训练的。可惜代码能力逊色了一点,从图中我们可以看到与 o1-mini/preview 还是有一定差距的。目前,Gemini-Exp-1114 可以在谷歌AI Studio 对话体验。图中有多少水果,哪一种最小,哪一种酸性最强,它

文章图片
#人工智能
伯克利罗剑岚:机器人的范式革命,藏在真实世界中丨具身先锋十人谈

系统的核心部分有它的既得利益,没有足够的动力去颠覆自己的利益来创新,而在系统边缘,一个好的想法被尝试,然后经历失败再不断的尝试,不确定性会变低,成功的概率就会变大,如果它足够重要,就会产生颠覆性的创新。今天的波音客机就是根据此原则来设计控制器的,它能对油量的变化造成的飞机重量变化,高空中气流的变化等等都保持有效,这也是民航客机能够安全运行,我们放心坐上去的保证,所以基于模型的控制是十分有效的,只不

文章图片
#人工智能
    共 40 条
  • 1
  • 2
  • 3
  • 4
  • 请选择