logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

微软发布AutoGen开源框架,简化大语言模型工作流的编排、优化和自动化

来源:Allmetas  近日,据海外媒体报道,微软公司发布了开源Python库AutoGen。依据微软公司对AutoGen的描述,AutoGen是“一个简化大语言模型工作流编排、优化和自动化的框架。AutoGen背后的基本概念是“代理”(agents)的创建,即由大语言模型(如GPT-4)提供支持的编程模块。这些智能体(agents)通过自然语言信息相互作用,完成各种任务。  借助AutoGen

#microsoft#语言模型#自动化 +2
为什么现在很多人不看好商汤科技?

来源:知乎文章仅为学习交流,著作权归属作者,如有侵权请联系删文!https://www.zhihu.com/question/266047224/answer/1062578015匿名用户...

#算法#大数据#人工智能 +2
必看!大语言模型调研汇总!!

作者:guolipa @知乎 自从ChatGPT出现之后,各种大语言模型是彻底被解封了,每天见到的模型都能不重样,几乎分不清这些模型是哪个机构发布的、有什么功能特点、以及这些模型的关系。比如 GPT-3.0 和 GPT 3.5 就有一系列的模型版本和索引,还有羊驼、小羊驼、骆驼 ......动图封面于是浅浅的调研了一下比较有名的大语言模型,主要是想混个脸熟,整理完之后就感觉清晰多了,又可以轻...

#语言模型#深度学习#人工智能 +2
京东算法专家带你玩转深度学习!(文末赠书)

关注我们丨文末赠书在云集了大量技术爱好者的知乎,“深度学习如何入门?”这一问题对浏览量高达1045万。小异不得不感叹:深度学习真是一门极具前景却又容易使学习者产生挫败感的高难度学科!虽然问题下的回答可谓异彩纷呈,但是短则几百、长则上千字的回答难以覆盖到深度学习的方方面面,更别提在有限的篇幅内解决实际应用中的问题,技术爱好者仅靠这些碎片化的答案很难了解深度学习的全貌。对于初学者而言,更是需要有针对性

#深度学习#算法#人工智能 +2
重磅!淘天联合爱橙开源强化学习训练框架ROLL,高效支持十亿到千亿参数大模型训练

例如,在 RLVR pipeline 训练下,Qwen2.5-7B-Base 的整体准确率从 0.18 提升至 0.52(2.89 倍),Qwen3-30B-A3B-Base 准确率从 0.27 提升至 0.62(2.30 倍),这两个模型在 ROLL 的支持下均展现了稳定且一致的准确率提升,且未发生模型崩溃等异常现象,展现了 ROLL 极佳的稳健性和实用性。为了在生成阶段对每个提示词样本的生命周

LeCun怒斥Sora是世界模型,自回归LLM太简化了

来源:机器之心LeCun 对「世界模型」给出了最新定义。最近几天,Sora 成为了全世界关注的焦点。与之相关的一切,都被放大到极致。Sora 如此出圈,不仅在于它能输出高质量的视频,更在于 OpenAI 将其定义为一个「世界模拟器」(world simulators)。英伟达高级研究科学家 Jim Fan 甚至断言:「Sora 是一个数据驱动的物理引擎」,「是一个可学习的模拟器,或『世界模型』」。

#回归#数据挖掘#人工智能 +2
李飞飞和LeCun的世界模型之争

或许正是因为如此,在Marble自己的博客上,虽然屡屡提及「世界模型」与「导出高斯散射体、网格和视频」,但几乎完全没有提到机器人。所以,这类模型虽然没法像Marble那样生成精致的3D图像,看上去不那么「惊艳」,但它更像是在训练机器人的「大脑」。这难道不就是高斯Splat模型吗?Marble渲染「世界长什么样」,Genie 3展示「世界怎么变」,JEPA则探究「世界的结构是什么」。这类世界模型的任

1个GPU几分钟搞定强化学习训练,谷歌新引擎让深度学习提速1000倍丨开源

博雯 发自 凹非寺来源 |量子位QbitAI机器人要如何完成这样一个动作?我们一般会基于强化学习,在仿真环境中进行模拟训练。这时,如果在一台机器的CPU环境下进行模拟训练,那么需要几个...

#人工智能#java#深度学习 +2
Ilya观点得证!仅靠预测下一个token统一图像文本视频,智源发布原生多模态世界模型Emu3...

来源:量子位OpenAI前首席科学家、联合创始人Ilya Sutskever曾在多个场合表达观点:只要能够非常好的预测下一个token,就能帮助人类达到通用人工智能(AGI)。虽然,下一token预测已在大语言模型领域实现了ChatGPT等突破,但是在多模态模型中的适用性仍不明确。多模态任务仍然由扩散模型(如Stable Diffusion)和组合方法(如结合 CLIP视觉编码器和LLM)所主导。

通义千问Qwen1.5带来六种体量模型,性能超越GPT3.5

来源:机器之心超越 Claude、GPT-3.5,提升了多语言支持能力。赶在春节前,通义千问大模型(Qwen)的 1.5 版上线了。今天上午,新版本的消息引发了 AI 社区关注。新版大模型包括六个型号尺寸:0.5B、1.8B、4B、7B、14B 和 72B,其中最强版本的性能超越了 GPT 3.5、Mistral-Medium,包括 Base 模型和 Chat 模型,且有多语言支持。阿里通义千问团

#gpt-3#人工智能#深度学习
    共 412 条
  • 1
  • 2
  • 3
  • 42
  • 请选择