logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型到底是怎么训练出来的?万字长文讲透大模型训练全流程

如果把大模型比作一个人,预训练决定它“读过多少书”,后训练决定它“会不会按人类期望说话”,微调决定它“能不能胜任具体岗位”,推理决定它“真正工作时如何思考和输出”。

文章图片
#人工智能#深度学习#java +1
RAG 效果评估:Recall@K、MRR、NDCG、RAGAS 四大指标一次讲透

很多同学搭完 RAG 之后,评测方式是:自己问几个问题,回答大概靠谱,就觉得「没问题了」。然后上线,用户反馈「答非所问」,问题单一个接一个。复盘下来发现——不是模型不行,是检索一开始就没捞到对的文档。

文章图片
#java#数据库#前端 +2
AI 智能体7种新架构设计模式和代码级落地实现

一个大语言模型(LLM)调用的输出会依次成为下一个 LLM 调用的输入。这种模式将一个任务分解成一系列固定的步骤,每一步都由一个 LLM 调用来处理,它会处理前一个 LLM 调用的输出。这种模式适用于那些可以被清晰地分解成可预测的、按顺序排列的子任务的任务。

文章图片
#人工智能#数据库#前端 +4
Nature Medicine综述:AI药物研发最新进展

特性的有价值的工具。例如,拜耳的计算机模拟ADMET平台使用随机森林和支持向量机等机器学习技术,并使用环状扩展连接指纹等描述符,以确保准确性和相关性。过去几十年中,已经开发了用于ADMET预测的各种描述符。然而,这些基于特征的方法中涉及的特征工程仍然复杂,并限制了通用性和灵活性。深度学习现在推动着ADMET预测,从简单的输入数据中自动提取有意义的特征。

文章图片
#人工智能#学习#3d +2
大模型训练黑科技揭秘!ROLLART系统让智能体强化学习性能提升200%,小白也能轻松上手

ROLLART是阿里与港科大联合开发的分布式系统,专为解决多任务智能体强化学习训练中的资源异构性问题。系统通过硬件亲和性任务调度、轨迹级异步执行和状态感知计算三大核心设计,在3000+GPU集群中实现1.35-2.05倍训练加速,支持数百亿参数MoE模型训练。代码已开源,为AI开发者提供高效的大模型训练解决方案。

文章图片
#科技#人工智能#自然语言处理 +3
拆解 Agent Loop 的核心逻辑与 Harness 工程架构演进

在探讨 Agent 架构前,我们必须直面一个在机制上看似反常识的事实:LLM 本身是绝对无状态的(Stateless)。

文章图片
#架构#人工智能#算法 +2
做机器人agent,比做纯数字agent到底难在哪里?

对人类来说,这大概是个几分钟随手就能完成的简单任务。但对机器人系统而言,短短一句话,需要系统先确定目标区域和检查对象,组织导航、感知和动作执行;过程中则需要持续接收障碍、光线、图像质量、电量、网络状态等反馈;任务结束后,还要形成图片、告警或任务记录并返回给用户。

文章图片
#机器人#人工智能#java +1
做机器人agent,比做纯数字agent到底难在哪里?

对人类来说,这大概是个几分钟随手就能完成的简单任务。但对机器人系统而言,短短一句话,需要系统先确定目标区域和检查对象,组织导航、感知和动作执行;过程中则需要持续接收障碍、光线、图像质量、电量、网络状态等反馈;任务结束后,还要形成图片、告警或任务记录并返回给用户。

文章图片
#机器人#人工智能#java +1
让Agent“记得对、做得准、跑得快”:Context Engineering实战

最近看了一个非常不错的 关于 Context Engineering 的分享,里面综合讨论了 Anthropic,Cognition,Manus,Chroma,LangChain 等公司在这个领域方面的最新思考和实践,有点像当年分享过的 Applied LLMs[2],非常值得一看。

文章图片
#人工智能#计算机视觉#深度学习 +2
让Agent“记得对、做得准、跑得快”:Context Engineering实战

最近看了一个非常不错的 关于 Context Engineering 的分享,里面综合讨论了 Anthropic,Cognition,Manus,Chroma,LangChain 等公司在这个领域方面的最新思考和实践,有点像当年分享过的 Applied LLMs[2],非常值得一看。

文章图片
#人工智能#计算机视觉#深度学习 +2
    共 1426 条
  • 1
  • 2
  • 3
  • 143
  • 请选择