logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

告别残差连接:DeepSeek mHC架构如何重塑大模型信息流动方式!

DeepSeek提出mHC架构创新,挑战了深度学习领域沿袭十年的残差连接设计假设。通过引入数学约束,mHC成功解决了多条信息流在交互时产生的不稳定性问题,使模型内部信息流动能力提升400%,同时保持了训练稳定性。这项研究证明,AI扩展不只依靠"向外堆叠"参数和数据,还可通过"向内拓展"优化信息流动方式,为算力受限场景提供了更高效的解决方案。

文章图片
#架构#人工智能#自然语言处理 +2
【干货分享】从0~1搭建Agent全流程,看完你的Agent就牛了!存一下吧!

摘要: 2026年迎来Agent元年,AI智能体正从被动工具进化为自主协作的"数字员工"。本文提供从0到1搭建Agent的完整教程,包含清晰拆解的步骤,适合新手快速上手。教程涵盖理论到实践的全流程,并附赠大模型学习资料包。读者可免费领取全套资源,助力掌握Agent开发技能。 (字数:98字)

文章图片
#人工智能
2026年AI Agent技术变革深度解析:揭秘其背后的关键技术突破与学习路径!

2025年AI Agent爆发源于技术变革与市场环境双重驱动。技术层面:大模型军备竞赛升级、推理能力普及、MCP与A2A协议统一通信、RFT技术实现Agent自主成长;市场层面:用户接受度跨越"鸿沟",开源生态推动AI能力整体跃升。这些因素共同推动Agent从概念走向实用,预示AI进入"实用化新阶段",为程序员提供学习与发展的新机遇。

文章图片
#人工智能#自然语言处理#架构 +2
入门大模型:一文搞懂LLM、RAG、AI Agent三大核心概念!

文章用生动比喻介绍AI三大概念:LLM(博学书呆子,知识渊博但信息滞后)、RAG(图书管理员,提供最新信息)和AI Agent(行动派,能解决问题)。强调三者结合发挥最大威力,提供AI大模型学习资源,指出AI领域人才缺口大,就业前景广阔。

文章图片
#人工智能#机器学习#深度学习 +2
建议都去飞书上学AI Agent,真的讲的太透彻了!

飞书AI Agent学习路线:3-4个月掌握智能体开发 这份飞书文档提供了一套从入门到实践的AI Agent学习方案,强调实战与项目驱动。分为四个阶段: 基础搭建(1-3周):学习提示词工程与大模型API调用,掌握Function Calling等核心技能; 核心范式(4-6周):通过ReAct模式和LangChain框架实现“思考-行动”循环; 进阶能力(7-8周):添加记忆功能与外部工具调用(

文章图片
#人工智能
AI Agent未来趋势解析:从入门到实战,全面掌握开发平台与模型趋势!

国信证券报告解析AI Agent作为具备自主决策能力的智能实体,正成为云厂商竞争新战场;当前推理需求主要由巨头内部场景驱动;C端搜索与工具类应用领先,B端面临幻觉、安全与成本挑战;未来十年增长确定性高,发展将经历短期嵌入、中期核心到长期自主代理三个阶段,学习资源涵盖从入门到精通的教程与实战项目。

文章图片
#人工智能#架构#开发语言 +2
AI Agent深度解析:与大模型的核心差异、架构设计及实战技巧,一篇文章带你彻底搞懂!

文章介绍了AI Agent如何让大模型从被动回应转变为主动解决问题的技术。AI Agent由大模型(大脑)、记忆系统、规划模块和工具使用四部分组成,具有反思、工具调用、规划和多智能体协作四种形态。相比大模型,AI Agent能自主拆解任务、调用工具、记忆历史交互,实现复杂任务一键落地。文章提供了学习AI Agent的入门方法和资源,帮助开发者抢占下一个技术风口。

文章图片
#人工智能#大数据#深度学习 +3
AI Agent深度解析:揭秘其成为下一代“操作系统”的核心架构!

如果说大模型是“超级大脑”,那AI Agent更像是给大脑接上了“身体”和“神经系统”——它不再只是回答问题,而是能理解目标、做出决策、调度工具、持续进化,最终变成一个可以托付任务的“数字员工”。

文章图片
#人工智能#架构#大数据 +4
Skills与MCP协同:构建专业级AI智能体的完整指南!

Skills和MCP是构建高效AI智能体的两大关键技术。MCP负责连接外部工具,Skills则提供使用这些工具的流程知识。两者结合可实现明确的信息发现、可靠的流程协调和稳定的执行表现。通过财务分析和会议准备等案例展示了Skills与MCP在实际工作流中的协同效果,并详细说明了各自适用场景及区别,帮助开发者构建符合特定需求的AI应用。

文章图片
#人工智能#java#开发语言 +2
后悔没早点发现斯坦福的大语言模型公开课CS324…

强推一下最近学过的斯坦福的公开课CS324: Large Language Models,LLM是当下蕞🔥的大型人工智能模型,可以处理大量文本数据,生成文本,在NLP,机器翻译和生成式AI领域都十分有用CS324是由stanford的Prof Perth Liang主讲,全面涵盖了大语言模型的各个方面,包括性能,不同的模型架构,并行性,拓展性,适应性等等,公开课的网站就可以获得课程材料和阅读材料

文章图片
#语言模型#人工智能#自然语言处理
    共 695 条
  • 1
  • 2
  • 3
  • 70
  • 请选择