
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
我们正在经历一个。

在大模型技术迅猛发展的今天,AI 应用正从“泛化对话”迈向“深度业务嵌入”的新阶段。如果说上半场的竞争聚焦于模型能力的展示与通用场景的覆盖,那么下半场的核心战场,则毫无疑问是深入企业业务一线的 Agent(智能体)应用。企业对 AI 的期待早已超越“能聊天、会回答”的初级阶段,转而追求能够理解行业语境、执行复杂任务、保障数据主权,并真正融入业务流程的生产力级智能体。这一趋势并非空穴来风。

文章阐述了以大模型为核心的技术生态,强调其需具备自然语言理解、创作和使用工具的能力。Agent智能体作为大模型的"手和脚",使其能够使用工具完成任务。大模型的本质是理解和生成能力的结合,应用过程需要强大的容错处理,因为执行复杂且不稳定。理解大模型原理可从人类能力角度出发,但实现过程却极为复杂。大模型的技术生态本质上就是围绕着大模型这个“人”转的。大家在学习大模型应用开发时会发现有很多种不同的技术方

现在让我们用一张表格总结这三个关键参数:chunk_size:每张卡片写多少字top_k:找几张相关卡片chunk_overlap:相邻卡片重复多少内容1.6 现在,让我们引入术语1.7 小结核心思想:1.把文档切成小块,每块生成"数字指纹";2.问题也生成"指纹",找最相似的块;3.把相关块和问题一起给 AI,让它生成答案;关键优势:✅ 基于你的文档(不会编造)✅ 语义理解(不只是关键词)✅ 可

昨天的文章已经提到,昇腾超大规模MoE模型推理部署技术在本周会有持续的技术披露,果然第二天的技术报告又如期而至了。要问最近哪个模型最火,(MoE,Mixture of Experts)绝对是榜上提名的那一个。它的巧妙之处,就在于把不同的任务分配给擅长处理的,让整个系统性能得以提升。但你知道吗?正是这个关键的专家网络,也是严重影响系统推理性能的因素之一。因为在大量任务来临之际(尤其是超大规模时),M
训练 loss 突然跳高但又下降。
在开始构建下一个 AI 功能时,我们也许不必要按照每一项都执行。但是,有相对清晰的认识,也是建立品味的过程。只有当见的够多、见过的最佳实践够多,才有可能设计出符合预期、甚至是超出用户预期的产品。

什么是 Skills,就是为大模型提供具体的某种能力,这听上去有点类似与 MCP 的概念,巧了,MCP 也是 Anthropic 提出来的。接着说什么是 Skill,假设我想查询明天的天气,如果只用大模型自己的能力肯定不行,它必须要联网搜索,而联网搜索天气预报这是一个具体且专业的事情,之前用 MCP 可以做到,现在呢,用 Skill 也能做了,这个Skill 的能力就是查天气,可能是一个 Pyth

和V3相比,到底有什么不同?官方说的模模糊糊,就提到了上下文长度拓展至128K和支持多种张量格式,但别急,我们已经,为你奉上更多新鲜信息。我们比较了V3.1和V3,注意到它在编程表现、创意写作、翻译水平、回答语气等方面都出现了不同程度的变化。不过要说最明显的更新,大概是DeepSeek网页端界面的【深度思考(R1)】悄悄变成了【深度思考】。手机端还在慢慢对齐(笑)当前DeepSeek V3.1 B
DeepResearch通常指由人工智能驱动的深度研究助手,能够自主地在网络上进行多步骤的调研,并将搜索到的信息进行分析和综合,最终生成结构完整、内容详实的报告。OpenAI对Deep Research的描述是:“









