
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
文章阐述了以大模型为核心的技术生态,强调其需具备自然语言理解、创作和使用工具的能力。Agent智能体作为大模型的"手和脚",使其能够使用工具完成任务。大模型的本质是理解和生成能力的结合,应用过程需要强大的容错处理,因为执行复杂且不稳定。理解大模型原理可从人类能力角度出发,但实现过程却极为复杂。大模型的技术生态本质上就是围绕着大模型这个“人”转的。大家在学习大模型应用开发时会发现有很多种不同的技术方

现在让我们用一张表格总结这三个关键参数:chunk_size:每张卡片写多少字top_k:找几张相关卡片chunk_overlap:相邻卡片重复多少内容1.6 现在,让我们引入术语1.7 小结核心思想:1.把文档切成小块,每块生成"数字指纹";2.问题也生成"指纹",找最相似的块;3.把相关块和问题一起给 AI,让它生成答案;关键优势:✅ 基于你的文档(不会编造)✅ 语义理解(不只是关键词)✅ 可

昨天的文章已经提到,昇腾超大规模MoE模型推理部署技术在本周会有持续的技术披露,果然第二天的技术报告又如期而至了。要问最近哪个模型最火,(MoE,Mixture of Experts)绝对是榜上提名的那一个。它的巧妙之处,就在于把不同的任务分配给擅长处理的,让整个系统性能得以提升。但你知道吗?正是这个关键的专家网络,也是严重影响系统推理性能的因素之一。因为在大量任务来临之际(尤其是超大规模时),M
训练 loss 突然跳高但又下降。
在开始构建下一个 AI 功能时,我们也许不必要按照每一项都执行。但是,有相对清晰的认识,也是建立品味的过程。只有当见的够多、见过的最佳实践够多,才有可能设计出符合预期、甚至是超出用户预期的产品。

什么是 Skills,就是为大模型提供具体的某种能力,这听上去有点类似与 MCP 的概念,巧了,MCP 也是 Anthropic 提出来的。接着说什么是 Skill,假设我想查询明天的天气,如果只用大模型自己的能力肯定不行,它必须要联网搜索,而联网搜索天气预报这是一个具体且专业的事情,之前用 MCP 可以做到,现在呢,用 Skill 也能做了,这个Skill 的能力就是查天气,可能是一个 Pyth

和V3相比,到底有什么不同?官方说的模模糊糊,就提到了上下文长度拓展至128K和支持多种张量格式,但别急,我们已经,为你奉上更多新鲜信息。我们比较了V3.1和V3,注意到它在编程表现、创意写作、翻译水平、回答语气等方面都出现了不同程度的变化。不过要说最明显的更新,大概是DeepSeek网页端界面的【深度思考(R1)】悄悄变成了【深度思考】。手机端还在慢慢对齐(笑)当前DeepSeek V3.1 B
DeepResearch通常指由人工智能驱动的深度研究助手,能够自主地在网络上进行多步骤的调研,并将搜索到的信息进行分析和综合,最终生成结构完整、内容详实的报告。OpenAI对Deep Research的描述是:“

以上作品我使用AI智能体生成,目前专业做网站的智能体,我也调研了,常见的包括Lovable,MiniMax Agent,bolt.new,Skywork.ai,还有最近几天发布的GPT Agent,为了做周杰伦的歌曲网站,使用了这几个工具实验完后,发现MiniMax Agent做出的网站,前后端代码最全,能达到企业级可商用的标准。随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热

对于复杂任务,建议在 prompt 中明确列出大模型应遵循的推理或执行步骤。与其直接要求最终答案,不如将任务分解为有序的思考或操作环节,引导模型分步完成。这种方法可显著提升输出的可靠性和可解释性,并便于定位中间错误。明确性:确保模型清楚每一阶段的目标,减少歧义与遗漏;结构化:步骤化的逻辑顺序增强任务连贯性与条理性;效率提升:拆解为子任务有助于模型更高效、精准地处理;过程可监控:明确步骤便于跟踪执行









