和老莫一起学AI 个人主页

@2401_85373691

和老莫一起学AI

2024-08-30 10:44:32 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

【值得收藏】MoE大模型架构揭秘：为什么DeepSeek等大模型都采用这种设计

本文详细解析了MoE（混合专家）架构大模型的工作原理与优势。MoE通过"分工合作"和"按需调用"的机制，由门控网络动态选择并组合专家网络的输出，实现大模型容量与高效计算的平衡。这种架构虽拥有庞大参数量，但每次推理只需激活部分专家，大幅降低计算成本。同时，专家网络的专业化分工提高了模型性能，使其成为构建超大规模语言模型的重要技术，如GPT-4和DeepSeek等。

#人工智能 #学习

【必收藏】从零构建AI智能体：完整开发者指南（含框架选择与实战部署）

本文是一份从零构建人工智能智能体的完整开发者指南，涵盖必备条件、功能规划、框架选择、架构设计、模型训练、决策逻辑实现、记忆系统、工具集成、测试评估到实际部署的全流程。文章详细介绍了如何利用Python、机器学习概念、大型语言模型以及LangChain等框架，设计各类架构的智能体，并通过训练、微调与迭代优化，实现具备记忆与上下文管理能力、可自主决策并集成外部工具的智能系统。

#人工智能 #学习 #产品经理

【值得收藏】智能体与大模型的底层联系：Langgraph框架工作原理解析

本文阐述了智能体与大模型的本质关系，指出智能体基于大模型的函数调用能力构建，框架只是对原生能力的封装。重点解析了Langgraph框架的核心架构，包括State(状态)、Nodes(节点)和Edges(边)三大概念，详细说明了节点如何完成工作、边如何决定执行流程，以及状态如何在节点间传递参数。文章还强调了Langgraph支持顺序和并行执行节点，并能保存中间结果以支持中断恢复，为开发者构建智能体提

#transformer #深度学习 #人工智能 +1

AI Agent构建全攻略：从技术原理到工程实践，程序员必备指南，建议收藏！

AI Agent是一种复杂智能系统，需要五大核心模块协同工作：LLM(认知中枢)、Memory(上下文感知)、Planning(任务规划)、Tool-use(工具调用)和Reflection(自我反思)。主流架构包括MCP、ReAct和A2A，各有适用场景。当前面临状态管理、工具鲁棒性、计划可控性和系统透明性四大挑战。构建AI Agent不仅是模型选择，更是系统工程能力的体现，未来属于既懂AI又懂

#人工智能 #学习 #产品经理

【必学收藏】参数高效微调(PEFT)技术详解：让大模型垂直领域适配更高效

本文介绍了参数高效微调(PEFT)技术，解决大语言模型在垂直领域适应性不足的问题。传统全参数微调计算开销大、资源要求高，限制了模型落地。PEFT通过三类策略实现高效适配：参数附加方法(添加少量新模块)、参数选择方法(仅微调关键参数)和低秩适配方法(如LoRA)。PEFT具有计算效率高、存储效率高、适应性强等优势，能在资源受限环境中有效提升模型在特定领域的表现。

#深度学习 #人工智能 #机器学习 +2

手把手教你用Prompt工程“调教”大模型当风控专家！建议收藏

回顾这段从V1到V4的进化之路，我将我的经验提炼为几点“心法”，希望能对大家有所启发：•始于模仿，终于框架：从模仿你自己的专家思考过程开始，逐步将零散的规则，抽象和沉淀为普适的、可复用的分析框架。•规则是骨架，背景是血肉：只给规则，AI是冰冷的机器；为规则注入业务背景、用户心理等“常识”，AI才有智能的灵魂。•反例是最好的老师：教会AI“什么不是风险”和“什么是风险”同等重要。精心设计的“豁免规则

#人工智能 #学习

DeepSeek vs Qwen 编程能力实测！谁才是真正的AI编程助手？

DeepSeek在价格上更优惠，而Qwen在编程效果上更胜一筹！看到这儿，我相信大家和我一样，开始犯嘀咕：当前火爆全球、如日中天、大红大紫的DeepSeek大模型，竟然在编程效果上不及Qwen大模型？从结果看，是的。也许是DeepSeek火爆点并不在编程效果上，也行是的提示词待优化，也许是所举样例不具备代表性，也许是需要我们再给 DeepSeek 一些时日……但无论如何，我目前已经明确，接下来续费

#人工智能 #学习

DeepSeek vs Qwen 编程能力实测！谁才是真正的AI编程助手？

#人工智能 #学习

大模型入门知识：Transformer位置嵌入彻底讲透！

位置嵌入是现代 NLP 模型中不可或缺的一部分，它使得模型能够理解词语的顺序，进而提升对文本的理解能力。通过引入位置嵌入，Transformer 架构克服了传统自注意力机制对词序“不可知”的局限，为各种自然语言处理任务提供了强有力的支持。只要你真心想学习AI大模型技术，这份精心整理的学习资料我愿意无偿分享给你，但是想学技术去乱搞的人别来找我！在当前这个人工智能高速发展的时代，AI大模型正在深刻改变

#transformer #深度学习 #人工智能 +1

大模型入门知识：Transformer位置嵌入彻底讲透！

#transformer #深度学习 #人工智能 +1

共 1462 条

请选择