logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

12-Factor Agents:大模型代理开发的12项核心原则(收藏版)

本文翻译并整理了12-Factor Agents的内容,结合个人实践补充了部分笔记和理解,涵盖了LLM代理开发的12项核心原则。这些原则受著名的12要素应用方法论启发,为构建可靠、可维护且可扩展的LLM应用提供了全面的指南。文章详细解释了自然语言工具调用、拥有自己的提示词、上下文窗口管理、工具调用与执行状态统一、API设计、人机交互、控制流、错误处理、小型专注代理设计、多渠道接入以及无状态设计等原

文章图片
#人工智能#语言模型#产品经理
从Excel起步,小白也能学会Transformer大模型——收藏版学习指南!

本文面向零基础读者,以通俗易懂的方式讲解了Transformer大模型的核心原理,包括位置编码、多头注意力机制、残差连接和层归一化、逐位置前馈神经网络等关键概念。通过手把手实例,帮助读者理解Transformer如何解决序列数据处理中的问题,并阐述其在AI领域的应用价值。建议收藏,逐步深入学习。

文章图片
#transformer#深度学习#人工智能 +1
AI大模型新手必看:收藏这份学习指南,轻松入门并抓住风口机遇!

本文详细介绍了AI的发展历程,从弱人工智能到机器学习、深度学习,再到如今的大语言模型,每个阶段都有其标志性的技术突破和应用扩展。文章还深入解析了AI大模型的四阶技术,包括提示工程、AI智能体、大模型微调以及预训练技术,并阐述了它们各自的技术特点和应用场景。此外,文章强调了在AI时代,跨领域整合、系统性思考、创造性解决问题等技能的重要性,并鼓励读者结合自身情况,积极探索和掌握AI大模型技术,从而在A

文章图片
#人工智能#语言模型#产品经理
大模型推理优化实战:收藏这四大方向,小白也能轻松提升性能与降低成本

本文全面介绍了大模型推理优化的四大方向,包括模型量化、剪枝、知识蒸馏等模型优化技术,GPU选型与硬件加速利用,分布式推理与智能调度,以及弹性伸缩与成本控制。通过这些技术,可以有效提升大模型推理速度和吞吐量,降低延迟和成本,增强服务稳定性,是工程师提升技能的必备知识。

文章图片
#人工智能#语言模型#产品经理
收藏!小白程序员必看:轻松入门大模型微调(全量 vs LoRa 对比)

本文深入浅出地对比了大模型微调中的两种主流技术:全量微调和LoRa微调。全量微调通过更新模型所有参数提升性能,但成本高昂;LoRa微调则引入低秩矩阵进行高效适配,显著降低计算资源需求。文章详细分析了两种方法的优缺点、适用场景及成本效益,并指出LoRa正成为大模型生态的主流选择。对于资源有限的团队,LoRa是快速迭代多任务的首选;而追求极致性能时,全量微调仍是关键。选择应根据目标、资源和节奏来定,关

文章图片
#人工智能#AI#产品经理
2026年AI大模型入门指南:收藏这份学习资料,小白也能成为数字伙伴!

本文介绍了2025年AI Agent的七大热门方向:记忆型Agent、OS Agents、云端智能体、企业级决策Agent、多模态Agent、Agent训练方式革新以及未来趋势与挑战。文章强调了AI Agent技术的发展和应用场景拓展,并鼓励普通人学习AI大模型技术,抓住风口。同时,提供了一份无偿分享的学习资料,帮助读者从零入门到实战,掌握AI时代的核心技能。

文章图片
#人工智能#语言模型#AI
干货收藏!2025大模型技术年终总结:Linear Attention、Sparse Attention、MegaKernel等六大核心技术详解

本文系统总结了2025年大模型领域的六大关键技术进展:Linear Attention通过KDA机制解决长序列处理问题;Sparse Attention如DSA实现动态稀疏模式;MegaKernel技术优化GPU计算效率;深度学习编译器如Tawa提升代码执行性能;强化学习Seer优化Rollout阶段;DeepEP实现计算-通信重叠优化。这些技术共同推动大模型在效率、性能和应用能力方面的显著提升。

文章图片
#人工智能#语言模型#产品经理
从AI到LLM,一篇搞懂大模型技术栈(建议收藏)

文章通过"俄罗斯套娃"比喻清晰解释了AI、ML、DL、LLM之间的层级关系,介绍了DeepSeek、豆包、Kimi等大语言模型产品的特点与应用场景,解析了Token作为AI世界计量单位的重要性,并展望了从LLM到LMM、从Chat到Agent的发展趋势。帮助读者理解大模型技术栈,从被动围观者转变为主动驾驭者。

#人工智能#语言模型#产品经理
【RAGFlow实战】手把手入门:Docker部署你的智能知识库引擎,实现高效AI问答,建议收藏!

RAGFlow 是一款开源的 RAG(Retrieval-Augmented Generation,检索增强生成)引擎,它的核心使命是帮助你利用深度文档理解技术,构建出高质量、高可靠性的智能知识库。无论你是大型企业还是个人开发者,RAGFlow 都能为你提供一套精简而强大的 RAG 工作流程,让你的 LLM 能够真正理解和利用各种复杂格式的数据,给出令人信服的回答并提供清晰的引用来源。

文章图片
#docker#人工智能
【AI大模型实战】AI智能体自媒体获客系统:从0到1搭建你的专属数字团队,效率提升80%!

本文详细介绍了AI智能体如何解决自媒体获客的三大痛点:专业技能缺失、创意枯竭和时间不足。通过构建完整的智能体系统,包括账号定位、内容规划、创作、剪辑和数据分析等环节,实现自媒体获客自动化。该系统可降低获客成本80%,实现日更视频,并大幅提升转化率,为个人创业者、自媒体从业者和传统行业老板提供高效解决方案。

文章图片
#人工智能#媒体
    共 1307 条
  • 1
  • 2
  • 3
  • 131
  • 请选择