logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型微调16种方法详解:从参数高效到行为塑造,小白也能掌握

文章系统介绍了大语言模型(LLM)的16种主流微调方法,分为参数高效微调(如LoRA、QLoRA)、行为塑造方法(如指令微调、RLHF、DPO)和能力扩展方法(如多任务微调、联邦微调)。详细解析了各类方法的原理、优势、适用场景和实战建议,针对不同资源情况提供决策框架,强调数据质量的重要性,并介绍常用工具生态,帮助开发者选择适合的微调技术方案。

文章图片
#transformer#人工智能
急!现在转大模型还来得及吗?程序员如何抓住职业的第二春

行外很多人想了解却感到无从下手,行内很多人苦于没有硬件条件无法尝试。想转大模型方向,相关的招聘虽然层出不穷,但一般都要求有大模型经验。而更多的人,则一直处于观望之中,感觉自己只能每天看看各种自媒体,以及在聊天时的各种口嗨,难以躬身入局。但也有不少人对其表示怀疑,巨大的算力成本和模糊的落地场景是其发展的阻碍。大家更容易将其和元宇宙等概念联系起来,视为泡沫。但技术的变革和炒作不一样,不是用Gartne

文章图片
#人工智能#自然语言处理#机器学习 +3
大语言模型 (LLM)是什么? 大语言模型从入门到精通,看这一篇就够了

②虚假信息:大语言模型可能会生产一些具有极强迷惑性的信息,甚至可能被用于传播虚假信息或进行舆论操纵:当前社交机器人更多停留在一级传播,如果大语言模型和社交机器人相结合,就可能会形成类人的交流能力,带来社交机器人的多级传播,从而强化社交机器人传播虚假信息的负面影响。①算法垄断:大语言模型的训练需要消耗巨大的算力资源,更高的门槛在很大程度上限制了学界对大模型的持续探索,未来可能只有少量大型企业和机构能

文章图片
#语言模型#人工智能#自然语言处理 +2
万字长文AI智能体:17种智能体架构详解

AI 智能体领域发展迅猛,但许多资源仍然过于抽象和理论化。创建此项目的目的是为开发者、研究人员和AI爱好者提供一条结构化、实用且深入的学习路径,以掌握构建智能系统的艺术。

文章图片
#人工智能#架构
新范式!字节提出智能体上下文折叠框架,1/10活跃量突破长周期任务瓶颈

智能体在执行长周期任务时,始终受限于上下文长度。为此,字节联合提出**上下文折叠(Context-Folding)框架**,使智能体能够主动管理其工作上下文。该框架允许智能体通过程序分支进入子轨迹以处理子任务,完成后将中间步骤折叠压缩,仅保留结果摘要。为使该行为可学习,研究人员开发了端到端强化学习框架FoldGRPO,通过特定过程奖励鼓励有效的任务分解与上下文管理。

文章图片
#架构#人工智能
大模型开发新思路:Agentic RAG技术详解与实战案例,收藏不亏

本文介绍了Agentic RAG技术,通过智能体实现无需向量化检索的轻量级大模型应用。以餐厅推荐系统为例,展示如何从用户输入提取参数,通过纯Python条件过滤结构化数据检索结果,再由大模型生成友好回复。相比传统RAG,Agentic RAG节省算力存储开销,灵活扩展性强,无需复杂基础设施即可快速验证智能推荐核心流程,适合中小规模数据场景。

文章图片
#人工智能#RAG
大模型应用评测体系完整解析,小白也能快速上手

本文详细介绍了淘宝闪购技术部在AI产品落地过程中面临的挑战及解决方案,构建了一套贯穿AI产品全生命周期的评测体系。文章从"评什么"、"怎么评"、"怎么度量"和"线上效果评估"四个维度阐述了评测方法,并介绍了评测平台的架构与成果,最后展望了多模态评测、可视化标注和开放插件市场等未来方向。这套体系旨在保障大模型AI产品质量,促进持续迭代和价值落地。

文章图片
#人工智能#机器学习
Agentic AI与RAG技术选型指南:从原理到实战,一文搞懂何时用、何时避

本文深入解析了Agentic AI与RAG两大AI技术的本质、适用场景及结合方式。Agentic AI的核心是自主决策循环,适合多步骤工作流;RAG虽强大但非万能,规模化后需Context Engineering优化。文章提供了清晰的技术选型决策树:静态知识库适合纯RAG,多步骤任务适合纯Agentic AI,而需要"查资料+推理决策"的复杂场景则适合Agentic RAG。同时,本地模型作为成本

文章图片
#人工智能#RAG
AI Agent九大设计模式完全指南:从入门到精通的实战解析

文章系统解析AI Agent九大设计模式,详述ReAct、Plan-and-Solve等模式的核心机制与适用场景。提供模式演进全景图与选型策略,强调根据业务需求选择合适模式,避免为简单任务强加复杂架构。未来趋势包括模式联邦化、硬件协同优化和伦理约束层,帮助开发者精准匹配场景,提升Agent落地效能。

文章图片
#人工智能
基于DeepSeek私有化部署RAGFlow行业知识库和智能体Agent,完美实现知识图谱和低代码开发(含案例)

本文给出了AI知识库和Agent智能体在各个行业的应用场景,并详细演示了DeepSeek+RAGFlow的私有化部署过程、总体架构、知识库和Agent智能体搭建、核心模块代码等细节,以及如何完美实现知识图谱和低代码开发。

文章图片
#人工智能#大数据#算法
    共 735 条
  • 1
  • 2
  • 3
  • 74
  • 请选择