logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

第 9 章:真实落地案例——哪些是真的,哪些被夸大了

📚:[大模型入门:从原理到实践,技术人的认知升级指南]

#人工智能
第 10 章:技术人的 AI 时代路径图

📚:[大模型入门:从原理到实践,技术人的认知升级指南]

#人工智能#大数据
第 8 章:Agent——让模型学会自己干活

文章摘要:Agent与传统大模型的核心区别在于自主规划与执行能力。Agent通过推理拆解任务、调用工具(如搜索/数据库/API)并循环执行(思考→行动→观察),实现多步骤目标。其优势在于自动化复杂流程(如竞品分析),但存在错误累积、长任务不稳定等局限。当前最佳实践是:聚焦小范围任务、保持人工监督、确保结果可验证。多Agent系统通过分工协作可提升复杂任务处理效率,但需警惕工具调用错误和失控风险。未

#人工智能
第 7 章:RAG——给模型接上外部知识库

摘要:RAG(检索增强生成)是一种结合检索与生成的大模型应用技术,通过将文档切块、向量化存储,在用户提问时检索最相关的文本片段作为上下文,提升大模型回答的准确性和时效性。相比微调,RAG更适合知识频繁更新的场景(如企业知识库问答),具有成本低、可追溯来源等优势,但其效果高度依赖检索质量,且难以处理跨文档推理。技术选型时,需根据知识更新频率、预算和核心需求(访问知识vs改变模型行为)权衡RAG与微调

#人工智能
AI时代,后端工程师还能活多久?

AI正在重塑后端工程师的生存法则:CRUD岗位快速萎缩,但高阶技术人才更稀缺。数据显示,2024年中级Java岗位减少23%,而AI后端工程师需求暴涨300%。AI能高效完成80%的代码生成、调试和文档工作,但无法替代架构设计、故障处理和业务决策等核心能力。行业分层明显:基础岗位面临淘汰,系统设计师薪资逆势上涨18%。三条突围路径:1)深耕系统设计能力;2)掌握AI工具提升效率;3)培养业务理解力

#人工智能#java#spring
第 6 章:Prompt 工程——和模型高效沟通

本文探讨了Prompt工程对大模型输出的关键影响。通过"解释递归"的三种提问方式对比,展示了Prompt设计如何决定回答质量。文章提出四大核心技巧:角色设定(明确身份背景)、思维链提示(分步推理)、少样本示例(示范输入输出)、格式指令(结构化输出),并配以流程图说明其原理。同时指出技术人常见的五大误区,如过度简洁、术语滥用、任务堆叠等。最后强调Prompt工程的本质是精准限定输出空间,但其边界在于

#人工智能#机器学习
第 4 章:训练的真相——从文本堆到智能体

📚:[大模型入门:从原理到实践,技术人的认知升级指南]

#人工智能
第 3 章:Transformer 的直觉——注意力是什么

📚:[大模型入门:从原理到实践,技术人的认知升级指南]

#transformer#深度学习#人工智能
第 2 章:Token——语言的原子

摘要:大模型处理语言的基本单元是Token而非字母,这解释了为何GPT会答错"strawberry有几个r"这类问题。中文比英文消耗更多Token,影响处理效率。上下文窗口(以Token计)决定模型单次处理的信息量,超出部分会被遗忘。虽然主流模型的窗口从4K扩展到百万级Token,但存在"迷失在中间"效应,且成本随窗口增大而提高。理解Token机制是掌握大模型工作原理的关键,它揭示了模型看似"健忘

#人工智能
第 1 章:大模型不是“更聪明的搜索”

本文对比了搜索引擎与大语言模型(如ChatGPT)的本质差异。搜索引擎通过爬取、索引和匹配返回相关链接,用户需自行整合信息;而大模型基于语言模式逐词生成语义合理的回答,能主动补充未提及的细节。两者的核心区别在于:搜索引擎提供原材料,大模型直接生成加工品。这种差异带来了协作方式的根本转变——AI开始参与思考过程。但需警惕大模型可能生成"听起来合理但不正确"的内容(幻觉现象)。正确使用需理解二者适用场

#人工智能
    共 12 条
  • 1
  • 2
  • 请选择