Creating 个人主页

@Solidwang

Creating

2024-07-01 16:30:43 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

第 2 章：Token——语言的原子

摘要：大模型处理语言的基本单元是Token而非字母，这解释了为何GPT会答错"strawberry有几个r"这类问题。中文比英文消耗更多Token，影响处理效率。上下文窗口（以Token计）决定模型单次处理的信息量，超出部分会被遗忘。虽然主流模型的窗口从4K扩展到百万级Token，但存在"迷失在中间"效应，且成本随窗口增大而提高。理解Token机制是掌握大模型工作原理的关键，它揭示了模型看似"健忘

#人工智能

第 5 章：幻觉、记忆与局限——它不是神

状态: 草稿。

#人工智能

第 1 章：Spring AI / LangChain4j / 原生 SDK，我该用哪个？

LangChain4j 的方式最规范，系统提示词是接口定义的一部分，修改需要改代码而非运行时逻辑（这在某些场景下反而是优点——意外的 system prompt 修改会在 code review 时被发现）。当 AI 请求的响应时间以秒计时，使用虚拟线程可以让服务在等待 AI 响应的同时以极低的线程开销处理其他请求。Spring AI 是"为 Spring 项目加 AI 能力的最短路径"，Lang

#spring #人工智能 #java

第 1 章：Spring AI / LangChain4j / 原生 SDK，我该用哪个？

#spring #人工智能 #java

第 9 章：真实落地案例——哪些是真的，哪些被夸大了

📚：[大模型入门：从原理到实践，技术人的认知升级指南]

#人工智能

第 10 章：技术人的 AI 时代路径图

📚：[大模型入门：从原理到实践，技术人的认知升级指南]

#人工智能 #大数据

第 8 章：Agent——让模型学会自己干活

文章摘要：Agent与传统大模型的核心区别在于自主规划与执行能力。Agent通过推理拆解任务、调用工具（如搜索/数据库/API）并循环执行（思考→行动→观察），实现多步骤目标。其优势在于自动化复杂流程（如竞品分析），但存在错误累积、长任务不稳定等局限。当前最佳实践是：聚焦小范围任务、保持人工监督、确保结果可验证。多Agent系统通过分工协作可提升复杂任务处理效率，但需警惕工具调用错误和失控风险。未

#人工智能

第 7 章：RAG——给模型接上外部知识库

摘要：RAG（检索增强生成）是一种结合检索与生成的大模型应用技术，通过将文档切块、向量化存储，在用户提问时检索最相关的文本片段作为上下文，提升大模型回答的准确性和时效性。相比微调，RAG更适合知识频繁更新的场景（如企业知识库问答），具有成本低、可追溯来源等优势，但其效果高度依赖检索质量，且难以处理跨文档推理。技术选型时，需根据知识更新频率、预算和核心需求（访问知识vs改变模型行为）权衡RAG与微调

#人工智能

AI时代，后端工程师还能活多久？

AI正在重塑后端工程师的生存法则：CRUD岗位快速萎缩，但高阶技术人才更稀缺。数据显示，2024年中级Java岗位减少23%，而AI后端工程师需求暴涨300%。AI能高效完成80%的代码生成、调试和文档工作，但无法替代架构设计、故障处理和业务决策等核心能力。行业分层明显：基础岗位面临淘汰，系统设计师薪资逆势上涨18%。三条突围路径：1）深耕系统设计能力；2）掌握AI工具提升效率；3）培养业务理解力

#人工智能 #java #spring

第 6 章：Prompt 工程——和模型高效沟通

本文探讨了Prompt工程对大模型输出的关键影响。通过"解释递归"的三种提问方式对比，展示了Prompt设计如何决定回答质量。文章提出四大核心技巧：角色设定（明确身份背景）、思维链提示（分步推理）、少样本示例（示范输入输出）、格式指令（结构化输出），并配以流程图说明其原理。同时指出技术人常见的五大误区，如过度简洁、术语滥用、任务堆叠等。最后强调Prompt工程的本质是精准限定输出空间，但其边界在于

#人工智能 #机器学习

共 16 条

请选择