还是奇怪个人主页

还是奇怪

2025-04-03 15:43:43 加入 DevPress

简介

该用户还未填写简介

未填写擅长的技术栈

暂无可提供的服务

本篇文章深入拆解了大模型“上下文窗口”的演进与技术本质，指出长文本不等于真理解，并针对“迷失在中间”等核心挑战，为开发者提供了实用的上下文管理与工程优化策略

本篇文章通过通俗易懂的比喻，深入浅出地拆解了大语言模型（LLM）基于“预测下一个词”的底层逻辑、三大核心训练阶段（预训练、监督微调、人类反馈强化学习）以及它的优势与能力边界。

本篇文章深入浅出地讲解了Token的定义、BPE分词原理如何导致中英文成本差异，以及Embedding向量如何赋予Token语义，从而揭示了AI的计费、记忆和生成质量背后的核心机制。

本篇文章通过解析 RAG（外接知识库解决私有知识）、ReAct（思考与行动循环解决多步任务）以及 PAL（生成代码解决复杂计算）三大架构，阐述了如何通过不同维度的技术增强来构建更专业、可靠的 AI Agent 基石。

本篇文章系统讲解了从“让AI听懂话”到“让AI学会思考”的进阶方法论，核心是教你通过思维链、多角色协作、链式任务拆解和结构化输出来设计AI的认知流程，最终成为一名AI思维流程的设计师。

本篇文章是一份面向初学者的提示词工程入门指南，核心是通过“清晰明确、提供上下文、设定格式、用示例引导”四大原则，教导读者如何将模糊的指令转化为结构化的“任务说明书”，以驱动AI生成精准、符合预期的输出。

本篇文章系统讲解了大模型从监督微调到RLHF对齐的核心原理、数据构建、训练方法与部署评估，帮你深刻理解如何让基座模型从“续写机器”进化为“懂人话、有温度”的AI助手。

本篇文章系统讲解了大模型从预训练（海量数据自学）、监督微调（学会对话）到RLHF（对齐人类偏好）的完整技术路径与成本。

本篇文章用“会议室里相互对视”的生动比喻，通俗地解释了 Transformer 如何用自注意力机制替代 RNN 的串行记忆，从而实现并行计算与长距离上下文理解。

共 18 条

请选择