logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

拆解大模型的“工作记忆”:上下文窗口从4K到1M的进化之路

本篇文章深入拆解了大模型“上下文窗口”的演进与技术本质,指出长文本不等于真理解,并针对“迷失在中间”等核心挑战,为开发者提供了实用的上下文管理与工程优化策略

文章图片
#人工智能#算法#transformer +1
什么是大语言模型(LLM)?用最通俗的方式带你彻底搞懂它的超能力

本篇文章通过通俗易懂的比喻,深入浅出地拆解了大语言模型(LLM)基于“预测下一个词”的底层逻辑、三大核心训练阶段(预训练、监督微调、人类反馈强化学习)以及它的优势与能力边界。

文章图片
#语言模型#人工智能#自然语言处理 +2
写给普通人的AI_Token深度指南:从看懂账单到理解Embedding

本篇文章深入浅出地讲解了Token的定义、BPE分词原理如何导致中英文成本差异,以及Embedding向量如何赋予Token语义,从而揭示了AI的计费、记忆和生成质量背后的核心机制。

文章图片
#人工智能#语言模型
什么是大语言模型(LLM)?用最通俗的方式带你彻底搞懂它的超能力

本篇文章通过通俗易懂的比喻,深入浅出地拆解了大语言模型(LLM)基于“预测下一个词”的底层逻辑、三大核心训练阶段(预训练、监督微调、人类反馈强化学习)以及它的优势与能力边界。

文章图片
#语言模型#人工智能#自然语言处理 +2
从“胡言乱语”到“逻辑专家”:深度解析 RAG, ReAct 与 PAL 三大架构

本篇文章通过解析 RAG(外接知识库解决私有知识)、ReAct(思考与行动循环解决多步任务)以及 PAL(生成代码解决复杂计算)三大架构,阐述了如何通过不同维度的技术增强来构建更专业、可靠的 AI Agent 基石。

文章图片
#人工智能#深度学习
提示词工程进阶:思维链、结构化与系统化调优

本篇文章系统讲解了从“让AI听懂话”到“让AI学会思考”的进阶方法论,核心是教你通过思维链、多角色协作、链式任务拆解和结构化输出来设计AI的认知流程,最终成为一名AI思维流程的设计师。

文章图片
#人工智能#语言模型#自然语言处理 +1
AI 提示词工程入门:用好的语言与模型高效对话

本篇文章是一份面向初学者的提示词工程入门指南,核心是通过“清晰明确、提供上下文、设定格式、用示例引导”四大原则,教导读者如何将模糊的指令转化为结构化的“任务说明书”,以驱动AI生成精准、符合预期的输出。

文章图片
#人工智能#大数据#语言模型 +2
从白纸到对话:一文看懂大模型训练的完整技术栈与学习路径(二)

本篇文章系统讲解了大模型从监督微调到RLHF对齐的核心原理、数据构建、训练方法与部署评估,帮你深刻理解如何让基座模型从“续写机器”进化为“懂人话、有温度”的AI助手。

文章图片
#学习#人工智能
从白纸到对话:一文看懂大模型训练的完整技术栈与学习路径(一)

本篇文章系统讲解了大模型从预训练(海量数据自学)、监督微调(学会对话)到RLHF(对齐人类偏好)的完整技术路径与成本。

文章图片
#人工智能#神经网络#深度学习 +2
扔掉“金鱼记忆”:Transformer 是如何让 AI 学会“一目十行”的?

本篇文章用“会议室里相互对视”的生动比喻,通俗地解释了 Transformer 如何用自注意力机制替代 RNN 的串行记忆,从而实现并行计算与长距离上下文理解。

文章图片
#人工智能#transformer#深度学习
    共 18 条
  • 1
  • 2
  • 请选择