weixin_45295956 个人主页

@weixin_45295956

weixin_45295956

2024-11-22 22:46:12 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

Transformer核心：自注意力机制解析

赋予LLM使用工具（搜索、计算器、API）、规划任务、记忆和反思的能力，使其能够自主或半自主地完成复杂工作流。（Self-Attention）来捕捉序列中的长距离依赖关系，为后续LLM的爆发奠定了基石。：如金融分析Agent、法律文书审核Agent、医疗诊断辅助Agent等，深度结合行业知识。：如AutoGPT、Devin（AI程序员），能够理解复杂目标并拆解执行。展开，其演进体现在架构优化、训练

#人工智能 #深度学习

大模型内部的数学世界

大语言模型如何将文字转化为数字并生成回答？文章通过比喻图书馆管理员，解释了模型处理语言的数学过程。首先通过分词将文字转换为数字编号，再通过嵌入查找将数字变成高维向量。注意力机制让词与词建立关联，通过矩阵乘法和激活函数进行复杂计算。最终使用Softmax将输出向量转为概率分布，采样生成回答。整个过程展现了数学如何支撑AI的语言能力，虽非人类式"理解"，却能完成复杂的语言任务。文章

#人工智能

大模型最新理论突破解析

大模型最新理论进展与技术突破主要体现在算法优化、架构创新、效率提升及多模态融合等核心维度。以下通过表格和代码示例进行结构化阐述。

#人工智能

到底了