
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
09 大模型学习——Transformer详解
从零开始,手撕transformer

01大模型学习——词向量
词向量(词嵌入)是一种将词汇表中的词或短语,映射为固定长度向量的技术。将高维且稀疏的单词索引,转为低维且连续的向量。转换后的连续向量,可以表示出单词与单词之间的语义关系。词向量(Embeddings)将非结构化数据(单词、句子、整个文档)转化为实数向量。

08 大模型学习——注意力机制
注意力机制 (Attention Is All You Need) ,基础认知及代码实现

03 python包管理工具——uv
一个速度极快的 Python 包和项目经理,用 Rust 编写。

09 大模型学习——Transformer详解
从零开始,手撕transformer

04 大模型学习——RAG
RAG(Retrieval-Augmented Generation,检索增强生成) 是一种结合了信息检索技术与语言生成模型的人工智能技术。该技术通过从外部知识库中检索相关信息,并将其作为提示(Prompt)输入给大型语言模型(LLMs),以增强模型处理知识密集型任务的能力,如问答、文本摘要、内容生成等。RAG模型由Facebook AI Research(FAIR)团队于2020年首次提出,并迅

01大模型学习——词向量
词向量(词嵌入)是一种将词汇表中的词或短语,映射为固定长度向量的技术。将高维且稀疏的单词索引,转为低维且连续的向量。转换后的连续向量,可以表示出单词与单词之间的语义关系。词向量(Embeddings)将非结构化数据(单词、句子、整个文档)转化为实数向量。

10 大模型学习——transformer训练与推理
transformer训练、评估与推理

10 大模型学习——transformer训练与推理
transformer训练、评估与推理

到底了







