。红小豆^^ 个人主页

@weixin_54388827

。红小豆^^

2024-12-08 22:22:26 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

03 python包管理工具——uv

一个速度极快的 Python 包和项目经理，用 Rust 编写。

#python #uv #开发语言

09 大模型学习——Transformer详解

从零开始，手撕transformer

#学习 #transformer #深度学习 +1

10 大模型学习——transformer训练与推理

transformer训练、评估与推理

#学习 #transformer #python +1

10 大模型学习——transformer训练与推理

transformer训练、评估与推理

#学习 #transformer #python +1

03 大模型学习——Langchain

LangChain 是一个开源框架(一套在大模型能力上封装的工具框架)，帮助开发者轻松构建应用程序，这些应用程序能够利用语言模型（特别是大型语言模型）来实现各种功能。LangChain 的核心理念是提供一个结构化的方法来连接不同的组件（如语言模型、数据源等），以便构建复杂的应用程序。langchain帮助我们灵活的调用大语言模型，把和大型语言模型的交互的流程抽象出来，变成一个一个的小模块，方便更好

#python

14 大模型学习——低精度微调

上溢出:超出了数据类型所能表示的最大范围下溢出:结果小于数据类型所能表示的最小范围，导致精度丢失或结果不准确。量化需要安装bitsandbytes：pip install bitsandbytes==0.37.2 -i其他部分不需要修改，修改创建模型代码即可Step4 创建模型# 多卡情况，可以去掉device_map="auto"，否则会将模型拆开load_in_8bit=True # 以8位精

#学习 #python

11 大模型学习——模型微调-LoRA

微调定制化功能和领域知识学习。Hugging Face 的 PEFT（Parameter-Efficient Fine-Tuning）库是一个用于高效微调预训练语言模型的工具包，目前支持Prefix Tuning、Prompt Tuning、PTuningV1、PTuningV2、Adapter、LoRA、AdaLoRA等微调方法。

#学习 #人工智能 #python +1

08 大模型学习——注意力机制

注意力机制 (Attention Is All You Need) ，基础认知及代码实现

#python #transformer

09 大模型学习——Transformer详解

从零开始，手撕transformer

#学习 #transformer #深度学习 +1

01大模型学习——词向量

词向量(词嵌入)是一种将词汇表中的词或短语，映射为固定长度向量的技术。将高维且稀疏的单词索引，转为低维且连续的向量。转换后的连续向量，可以表示出单词与单词之间的语义关系。词向量（Embeddings）将非结构化数据（单词、句子、整个文档）转化为实数向量。

#python

共 14 条

请选择