logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型从基础到入门——入门知识二 相关工具

本文介绍了大模型相关工具和优化技术:1)优化框架如DeepSpeed和vLLM,通过分页注意力、连续批处理等提升推理效率;2)轻量化引擎llama.cpp的跨平台量化技术;3)KTransformer的MoE架构优化和计算加速策略。还探讨了深度学习的梯度问题(爆炸/消失)及解决方案,以及熵、交叉熵、KL散度的概念区别与应用场景。这些技术涵盖了大模型训练、推理、部署等多个环节的优化方法。

#论文阅读#python#人工智能
大模型从基础到入门——入门知识二 相关工具

本文介绍了大模型相关工具和优化技术:1)优化框架如DeepSpeed和vLLM,通过分页注意力、连续批处理等提升推理效率;2)轻量化引擎llama.cpp的跨平台量化技术;3)KTransformer的MoE架构优化和计算加速策略。还探讨了深度学习的梯度问题(爆炸/消失)及解决方案,以及熵、交叉熵、KL散度的概念区别与应用场景。这些技术涵盖了大模型训练、推理、部署等多个环节的优化方法。

#论文阅读#python#人工智能
大模型从基础到入门——大模型文件

本文以DeepSeek-R1-Distill-Qwen-7B大模型为例,详细解析了大模型文件的结构及其参数意义。主要文件包括config.json(模型架构配置)、generation_config.json(生成控制配置)、tokenizer_config.json(分词器配置)及model.safetensors(模型权重文件)等。文章对比了不同模型文件的差异,如DeepSeek与Qwen系列

文章图片
#python
基于Ktransformer部署DeepSeek-R1模型

我这边离线机器跑起来居然没有报错,成功后可以访问10012端口看看,一般会显示detail Not Found,访问后缀加/web/index.html即可进入聊天页面。其中gguf_path为gguf文件路径,需要有config配置文件在同一路径;记录一次在离线机器上使用kt框架部署Deepseek:671B模型过程。model_path为模型路径,不知道为什么没有后会报错(再看看;cpu_in

文章图片
#java#spring cloud#开发语言
基于Ktransformer部署DeepSeek-R1模型

我这边离线机器跑起来居然没有报错,成功后可以访问10012端口看看,一般会显示detail Not Found,访问后缀加/web/index.html即可进入聊天页面。其中gguf_path为gguf文件路径,需要有config配置文件在同一路径;记录一次在离线机器上使用kt框架部署Deepseek:671B模型过程。model_path为模型路径,不知道为什么没有后会报错(再看看;cpu_in

文章图片
#java#spring cloud#开发语言
大模型从基础到入门——基础知识

本文主要记录入门大模型学习的相关知识,以期为后续工作学习提供帮助。(除了我自己截图外,引用的我尽量标注来源,有些忘记来源了请告诉我orz)

文章图片
#人工智能#python
新版本本地化的fastgpt接入重排模型≥4.8.20

新版本本地化的fastgpt接入重排模型

文章图片
#docker
大模型从基础到入门——大模型文件

本文以DeepSeek-R1-Distill-Qwen-7B大模型为例,详细解析了大模型文件的结构及其参数意义。主要文件包括config.json(模型架构配置)、generation_config.json(生成控制配置)、tokenizer_config.json(分词器配置)及model.safetensors(模型权重文件)等。文章对比了不同模型文件的差异,如DeepSeek与Qwen系列

文章图片
#python
大模型从基础到入门——基础知识

本文主要记录入门大模型学习的相关知识,以期为后续工作学习提供帮助。(除了我自己截图外,引用的我尽量标注来源,有些忘记来源了请告诉我orz)

文章图片
#人工智能#python
大模型从基础到入门——入门知识

摘要:DeepSeek大模型系列通过技术创新持续演进,从DeepSeek-V2的MoE架构到V3引入MTP、FP8混合精度训练等技术,再到DeepSeek-R1采用强化学习框架GRPO和蒸馏技术。MoE架构通过细粒度专家划分和共享专家策略优化计算效率,MLA技术则通过低秩压缩减少KVcache显存占用。微调方法包括LoRA、AdapterTuning等,强化学习方面PPO、DPO和GRPO各有特点

文章图片
#深度学习#人工智能#论文阅读
    共 16 条
  • 1
  • 2
  • 请选择