logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【音频标注】- 大模型部署资源极致利用方案尝试(一)

摘要:本文探讨了大模型部署的资源优化方案,针对deepseek-R1 1.58Bit模型当前124G内存和11G显存(共48G)的利用不足问题,提出两个优化目标:实现显存极致占用的最佳部署方案,并测试不同参数量模型在该方案下的推理速度。当前测试显示模型推理速度约6汉字/秒,但资源利用率未达最优,后续将重点研究显存占满状态下的性能提升方案。

文章图片
【音频标注】- 大模型部署资源极致利用方案尝试(一)

摘要:本文探讨了大模型部署的资源优化方案,针对deepseek-R1 1.58Bit模型当前124G内存和11G显存(共48G)的利用不足问题,提出两个优化目标:实现显存极致占用的最佳部署方案,并测试不同参数量模型在该方案下的推理速度。当前测试显示模型推理速度约6汉字/秒,但资源利用率未达最优,后续将重点研究显存占满状态下的性能提升方案。

文章图片
【音频标注】- deepseek-R1满血版 1.58 Bit模型落地部署(四)

本文记录了在Docker容器中部署deepseek-R1 1.58Bit大模型的过程。作者首先清理了无关Docker容器,新建容器并挂载必要路径,但在安装Anaconda和构建虚拟环境时遇到代理配置错误。通过排查发现环境变量中的无效代理设置,清除后解决了apt更新问题。随后尝试安装NVIDIA驱动535版本以支持CUDA 12.1,但出现"Failed to initialize NVM

文章图片
#eureka#python
【音频标注】- deepseek-R1满血版 1.58 Bit模型落地部署(四)

本文记录了在Docker容器中部署deepseek-R1 1.58Bit大模型的过程。作者首先清理了无关Docker容器,新建容器并挂载必要路径,但在安装Anaconda和构建虚拟环境时遇到代理配置错误。通过排查发现环境变量中的无效代理设置,清除后解决了apt更新问题。随后尝试安装NVIDIA驱动535版本以支持CUDA 12.1,但出现"Failed to initialize NVM

文章图片
#eureka#python
【音频标注】- deepseek-R1满血版 1.58 Bit模型落地部署(三)

【摘要】本文详细记录了KTransformers高性能AI推理框架在Ubuntu服务器上的部署过程。面对CUDA路径识别异常、Python头文件缺失、C++扩展编译失败等多项技术挑战,通过系统性环境修复(安装Python开发包、显式设置CUDA路径)、手动编译策略(进入源码目录构建CMake)、智能安装优化(禁用依赖检查)等创新解决方案,成功构建了支持RTX 4090 GPU加速的推理环境。最终实

文章图片
【音频标注】- deepseek-R1满血版 1.58 Bit模型落地部署(三)

【摘要】本文详细记录了KTransformers高性能AI推理框架在Ubuntu服务器上的部署过程。面对CUDA路径识别异常、Python头文件缺失、C++扩展编译失败等多项技术挑战,通过系统性环境修复(安装Python开发包、显式设置CUDA路径)、手动编译策略(进入源码目录构建CMake)、智能安装优化(禁用依赖检查)等创新解决方案,成功构建了支持RTX 4090 GPU加速的推理环境。最终实

文章图片
【音频标注】- deepseek-R1满血版 1.58 Bit模型落地部署(二)

本文介绍了基于Docker部署DeepSeek-R1大模型的具体过程。首先阐述了显卡驱动、CUDA Toolkit等基础概念及其在宿主机和容器中的层级关系。然后详细记录了部署步骤:包括创建新Docker容器、处理flash_attn安装包、解决Torch版本冲突等问题。文中特别指出AutoDL环境下持久化存储的特殊性,并提供了虚拟环境迁移和假nvcc脚本的解决方案。最后描述了ktransforme

文章图片
#eureka#云原生#python
【音频标注】- deepseek-R1满血版 1.58 Bit模型落地部署(二)

本文介绍了基于Docker部署DeepSeek-R1大模型的具体过程。首先阐述了显卡驱动、CUDA Toolkit等基础概念及其在宿主机和容器中的层级关系。然后详细记录了部署步骤:包括创建新Docker容器、处理flash_attn安装包、解决Torch版本冲突等问题。文中特别指出AutoDL环境下持久化存储的特殊性,并提供了虚拟环境迁移和假nvcc脚本的解决方案。最后描述了ktransforme

文章图片
#eureka#云原生#python
【金融】- 搭建 图谱挖掘工作流 调研

知识图谱的多样性由目标、语义、规则等决定金融图谱工作流融合KG+LLM+多智能体技术主要挑战:数据质量、计算资源、协议标准化解决方案:利用Neo4j、AutoGen等现有工具搭建系统应用方向:就业规划、投资分析、创投机会挖掘

文章图片
#金融#neo4j#知识图谱
    共 17 条
  • 1
  • 2
  • 请选择