logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcement Learning 论文重点部分翻译和要点解读

推理任务:(1) DeepSeek-R1在AIME 2024上实现了79.8%的Pass@1得分,略高于OpenAI-o1-1217。在MATH-500上,它取得了令人印象深刻的97.3%得分,与OpenAI-o1-1217持平,并显著超越其他模型。(2) 在与编码相关的任务中,DeepSeek-R1展示了专家级别的能力,在Codeforces竞赛中获得了2,029的Elo评分,超过了96.3%的

文章图片
#人工智能#深度学习#机器学习
LLM Studio本地部署deepseek的API调用,基于Python实现简易对话客户端

本教程将详细介绍如何使用LM Studio在本地部署DeepSeek大模型,并构建一个带图形界面的聊天应用。教程从模型导入到客户端开发,适合零基础用户跟随操作。

文章图片
#python#开发语言
从UNet训练到TensorRT部署:完整语义分割模型部署优化指南(windows版本)

本文详细介绍了从UNet模型训练到TensorRT部署的完整流程,涵盖了数据准备、模型训练、ONNX导出、TensorRT优化以及Python/C++推理实现等关键环节。通过TensorRT部署,我们能够显著提升模型的推理速度,满足实际生产环境对实时性的要求

文章图片
#python#c++#计算机视觉 +1
零基础本地部署DEEPSEEK大模型教程(LM Studio版)

上面两部主要是看CUDA是否成功加载,不然是CPU跑可能就很慢,一般来说都没有问题,有问题可能需要安装CUDA的库。在框中输入刚才搜的模型,因为你搜的模型会告诉你这个模型是否符合你的电脑配置,注:DEEPSEEK R1的GGUF量化版(如Q4_K_M)约需8GB显存。国内网盘镜像(含DEEPSEEK R1各量化版本): 暂未上传。:消费级显卡即可运行(实测NVIDIA 4060s流畅运行)(使用V

文章图片
#语言模型#人工智能#深度学习
图像分割大模型SAM2 ONNX导出部署全流程

图像分割大模型的onnx部署简单部署流程

文章图片
#人工智能#算法#python
Python手把手搭建基于Deepseek大模型的本地知识库

在前面的文章,我介绍了基于LM studio的大模型部署和API调用,本文将介绍一个实际的项目案例,即利用Python构建一个本地化的知识库来加深大家对于大模型本地化应用的理解。构建基于Python的大模型本地知识库成为提升信息检索效率和保障数据隐私的关键手段。对于企业和个人用户而言,这不仅能加速日常工作的信息查找过程,支持更明智的决策制定,同时也提供了一个深入学习最新自然语言处理技术的机会。

文章图片
#python#开发语言#RAG
    共 45 条
  • 1
  • 2
  • 3
  • 4
  • 5
  • 请选择