logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek R1模型的本地部署教程(非常详细)DeepSeek本地部署教程,收藏这一篇就够了!

2025年新春,科技界迎来了一则重磅消息:DeepSeek开源发布了R1版本。尽管这是一个经过蒸馏的“小模型”(相较于大模型的参数量和训练算力需求),但其表现却能与OpenAI-O1-min相媲美。大模型的功能强大,但是高昂的部署和应用门槛依旧让普通人望而却步,如今的DeepSeek R1模型的各种蒸馏版本可以说真正让大模型“飞入寻常百姓家”了。那么,为什么要尝试本地部署开源大模型,比如DeepS

文章图片
#人工智能#机器学习#面试 +1
免费!满血版DeepSeek丝滑畅玩,低门槛实现671B-R1/V3自由,潞晨云上新

想快速顺畅上手DeepSeek还不踩坑?**“真·满血DeepSeek-671B-R1/V3解决方案”**来了!它能解决的问题包括:服务器总繁忙充了钱却被残血模型欺骗费力拉新,遇上代金券失效背刺不懂代码,不会使用API接口模型不能联网查询实时信息数据隐私要求高,不想上传外网潞晨云官方现在提供以下服务:**免费通道:**不用拉新、不计代金券、不用充值。**联网搜索:**在线点击即用,体验加强版满血模

文章图片
#计算机视觉#人工智能#深度学习 +1
大模型训练真的太难了!

这里大模型训练特指基座大模型的从0开始训练,不包括在2000条数据上SFT这样的小任务。有人说大模型嘛,简单,给我卡就行,等到老板真给你买来了1000张卡你就知道有多难了,老板说,小王,卡买来了,三个月给我搞出来。然后你发现,就算有人把正确的代码,数据,参数全告诉你,你也就够完整跑一次把它训练出来,万一中间服务器停电一次,完蛋交不了活儿了。更别提你要自己写模型代码,调试,想办法评估模型,根据结果反

#python#人工智能#深度学习 +4
钉钉真勇!率先接入DeepSeek,阿里系第一个吃螃蟹

阿里系第一个吃上“螃蟹”的出现了——已经全面接入DeepSeek系列模型。现在,用户在钉钉上创建AI助理的时候,可以直接选择DeepSeek系列的等模型!与此同时,钉钉还针对性地发布了全新模板,可以帮助用户一键创建、发布基于DeepSeek模型的AI助理。

文章图片
#人工智能#神经网络#深度学习 +1
DeepSeek入门教程,《DeepSeek图解10页PDF》,附免费PDF!

这个小册子是关于DeepSeek-R1图解的,主要有三个特点:1)我本人编写,免费开源,PDF专业排版,阅读学习体验更好些2)直观图解,更容易理解大模型基础和DeepSeek-R1的核心创新3)学完小册子能实现本地部署DeepSeek,为后期微调专属推理大模型做铺垫。小册子一共10页,6280字,15幅图。若觉得对你有用,可否点个关注。

文章图片
#算法#机器学习#面试 +2
学术打工人必看!手把手教你在本地搭建学术大模型框架,支持多智能体!提升你的科研效率!你确定不试试?

是一个为GPT/GLM等LLM大语言模型提供实用化交互接口。特别优化论文阅读/润色/写作体验,模块化设计,支持自定义快捷按钮&函数插件,支持Python和C++等项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持chatglm3等本地模型。接入通义千问, deepseekcoder, 讯飞星火, 文心一言, llama2, rwkv, claude2, m

文章图片
#搜索引擎#自然语言处理#人工智能 +2
大模型部署全攻略!手把手教你部署开源 DeepSeek,告别访问受限困扰!

大模型正在重塑我们的学习和工作方式,不管你是选择使用 DeepSeek 还是自己部署大模型,最重要的是。

文章图片
#人工智能#机器学习#面试 +1
一文搞懂DeepSeek - 混合专家(MoE)

*,总参数量达到6710亿,每个标记(token)激活的参数量为370亿。**__******混合专家()是什么?******MoE不是将整个网络用于每个输入,而是学习计算成本低的映射函数,。同时,MoE模型还包含一个门控网络(或“路由器”),******GPT-4中如何应用MoE模型?**********?**专家混合系统(MoE)层:该层包含。**,减少模型冗余并提升性能。**********

文章图片
#学习#人工智能#计算机视觉 +3
北邮团队发布百家(BaiJia)大模型:用AI对话古人,开启沉浸式历史体验

百家是首个专注于低资源历史人物数据的大模型,可用于大语言模型(LLMs)来进行基于 AI 的历史角色扮演。BaiJia 针对碎片化的历史文本记录形式多样、来源复杂等挑战,整合了多种历史人物的信息,包括其传记、文学作品、家族关系、历史事件等内容。我们在不同规模的开源基座模型(Qwen,DeepSeek,LLaMA)上进行实验,证明 BaiJia 语料库在提升多种基础 LLM 的角色扮演能力方面的有效

#人工智能#知识图谱#深度学习 +2
在手机上也能本地运行DeepSeek了?!手机运行DeepSeek教程,收藏这一篇就够了!

最近科技圈上演了一出"速度与激情"大戏——当硅谷还在讨论ChatGPT各种“挤牙膏”时,咱中国人自己的本土团队,直接把AI战场搬到了异次元!一夜之间,中国AI大模型平地惊雷、横扫硅谷,迅速引爆全球科技圈。DeepSeek-R1不仅性能媲美OpenAI O1,更做到了,它的发布,让我们可以更好的使用开源大语言模型运行推理任务。不过,因为DeepSeek实在是太火了,导致大家总是会遇到的情况……今天我

文章图片
#人工智能#深度学习#神经网络 +2
    共 24 条
  • 1
  • 2
  • 3
  • 请选择