![](../../asset/images/user/bgImg_default.jpeg)
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
2025年新春,科技界迎来了一则重磅消息:DeepSeek开源发布了R1版本。尽管这是一个经过蒸馏的“小模型”(相较于大模型的参数量和训练算力需求),但其表现却能与OpenAI-O1-min相媲美。大模型的功能强大,但是高昂的部署和应用门槛依旧让普通人望而却步,如今的DeepSeek R1模型的各种蒸馏版本可以说真正让大模型“飞入寻常百姓家”了。那么,为什么要尝试本地部署开源大模型,比如DeepS
![文章图片](https://i-blog.csdnimg.cn/img_convert/e1308b80d0a71193e5309f8db7a65d3d.png)
想快速顺畅上手DeepSeek还不踩坑?**“真·满血DeepSeek-671B-R1/V3解决方案”**来了!它能解决的问题包括:服务器总繁忙充了钱却被残血模型欺骗费力拉新,遇上代金券失效背刺不懂代码,不会使用API接口模型不能联网查询实时信息数据隐私要求高,不想上传外网潞晨云官方现在提供以下服务:**免费通道:**不用拉新、不计代金券、不用充值。**联网搜索:**在线点击即用,体验加强版满血模
![文章图片](https://i-blog.csdnimg.cn/img_convert/9349a17db8ed058e19e097ceb5895129.jpeg)
这里大模型训练特指基座大模型的从0开始训练,不包括在2000条数据上SFT这样的小任务。有人说大模型嘛,简单,给我卡就行,等到老板真给你买来了1000张卡你就知道有多难了,老板说,小王,卡买来了,三个月给我搞出来。然后你发现,就算有人把正确的代码,数据,参数全告诉你,你也就够完整跑一次把它训练出来,万一中间服务器停电一次,完蛋交不了活儿了。更别提你要自己写模型代码,调试,想办法评估模型,根据结果反
阿里系第一个吃上“螃蟹”的出现了——已经全面接入DeepSeek系列模型。现在,用户在钉钉上创建AI助理的时候,可以直接选择DeepSeek系列的等模型!与此同时,钉钉还针对性地发布了全新模板,可以帮助用户一键创建、发布基于DeepSeek模型的AI助理。
![文章图片](https://i-blog.csdnimg.cn/img_convert/a88de2a7362b4c4eb345367cc0fb0fe5.png)
这个小册子是关于DeepSeek-R1图解的,主要有三个特点:1)我本人编写,免费开源,PDF专业排版,阅读学习体验更好些2)直观图解,更容易理解大模型基础和DeepSeek-R1的核心创新3)学完小册子能实现本地部署DeepSeek,为后期微调专属推理大模型做铺垫。小册子一共10页,6280字,15幅图。若觉得对你有用,可否点个关注。
![文章图片](https://i-blog.csdnimg.cn/img_convert/ccef452bff3be255d2142ff352e2d40a.png)
是一个为GPT/GLM等LLM大语言模型提供实用化交互接口。特别优化论文阅读/润色/写作体验,模块化设计,支持自定义快捷按钮&函数插件,支持Python和C++等项目剖析&自译解功能,PDF/LaTex论文翻译&总结功能,支持并行问询多种LLM模型,支持chatglm3等本地模型。接入通义千问, deepseekcoder, 讯飞星火, 文心一言, llama2, rwkv, claude2, m
![文章图片](https://i-blog.csdnimg.cn/blog_migrate/cover/3fcc4f36b41bec4d544f096d9596f96e.gif)
大模型正在重塑我们的学习和工作方式,不管你是选择使用 DeepSeek 还是自己部署大模型,最重要的是。
![文章图片](https://i-blog.csdnimg.cn/img_convert/d236c595c138e1bc5195e4bd5f0b76fd.png)
*,总参数量达到6710亿,每个标记(token)激活的参数量为370亿。**__******混合专家()是什么?******MoE不是将整个网络用于每个输入,而是学习计算成本低的映射函数,。同时,MoE模型还包含一个门控网络(或“路由器”),******GPT-4中如何应用MoE模型?**********?**专家混合系统(MoE)层:该层包含。**,减少模型冗余并提升性能。**********
![文章图片](https://i-blog.csdnimg.cn/img_convert/8714c0c8c07cdd607fe6ae8da617b2d8.png)
百家是首个专注于低资源历史人物数据的大模型,可用于大语言模型(LLMs)来进行基于 AI 的历史角色扮演。BaiJia 针对碎片化的历史文本记录形式多样、来源复杂等挑战,整合了多种历史人物的信息,包括其传记、文学作品、家族关系、历史事件等内容。我们在不同规模的开源基座模型(Qwen,DeepSeek,LLaMA)上进行实验,证明 BaiJia 语料库在提升多种基础 LLM 的角色扮演能力方面的有效
最近科技圈上演了一出"速度与激情"大戏——当硅谷还在讨论ChatGPT各种“挤牙膏”时,咱中国人自己的本土团队,直接把AI战场搬到了异次元!一夜之间,中国AI大模型平地惊雷、横扫硅谷,迅速引爆全球科技圈。DeepSeek-R1不仅性能媲美OpenAI O1,更做到了,它的发布,让我们可以更好的使用开源大语言模型运行推理任务。不过,因为DeepSeek实在是太火了,导致大家总是会遇到的情况……今天我
![文章图片](https://i-blog.csdnimg.cn/img_convert/f7c9eff72f9a1ceca0b8689b261afb4e.gif)