logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

利用这些“大模型部署工具”轻松部署属于你自己的AIGC大模型吧!

该工具由Fitten与清华大学联合开发,当前支持4个语言大模型,具体包括:ChatGLM、盘古、ChatRWKV、LLaMA。该工具链支持多种硬件设备,除了支持主流的NVIDIA、AMD、Ascend硬件外,还支持天数智芯、中科海光和摩尔线程的硬件设备!InferLLM 是一个非常轻量的 LLM 模型推理框架,主要参考和借鉴了 llama.cpp 工程,llama.cpp 几乎所有核心代码和 ke

文章图片
#AIGC#web安全#测试工具 +3
家用电脑安装DeepSeek-R1大模型懒人教程

最近摸索了下本地部署DeepSeek,做一个简单教程放在这里共享,以Windows系统为例,适合初学者,高手请忽略。01、电脑浏览器访问https://ollama.com/,依次点击下图中红框按钮,把ollama软件下载到电脑并双击安装(ollama是通用AI大模型承载平台,相当于先打个地基)。

文章图片
#自然语言处理#人工智能#产品经理 +1
一文搞懂DeepSeek - 多头注意力(MHA)和多头潜在注意力(MLA)

最后呢,会给大家一个小福利,课程视频中的所有素材,有搭建AI开发环境资料包,还有学习计划表,几十上百G素材、电子书和课件等等,只要你能想到的素材,我这里几乎都有。在做这套教程之前呢,我就曾放空大脑,以一个大模型小白的角度去重新解析它,采用基础知识和实战项目相结合的教学方式,历时3个月,终于完成了这样的课程,让你真正体会到什么是每一秒都在疯狂输出知识点。拼接与融合:将所有头的输出拼接在一起,形成一个

文章图片
#人工智能#自然语言处理#开源 +2
一文读懂2025核心概念 AI Agent:科技巨头都在布局的未来赛道

经过以上的分享,大家都直观感受到了AI Agent的重要意义。。DeepSeek,Qwen等强力大模型的出现为AI Agent提供了良好的模型基础,使其可以构建更大更强的智能体系统。AI Agent的发展又让AGI(通用人工智能,旨在创造一个能像人类一样思考、学习、执行多种任务的系统)的美好愿景逐渐成为现实,未来的世界一定是人工智能的世界!

文章图片
#人工智能#科技#javascript +1
Deepseek在药企研发领域的本地化部署和应用场景-2025(附PDF下载)

在新药研发这条烧钱又烧脑的赛道上,谁能把AI用得好,谁就更可能抢占先机。这份内部资料详细梳理了DeepSeek-R1模型在药企场景中的本地部署方式及其与智慧芽平台的融合应用。不同于泛泛而谈的AI赋能,这里直接落到了药物分子设计、临床前毒理预测、临床一期剂量推荐、代谢产物推测等实际研发流程中,甚至还展示了通过智能体一键生成分子动力学模拟图的完整流程。

文章图片
#人工智能#机器学习#深度学习 +2
开源、离线、免费商用的大模型知识库来袭!快速搭建个人和企业私有智能知识库!

项目名称:Langchain-Chatchat``项目地址:https://github.com/chatchat-space/Langchain-Chatchat📺 原理介绍视频(点击可看视频)

文章图片
#开源#架构#机器学习 +3
一文搞懂DeepSeek的技术演进之路:大语言模型、视觉语言理解、多模态统一模型

DeepSeekLLM,旨在通过长期视角推动开源语言模型的发展。数据收集与预处理:首先,开发了一个包含2万亿token的数据集,并对其进行去重、过滤和重新混合。去重阶段通过跨多个dump进行去重,过滤阶段通过详细的语义和语言学评估来增强数据密度,重新混合阶段则通过增加代表性不足领域的存在来平衡数据。表1|各种常见 Crawl dumps 去重比率DeepSeek LLM的微观设计主要遵循LLaMA

文章图片
#语言模型#人工智能#自然语言处理 +1
Ollama:一个在本地部署、运行大型语言模型的工具

所谓自定义模型就是不适用Ollama官方模型库中的模型,理论可以使用其他各类经过转换处理的模型Ollama库中的模型可以通过提示进行自定义。# 设置温度参数# 设置SYSTEM 消息SYSTEM """作为AI智能助手,你将竭尽所能为员工提供严谨和有帮助的答复。"""Modelfile文档One-API是一个OpenAI接口管理 & 分发系统,支持各类大模型。这里使用Docker快速进行部署。拉取

文章图片
#人工智能#产品经理
Deepseek为什么选择蒸馏模型?一文彻底搞懂大模型蒸馏技术

模型蒸馏(Model Distillation)是一种将大型、复杂模型(通常称为“教师模型”)的知识转移到小型、简单模型(通常称为“学生模型”)的技术。其核心思想是通过模仿教师模型的输出,使学生模型在保持较高性能的同时,显著减少模型的大小和计算复杂度。举个例子:想象你是一个老师(教师模型),你要教一个学生(学生模型)如何解一道复杂的数学题。你告诉学生每个步骤的解题思路,解释为什么要这样做。虽然学生

文章图片
#算法#人工智能#python +1
多图详解 DeepSeek-R1 !看完这篇就够了

DeepSeek-R1 是AI发展过程中的里程碑式工作。在这篇文章中,我们将一起了解DeepSeek-R1是如何构建出来的。和目前大多数大语言模型类似,DeepSeek-R1 也是通过一次生成一个 token(词元)的方式来工作。但它在数学和推理问题上的表现尤为突出,这是因为它能够花更多的“思考时间”,通过生成“thinking tokens”的方式来解释自己的推理过程。DeepSeek-R1 的

文章图片
#人工智能#机器学习#深度学习 +2
    共 111 条
  • 1
  • 2
  • 3
  • 12
  • 请选择