自己电脑搭建AI大模型详细教程，支持通义千问、Llama3、接口调用等，大模型入门到精通，收藏这篇就足够了！

今天教程关于在自己电脑搭建大模型，支持开源的大模型，像主流的通义千问2.5，Llama3，教程还包括如何使用这些大模型做接口调用，实现自动化输出。

菜鸟Java码农

867人浏览 · 2025-09-17 15:23:31

菜鸟Java码农 · 2025-09-17 15:23:31 发布

如下图所示，这是我自己的电脑安装的两个AI大模型，一个是qwen 7b尺寸，另一个是llama3 8b尺寸：

本地部署大模型有哪些好处呢？

首先，因为这些大模型都是开源的，安装在自己的电脑上也是免费使用的，如下图所示启动qwen7b后，我可以直接在命令窗口提问它，全球各地有记载的历史最低温度是多少？，后面是qwen的回复：

其次，安装大模型在自己电脑除了我们可以直接免费使用它外，还有一个很大的好处，就是我们可以结合自己的私有文件系统，打造一个大模型+个人知识库的AI系统，既保护了个人数据隐私，也让AI「更懂你」。

大模型的一些基本知识科普

可能点进来看我这篇文章的朋友，有不同行业、不同专业的，可能对一些大模型的基本概念不太了解，下面就先做一个基本梳理。

其中比较重要的比如qwen7b, llama8b，这里的7b、8b代表什么？

b是英文的billion，意思是十亿，7b就是70亿，8b就是80亿，70亿、80亿是指大模型的神经元参数（权重参数 weight+bias）的总量。目前大模型都是基于Transformer架构，并且是很多层的Transformer结构，最后还有全连接层等，所有参数加起来70亿，80亿，还有的上千亿。

大模型和我们自己基于某个特定数据集（如 ImageNet、20NewsGroup）训练的模型在本质上存在一些重要区别。主要区别之一在于，大模型通常更加通用，这是因为它们基于大量多样化的数据集进行训练，涵盖了不同领域和任务的数据。这种广泛的学习使得大模型具备了较强的知识迁移能力和多任务处理能力，从而展现出“无所不知、无所不晓”的特性。

相比之下，我们基于单一数据集训练的模型通常具有较强的针对性，但其知识范围仅限于该数据集的领域或问题。因此，这类模型的应用范围较为局限，通常只能解决特定领域或单一任务的问题。

Scaling Laws这个词大家可能在很多场合都见到过。它是一个什么法则呢？

大模型之所以能基于大量多样化的数据集进行训练，并最终“学得好”，核心原因之一是Scaling Laws（扩展规律）的指导和模型自身架构的优势。Scaling Laws指出参数越多，模型学习能力越强；训练数据规模越大、越多元化，模型最后就会越通用；即使包括噪声数据，模型仍能通过扩展规律提取出通用的知识。而Transformer这种架构正好完美做到了Scaling Laws，Transformer就是自然语言处理领域实现扩展规律的最好的网络结构。

知道这些基本知识后，我们回到安装大模型到本地步骤上。一共只需要三步就能做到和大模型在本地会话。

第一步，我使用的是ollama管理各种不同大模型，当然还有其他工具，不过ollama是比较直接、比较干净的，如下所示，一键下载后安装就行了，安装过程基本都是下一步：

不知道去哪里下载的，可以直接在我的公众号后台回复：ollama，下载这个软件，然后装上：

安装后，打开命令窗口，输入ollama，然后就能看到它的相关指令，一共10个左右的命令，就能帮我们管理好不同大模型：

第二步，命令窗口输入：ollama pull qwen:7b，下载大模型qwen7b到我们自己的电脑：

同理，执行 ollama pull llama3:8b，下载大模型llama8b到本地。

ollama list，列举出当前已经安装的大模型：

ollama show qweb:7b，看到模型的基本信息，执行后看到qwen7b模型的基本信息，如下图所示：

模型的基本信息解释如下：

架构qwen2，7.7b参数，32768的上下文处理长度，4096词向量嵌入维度，Q4_0的四位量化技术。

第三步，ollama run qwen:7b，执行这条命令后，我们就可以和大模型对话了：

如下所示，大模型一般都支持多语言会话：

以上就是本地搭建AI大模型的三个步骤。

接下来，我再介绍一个比较常用的，尤其是想深入一步使用大模型接口做开发的。

ollama也支持接口开发，它默认的端口是11434，打开浏览器后，输入下面命令，会得到一个字符串输出：ollama is running:

基于上面已经搭建好的ollama+大模型qwen:7b，我们可以编写几行代码，使用ollama的接口，自动执行大模型会话。

非常实用！

具体来说，最精简版代码不到10行，首先pip安装requests包，然后执行下面代码：

自动输出下面的回答：

所以，当你有很多任务需要执行时，能通过API调用就会非常省事，自动给你回复，自动给你干活。

上面的url就是API接口的地址，payload是三个必须要传入的参数，使用Python的requests包自动发送请求，然后response得到结果。

以上就是API调用的完整步骤。

总结一下

这篇教程总结了自己电脑搭建大模型的步骤，以及自动调用大模型API的步骤。

最后说一下电脑所需要的配置，一般来说安装上面尺寸的大模型目前电脑都可以，不过大模型回答你的速度会有区别，电脑带有GPU显卡且显存大于等于8G的回答会比较流畅，低于这个配置的就会有些卡顿，但是不至于不能使用。

想入门 AI 大模型却找不到清晰方向？备考大厂 AI 岗还在四处搜集零散资料？别再浪费时间啦！2025 年 AI 大模型全套学习资料已整理完毕，从学习路线到面试真题，从工具教程到行业报告，一站式覆盖你的所有需求，现在全部免费分享！

👇👇扫码免费领取全部内容👇👇

一、学习必备：100+本大模型电子书+26 份行业报告 + 600+ 套技术PPT，帮你看透 AI 趋势

想了解大模型的行业动态、商业落地案例？大模型电子书？这份资料帮你站在 “行业高度” 学 AI：

1. 100+本大模型方向电子书

在这里插入图片描述

2. 26 份行业研究报告：覆盖多领域实践与趋势

报告包含阿里、DeepSeek 等权威机构发布的核心内容，涵盖：

职业趋势：《AI + 职业趋势报告》《中国 AI 人才粮仓模型解析》；
商业落地：《生成式 AI 商业落地白皮书》《AI Agent 应用落地技术白皮书》；
领域细分：《AGI 在金融领域的应用报告》《AI GC 实践案例集》；
行业监测：《2024 年中国大模型季度监测报告》《2025 年中国技术市场发展趋势》。

3. 600+套技术大会 PPT：听行业大咖讲实战

PPT 整理自 2024-2025 年热门技术大会，包含百度、腾讯、字节等企业的一线实践：

在这里插入图片描述

安全方向：《端侧大模型的安全建设》《大模型驱动安全升级（腾讯代码安全实践）》；
产品与创新：《大模型产品如何创新与创收》《AI 时代的新范式：构建 AI 产品》；
多模态与 Agent：《Step-Video 开源模型（视频生成进展）》《Agentic RAG 的现在与未来》；
工程落地：《从原型到生产：AgentOps 加速字节 AI 应用落地》《智能代码助手 CodeFuse 的架构设计》。

二、求职必看：大厂 AI 岗面试 “弹药库”，300 + 真题 + 107 道面经直接抱走

想冲字节、腾讯、阿里、蔚来等大厂 AI 岗？这份面试资料帮你提前 “押题”，拒绝临场慌！

1. 107 道大厂面经：覆盖 Prompt、RAG、大模型应用工程师等热门岗位

面经整理自 2021-2025 年真实面试场景，包含 TPlink、字节、腾讯、蔚来、虾皮、中兴、科大讯飞、京东等企业的高频考题，每道题都附带思路解析：

2. 102 道 AI 大模型真题：直击大模型核心考点

针对大模型专属考题，从概念到实践全面覆盖，帮你理清底层逻辑：

3. 97 道 LLMs 真题：聚焦大型语言模型高频问题

专门拆解 LLMs 的核心痛点与解决方案，比如让很多人头疼的 “复读机问题”：

三、路线必明： AI 大模型学习路线图，1 张图理清核心内容

刚接触 AI 大模型，不知道该从哪学起？这份「AI大模型学习路线图」直接帮你划重点，不用再盲目摸索！

在这里插入图片描述

路线图涵盖 5 大核心板块，从基础到进阶层层递进：一步步带你从入门到进阶，从理论到实战。

L1阶段:启航篇丨极速破界AI新时代

L1阶段：了解大模型的基础知识，以及大模型在各个行业的应用和分析，学习理解大模型的核心原理、关键技术以及大模型应用场景。

L2阶段：攻坚篇丨RAG开发实战工坊

L2阶段：AI大模型RAG应用开发工程，主要学习RAG检索增强生成：包括Naive RAG、Advanced-RAG以及RAG性能评估，还有GraphRAG在内的多个RAG热门项目的分析。

L3阶段：跃迁篇丨Agent智能体架构设计

L3阶段：大模型Agent应用架构进阶实现，主要学习LangChain、 LIamaIndex框架，也会学习到AutoGPT、 MetaGPT等多Agent系统，打造Agent智能体。

L4阶段：精进篇丨模型微调与私有化部署

L4阶段：大模型的微调和私有化部署，更加深入的探讨Transformer架构，学习大模型的微调技术，利用DeepSpeed、Lamam Factory等工具快速进行模型微调，并通过Ollama、vLLM等推理部署框架，实现模型的快速部署。

L5阶段：专题集丨特训篇【录播课】

四、资料领取：全套内容免费抱走，学 AI 不用再找第二份

不管你是 0 基础想入门 AI 大模型，还是有基础想冲刺大厂、了解行业趋势，这份资料都能满足你！
现在只需按照提示操作，就能免费领取：

👇👇扫码免费领取全部内容👇👇

2025 年想抓住 AI 大模型的风口？别犹豫，这份免费资料就是你的 “起跑线”！

北京朝阳AI社区

更多推荐

通用人工智能正在革新搜索

搜索的未来无疑与人工智能紧密相连。大多数用户很快将探索并适应这种新的查找和获取信息的方式，而数据和技术素养将成为降低虚假信息、偏见、歧视和较小批判性思维风险的关键。随着搜索引擎演变成回答机器，公司需要调整其策略以保持可见性和相关性。将会有越来越多的需求来开发确保其内容被适当索引、可检索并由人工智能驱动的搜索引擎生成的技术。对于提供搜索功能的公司来说，也有机会探索基于人工智能的搜索能为他们的用户带来

北京朝阳AI社区

论文解读|危机中的歧义性：多模态与合成数据分类方法

社交媒体平台，如 Twitter（现更名为 X），通过实现实时信息共享，在危机期间发挥着至关重要的作用。然而，多模态数据可能存在歧义，且模态间的标签可能出现错位。能够对“有信息量”和“无信息量”的推文进行分类有助于危机响应，但这些数据在数据集中往往具有歧义性且分布不平衡，从而削弱模型性能。本研究探讨了多模态学习方法在对危机相关推文进行分类（无论其是否存在歧义）方面的有效性，并通过使用生成式人工智能