基于Ollama与Streamlit的本地AI工具ThunderAI部署与实战指南

大语言模型（LLM）作为当前人工智能领域的核心技术，通过在海量文本数据上训练，具备了强大的自然语言理解和生成能力。其工作原理基于Transformer架构，通过自注意力机制捕捉长距离依赖关系，从而实现对复杂语义的建模。这项技术的核心价值在于能够将通用知识转化为可交互的智能服务，显著提升信息处理与内容创作的效率。在实际工程应用中，本地化部署成为保障数据隐私、控制长期成本的关键需求，尤其适用于处理敏感

不想上吊王承恩

303人浏览 · 2026-05-17 12:08:35

不想上吊王承恩 · 2026-05-17 12:08:35 发布

1. 项目概述：一个本地化的AI对话与文件处理工具

最近在折腾本地AI应用的时候，发现了一个挺有意思的项目，叫“ThunderAI”。这名字听着挺唬人，但本质上，它是一个让你能在自己电脑上跑起来的AI对话和文件处理工具。简单来说，它就像是一个为你个人电脑打造的、功能更聚焦的“ChatGPT”，而且完全离线，数据隐私有保障。

这个项目的核心价值在于“本地化”和“易用性”。它把大语言模型（LLM）的部署和交互门槛降得非常低。你不需要懂复杂的命令行，也不用去研究各种晦涩的模型参数，通过一个清爽的图形界面，就能完成模型下载、对话、文件上传分析等一系列操作。对于想体验本地AI能力，但又不想被技术细节劝退的开发者、内容创作者，甚至是普通的技术爱好者来说，ThunderAI提供了一个非常平滑的入口。

我花了一些时间深度使用和拆解了它，发现其设计思路非常清晰： 以Web界面为交互核心，以Ollama为模型后端引擎，再集成实用的文件处理能力 。接下来，我会从设计思路、核心功能实现、实操部署，再到常见问题，为你完整拆解这个项目，并分享我在部署和使用过程中踩过的坑和总结的经验。

2. 整体设计与核心思路拆解

2.1 为什么选择“本地化”作为核心赛道？

在云服务大行其道的今天，为什么还要做本地化的AI工具？这背后有几个非常实际的考量点。

首先是 数据隐私与安全 。当你把公司文档、个人笔记、创意草稿上传到云端AI服务时，数据就离开了你的控制范围。虽然主流服务商都有隐私政策，但对于涉及敏感信息或核心知识产权的场景，本地处理是唯一让人安心的选择。ThunderAI瞄准的正是这部分“数据敏感型”用户的需求。

其次是 成本可控与长期可用性 。云端AI API是按调用次数或Token数量收费的，对于高频使用的用户，这是一笔不小的持续开销。本地部署虽然前期需要一定的硬件投入（主要是显卡），但一旦部署完成，后续的推理成本几乎为零。对于开发者测试、个人学习、甚至小团队的内部工具而言，本地化方案在长期来看更具经济性。

最后是 定制化与可控性 。云端模型通常是固定的，你无法干预其训练数据、微调过程。而本地部署允许你自由选择模型，从70亿参数到700亿参数，从通用对话到代码专用，你可以根据你的硬件能力和任务需求，搭配出最适合的组合。ThunderAI通过集成Ollama，将这种模型选择的灵活性变成了图形界面上的几个点击操作。

2.2 技术栈选型：为什么是Ollama + Web UI？

ThunderAI的技术选型非常务实，可以说是站在了巨人的肩膀上。

后端引擎：Ollama Ollama是目前最流行的本地大语言模型运行和管理的命令行工具。它的优势在于“开箱即用”。你只需要一条简单的命令，如 ollama run llama3.2 ，就能自动下载并启动对应的模型。Ollama负责了最复杂的部分：模型格式转换、内存优化、GPU加速集成（通过CUDA）等。ThunderAI没有重复造轮子，而是选择成为Ollama的一个“图形化外壳”，通过调用Ollama提供的API（通常是 http://localhost:11434 ）来发送请求和接收响应。这种设计让ThunderAI的核心可以保持轻量，并随着Ollama对更多模型和硬件的支持而自动获益。

前端界面：Streamlit 整个用户界面是基于Streamlit构建的。这是一个用Python快速创建数据应用Web界面的框架。对于ThunderAI这类工具来说，Streamlit几乎是完美选择：

开发效率极高 ：用纯Python脚本就能定义界面元素和交互逻辑，避免了前后端分离的复杂架构。
适合交互式应用 ：其“脚本从上到下执行，交互触发重新运行”的模式，非常适合聊天这种一问一答的场景。
生态丰富 ：有大量的UI组件（聊天框、文件上传、侧边栏）可以直接使用，能快速构建出美观实用的界面。

这个选型决定了ThunderAI的“气质”：它是一个由Python开发者为主要目标用户，追求快速迭代和实用性的工具。

2.3 功能矩阵：不止于聊天

如果只是一个聊天的壳子，那价值有限。ThunderAI在基础对话之上，增加了几个关键功能点，构成了它的核心竞争力：

多模型管理与热切换 ：你可以在界面中管理多个已下载的模型，并在对话中随时切换。比如，用 llama3.2 进行创意写作，遇到代码问题瞬间切换到 deepseek-coder 模型，无需重启任何服务。
本地文件内容读取与分析 ：这是它的杀手级功能。支持上传TXT、PDF、Word、Excel、PPT甚至图片文件，并提取其中的文字内容，将其作为上下文发送给AI进行分析、总结、翻译或问答。这直接将AI从“空谈”变成了能处理你手头具体工作的“助理”。
对话历史管理 ：所有对话记录都保存在本地（通常是项目目录下的 database 文件夹里），可以随时查看、回溯，甚至为历史对话重命名以便查找。这构建了属于你个人的知识交互库。
参数可视化调节 ：虽然面向新手，但也提供了温度（Temperature）、最大生成长度等关键参数的调节滑块，让进阶用户能微调AI的“创造力”和“专注度”。

这套功能组合拳，使得ThunderAI从一个玩具，变成了一个能真正融入个人工作流的效率工具。

3. 核心模块解析与实操要点

3.1 模型管理模块：连接Ollama的桥梁

这是整个应用的基石。其核心逻辑是封装了对Ollama API的调用。

实现原理 ： ThunderAI会尝试连接本地 11434 端口的Ollama服务。通过调用Ollama的 /api/tags 接口，获取本地已下载的模型列表。当你选择某个模型并发送消息时，前端会将消息内容、选定的模型名以及参数设置，打包成一个JSON请求，通过POST方法发送到Ollama的 /api/generate 接口。Ollama在后台进行模型推理，并以流式（streaming）的方式返回结果，ThunderAI的前端则实时地将这些流式数据渲染到聊天界面上。

实操要点与避坑 ：

注意：务必先确保Ollama服务已正确安装并运行。在终端输入 ollama serve 或确保Ollama后台服务已启动。这是99%的连接问题的根源。

模型下载慢或失败 ：Ollama默认从官方仓库拉取模型。国内网络环境可能很慢。解决方法是在Ollama启动前设置环境变量：
```
export OLLAMA_HOST=0.0.0.0 # 如果需要远程访问
export OLLAMA_MODELS=/path/to/your/models # 自定义模型存储路径（可选）
```
对于网络问题，更有效的方法是使用镜像源。但请注意，这里讨论的是模型下载的镜像源，与网络访问工具无关。你可以通过修改Ollama的配置文件或使用第三方工具来加速下载，但这部分需要你自行搜索可靠的、合规的国内镜像源解决方案。
GPU未被利用 ：如果你有NVIDIA显卡，Ollama默认应尝试使用CUDA。可以通过运行 ollama run llama3.2 并观察输出日志，看是否有 “Using GPU” 或类似的提示。如果没有，可能需要手动安装对应版本的CUDA驱动和cuDNN库，并确保你的Ollama版本支持GPU。

3.2 文件处理模块：从多格式到纯文本

这个模块的技术含量不低，它需要集成多个文档解析库。

实现原理 ：

文件上传与类型判断 ：Streamlit的 st.file_uploader 组件负责接收文件，并根据文件后缀名判断类型。
分派解析器 ：
- TXT ：直接读取。
- PDF ：使用 PyPDF2 或 pdfplumber 库逐页提取文字。 pdfplumber 在表格提取上通常更准确。
- DOCX/DOC ：使用 python-docx 库遍历文档段落。
- PPTX ：使用 python-pptx 库遍历幻灯片和文本框。
- Excel ：使用 pandas 库读取，可以选择将每个工作表或所有数据转换为CSV格式的文本。
- 图片：使用 PIL (Pillow) 进行图像处理，并集成 pytesseract 调用Tesseract OCR引擎进行文字识别。 这是最耗资源且准确率最依赖图片质量的一环。
文本预处理与上下文构造 ：提取出的原始文本通常会进行一些清洗（如去除过多换行、乱码），然后被拼接成一个字符串，并在前面加上诸如“这是上传文件的内容：”之类的提示词，最终作为用户消息的一部分发送给AI模型。

实操心得 ：

PDF解析的坑 ：扫描版PDF（即图片型PDF）用普通的 PyPDF2 是提取不出文字的，必须依赖OCR。ThunderAI如果集成了OCR功能，那么处理这类PDF会非常慢。对于纯文本PDF， pdfplumber 的提取质量通常更好。
文件大小限制 ：Streamlit默认对上传文件有大小限制（200MB左右）。虽然可以调整，但需要警惕超大文件。一个100页的PDF解析出的文本，可能轻松超过数万字符，而大多数LLM有上下文长度限制（如4096、8192 tokens）。超出部分会被截断。因此，上传前最好自己对大文件进行初步拆分或总结。
隐私提醒 ：正因为文件在本地被解析，你的数据从未离开你的电脑。这是与上传到任何云端服务最本质的区别，也是核心优势。

3.3 对话与历史管理模块：构建本地知识库

这个模块负责让对话变得有“记忆”和可管理。

实现原理 ：

对话存储 ：通常使用轻量级数据库如SQLite，或者直接使用JSON文件。每段对话被保存为一个记录，包含对话ID、标题（可能由AI生成或用户修改）、创建时间、以及完整的消息列表（一个由用户和AI消息交替组成的数组）。
上下文维护 ：在每次向AI发送请求时，应用需要从数据库中取出当前对话的历史消息，并将其作为“上下文”随本次提问一起发送给Ollama。这样AI才能实现连贯的多轮对话。这里的关键是管理上下文长度，避免因历史过长导致超出模型限制或性能下降。一些实现会采用“滑动窗口”机制，只保留最近N条消息。
界面交互 ：侧边栏列出所有历史对话，点击即可加载。通常还提供“新建对话”、“删除对话”、“重命名对话”的按钮。

注意事项 ：

数据库文件位置 ：历史数据默认保存在项目目录下。如果你要备份或迁移ThunderAI，别忘了备份这个数据库文件（通常是 .db 或 .json 文件）。
性能影响 ：当单轮对话历史非常长时，每次请求携带的上下文数据量很大，可能会略微增加请求延迟。对于超长对话，可以考虑手动点击“清理上下文”或开启“自动总结上下文”的功能（如果项目后续实现的话）。

4. 从零开始的完整部署与配置实操

下面，我将以一台安装了Windows 11系统、拥有NVIDIA RTX 4060显卡的电脑为例，展示ThunderAI的完整部署过程。Linux和macOS的步骤类似，主要区别在环境准备环节。

4.1 基础环境准备：Python与Ollama

步骤1：安装Python ThunderAI是一个Python应用，所以首先需要Python环境。建议使用Python 3.9 - 3.11版本，兼容性最好。

访问Python官网下载安装包。
安装时， 务必勾选“Add Python to PATH” ，这样才可以在命令行中直接使用 python 和 pip 命令。
安装完成后，打开命令提示符（CMD）或PowerShell，输入 python --version 和 pip --version 验证是否安装成功。

步骤2：安装并配置Ollama

前往Ollama官网，下载Windows版本的安装包。
双击安装，安装程序会自动将Ollama添加到系统路径并启动后台服务。
安装完成后，打开一个新的终端（CMD或PowerShell），测试Ollama是否正常工作：
```
ollama --version
```
拉取你的第一个模型。我们从一个小模型开始，测试流程：
```
ollama pull llama3.2:3b
```
这个 llama3.2:3b 模型只有30亿参数，下载快，对硬件要求极低，适合初次验证。等待下载完成。

步骤3：验证Ollama服务

确保Ollama服务正在运行。你可以在系统托盘找到Ollama图标，确认它是运行状态。
在终端中进行一次简单的命令行对话测试：
```
ollama run llama3.2:3b
```
输入“Hello”，看AI是否能正常回复。输入 /bye 退出。

4.2 获取与运行ThunderAI

步骤1：获取项目代码 由于ThunderAI是一个开源项目，我们需要从代码托管平台获取它。这里假设我们使用Git。

如果未安装Git，请先安装Git。
在你想存放项目的目录（例如 D:\Projects ）下打开终端，执行克隆命令：
```
git clone https://github.com/micz/ThunderAI.git
cd ThunderAI
```
（请注意，上述地址为示例，实际地址请以项目官方页面为准。）

步骤2：安装Python依赖 项目根目录下通常会有一个 requirements.txt 文件，列出了所有必需的Python库。

在终端中（确保位于ThunderAI项目目录下），运行：
```
pip install -r requirements.txt
```
这个过程会安装Streamlit、PyPDF2、python-docx、pandas、pillow等所有依赖库。如果安装缓慢，可以考虑配置pip的国内镜像源。

步骤3：首次运行ThunderAI 依赖安装完成后，直接使用Streamlit运行主程序。

streamlit run app.py

（主程序文件名可能是 app.py , main.py , thunderai.py 等，请查看项目根目录下的实际文件。）命令执行后，你的默认浏览器会自动打开一个新标签页，显示ThunderAI的本地Web界面（通常是 http://localhost:8501 ）。

4.3 界面初探与基础配置

第一次打开的界面可能比较简洁。

侧边栏 ：这里应该能看到“模型选择”下拉菜单。点击它，如果Ollama服务正常且模型已下载，你应该能看到 llama3.2:3b 这个选项。选择它。
主聊天区域 ：在底部的输入框里，尝试发送一条消息，比如“你好，请介绍一下你自己”。如果一切配置正确，你应该能收到来自本地 llama3.2:3b 模型的回复。
文件上传 ：在聊天输入框附近，寻找文件上传按钮或区域。尝试上传一个简单的 .txt 文件，并在消息中提及“请总结一下我上传文件的内容”，看看AI是否能正确读取并处理。

至此，一个最基本的本地AI对话工具就已经跑起来了。

4.4 进阶配置：使用更强大的模型

llama3.2:3b 只是用于测试。要获得更好的对话和推理能力，我们需要更大的模型。

根据硬件选择模型 ：
- 8GB GPU内存 ：可以尝试 llama3.2:7b (7B参数)、 qwen2.5:7b 或 gemma2:7b 。这是消费级显卡（如RTX 4060）的甜点级选择。
- 16GB+ GPU内存 ：可以挑战 llama3.2:11b 、 qwen2.5:14b 或 mixtral:8x7b （混合专家模型，需要更多内存但性能更强）。
- 纯CPU运行 ：建议使用参数更小或量化等级更高的模型，如 llama3.2:3b 或 phi3:mini 。速度会较慢，但可以运行。
拉取新模型 ：在Ollama终端（或新的系统终端）中，运行拉取命令。例如，拉取7B模型：
```
ollama pull llama3.2:7b
```
这个过程会下载数GB的数据，请耐心等待。
在ThunderAI中切换模型 ：下载完成后，刷新ThunderAI的Web页面（或重启Streamlit应用）。在侧边栏的模型选择下拉列表中，你应该能看到新下载的 llama3.2:7b 。选择它，之后的对话就会使用这个更强大的模型。

5. 深度使用技巧与场景案例

5.1 场景一：本地化文档分析与问答

这是ThunderAI最能体现价值的地方。假设你下载了一份几十页的行业研究报告PDF，想快速把握其核心。

操作流程 ：

在ThunderAI中，新建一个对话，命名为“XX行业报告分析”。
上传该PDF文件。
在消息框中输入：“请通读我上传的这份报告，并提取出：1. 报告的核心观点；2. 提到的三个主要趋势；3. 给出的关键数据。用分点列表的形式回答。”
发送请求。

技巧与心得 ：

分而治之 ：如果报告特别长，AI的回复可能会因为上下文限制而遗漏后半部分内容。更稳妥的做法是，先让AI对全文进行摘要：“请为这份报告生成一个不超过500字的详细摘要。” 然后，基于摘要，再针对特定章节或图表提出更具体的问题，例如：“在‘市场预测’章节，2025年的市场规模预计是多少？”
利用对话历史 ：所有关于这份报告的问答都在同一个对话线程中，AI会记住之前的上下文。你可以持续追问：“针对你刚才提到的第二个趋势，能再详细解释一下其背后的驱动因素吗？” 这比每次重新上传文件并提问要高效得多。
结合不同模型 ：对于需要深度理解、归纳总结的任务，使用 llama3.2:11b 这类能力更强的模型。对于简单的信息提取， 7b 模型可能更快、更经济（显存占用小）。

5.2 场景二：个人编程助手与代码评审

虽然有针对代码优化的专用模型（如 deepseek-coder , codellama ），但通用的 llama3.2 模型在代码理解和生成上也有不错的表现。

操作流程 ：

将你的代码片段保存为 .txt 或 .py 文件。
上传该文件，并提问：“请分析这段代码的功能，并指出其中可能存在的bug或可以优化的地方。”
或者，直接描述需求：“请用Python写一个函数，接收一个文件路径，读取该文件，并统计其中每个单词出现的频率。”

技巧与心得 ：

提供充足上下文 ：在请求代码帮助时，尽量在问题中说明你使用的编程语言、框架、以及你希望实现的具体目标。模糊的请求会得到模糊的回答。
代码解释 ：对于复杂的算法或别人写的代码，可以让AI逐行添加注释来解释其逻辑。提示词可以是：“请为以下代码的每一行或关键部分添加中文注释，解释其作用。”
切换专用模型 ：如果你经常处理代码任务，强烈建议在Ollama中拉取 deepseek-coder:6.7b 这类代码专用模型，并在ThunderAI中切换使用。它们在代码生成、补全和调试上的表现会显著优于通用模型。

5.3 场景三：创意写作与头脑风暴

利用AI进行头脑风暴，是突破个人思维局限的好方法。

操作流程 ：

新建一个对话，命名为“短视频脚本构思”。
直接输入你的初始想法：“我想做一个关于‘如何在家高效工作’的1分钟短视频，目标观众是年轻白领。请帮我生成5个不同的开场白创意。”
从AI给出的选项中挑选一个你喜欢的，让它继续扩展：“针对第三个开场白‘从混乱的书桌到高效工作站’，展开成一个完整的脚本大纲，包括场景、画面描述和旁白。”

技巧与心得 ：

调节“温度”（Temperature） ：在侧边栏找到参数设置，将“温度”调高（例如0.8-1.2）。这个参数控制AI输出的随机性。调高后，AI的回答会更富有创造性和多样性，适合头脑风暴；调低（如0.1-0.3）则会让回答更确定、更专注，适合事实性问答。
迭代与精炼 ：AI的第一版回答往往比较粗糙。你可以像和同事讨论一样，不断提出修改意见：“这个转折有点生硬，能不能让它更自然一点？”、“旁白的语言可以更幽默一些吗？”。
保存灵感 ：好的点子可以随时复制保存下来。ThunderAI的对话历史就是你专属的创意日志。

6. 常见问题、故障排查与性能优化

在实际部署和使用中，你肯定会遇到一些问题。下面是我总结的一些典型问题及其解决方案。

6.1 安装与启动类问题

问题1： pip install -r requirements.txt 失败，提示某些包找不到或安装错误。

原因：通常是网络问题，或者某个库的版本与你的Python环境或操作系统不兼容。
解决：
1. 使用国内镜像源 ：在pip命令后加上 -i https://pypi.tuna.tsinghua.edu.cn/simple 。例如：
```
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
```
2. 逐个安装 ：如果某个特定包（比如 pytesseract 或 pdfplumber ）失败，尝试单独安装它，并查看更详细的错误信息。有时需要安装系统级的依赖，例如在Windows上， pytesseract 需要你先安装Tesseract OCR引擎。
3. 检查Python版本 ：确保你的Python版本在3.9-3.11之间，这是大多数库兼容性最好的范围。

问题2：运行 streamlit run app.py 后，浏览器打开显示“无法连接”或白屏。

原因：Streamlit服务没有正常启动，或者端口冲突。
解决：
1. 查看终端输出是否有错误信息。最常见的错误是缺少某个模块，根据提示安装即可。
2. Streamlit默认使用8501端口。如果该端口被占用，可以指定另一个端口：
```
streamlit run app.py --server.port 8502
```
  然后在浏览器访问 http://localhost:8502 。
3. 检查防火墙设置，确保允许Python或Streamlit进行网络通信。

问题3：ThunderAI界面中看不到任何模型，或者连接Ollama失败。

原因：Ollama服务未运行，或者ThunderAI配置的Ollama API地址不正确。
解决：
1. 在系统托盘确认Ollama图标是否亮起，或在终端运行 ollama list 看是否有输出。
2. 重启Ollama服务。可以在终端运行 ollama serve 在前台启动，观察有无报错。
3. 检查ThunderAI的配置文件或代码中，连接Ollama的地址（通常是 http://localhost:11434 ）是否正确。如果是Docker部署或远程Ollama，需要修改为对应的IP和端口。

6.2 模型与性能类问题

问题4：模型响应速度非常慢，或者显存爆满导致程序崩溃。

原因：模型太大，超过了GPU显存容量，系统开始使用速度慢得多的内存进行交换。
解决：
1. 选择更小的模型 ：从 7b 模型换到 3b 模型。
2. 使用量化模型 ：Ollama支持多种量化精度的模型，如 q4_0 , q8_0 等。量化会降低一些精度，但能大幅减少显存占用和提升速度。拉取模型时可以指定，例如 ollama pull llama3.2:7b-q4_0 。
3. 调整上下文长度 ：在ThunderAI的参数设置中，减少“最大上下文长度”（max context length）。这限制了单次对话能携带的历史信息量，能有效降低内存压力。
4. 关闭无关程序 ：释放被其他程序占用的GPU显存。

问题5：AI的回答质量不高，感觉“很笨”。

原因：可能使用了能力较弱的小模型，或者提示词（Prompt）不够清晰。
解决：
1. 升级模型 ：这是最直接有效的方法。尝试 llama3.2:11b 或 qwen2.5:14b 等更大参数的模型。
2. 优化你的提问（Prompt Engineering） ：给AI更明确的指令。例如，不要问“怎么写代码？”，而是问“用Python的Pandas库，如何读取一个CSV文件并计算某一列的平均值？请给出完整代码示例。” 在提问中指定角色、格式、步骤，能极大提升回答质量。
3. 调整参数 ：适当降低“温度”（Temperature）可以让回答更确定、更少胡言乱语。

6.3 文件处理类问题

问题6：上传PDF/图片后，AI回复说“文件是空的”或提取的文字是乱码。

原因：
- 扫描版PDF/图片质量差 ：OCR识别失败或准确率极低。
- 加密或特殊编码的PDF ：某些PDF有复制限制。
- 不支持的文档格式 ：比如老旧的 .doc 格式（非 .docx ）。
解决：
1. 对于扫描件，尝试使用专业的OCR软件（如Adobe Acrobat、ABBYY FineReader）先进行识别和转换，生成可复制文字的PDF或TXT文件，再上传。
2. 对于加密PDF，如果拥有密码，先使用PDF工具去除密码。
3. 将不支持的格式（如 .doc ）用办公软件另存为 .docx 或 .pdf 格式。

问题7：处理大文件时，页面卡死或无响应。

原因：文件解析（尤其是OCR）和文本加载到前端非常消耗资源，可能导致浏览器或Streamlit服务暂时无响应。
解决：
1. 预处理大文件 ：在上传前，使用其他工具将大文件拆分成几个小文件，或者先提取出你最关心的部分。
2. 耐心等待 ：对于包含OCR的处理，等待时间可能长达数分钟。观察终端后台是否有持续的输出，只要没有报错，就请耐心等待。
3. 升级硬件 ：文件处理主要是CPU密集型任务。更快的CPU和更大的内存能显著改善体验。

6.4 高级配置与维护

自定义模型存储路径 ：默认情况下，Ollama模型存储在系统用户目录下（如 C:\Users\<用户名>\.ollama\models ）。如果你想将其移到更大的硬盘，可以在启动Ollama前设置环境变量 OLLAMA_MODELS 。

定期清理对话历史 ：长期使用后，SQLite数据库文件可能会变大。你可以手动删除项目目录下 database 文件夹中的历史文件，或者如果ThunderAI提供了清理功能，定期使用。

备份你的数据 ：最重要的数据是你的对话历史数据库。定期将其复制到其他位置进行备份，以防误删或系统故障。

加入AMD AI开发者计划！

免费领 100 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

苏姿丰谈AMD扎根中国30年、对话李开复：AI转型只能由CEO亲自挂帅，别只听CIO的

AMD开发者中国社区

从PyTorch训练到Intel CPU部署：一条龙搞定YOLOv5模型优化与OpenVINO推理加速

本文详细介绍了从PyTorch训练到Intel CPU部署YOLOv5模型的完整流程，重点讲解了如何使用OpenVINO工具包进行模型优化与推理加速。通过实战案例展示了如何将训练好的YOLOv5模型转换为ONNX格式，并利用OpenVINO的模型优化器进行性能提升，最终实现高效部署。文章还提供了常见问题的解决方案，帮助开发者快速掌握端到端的模型部署技术。