基于Whisper与Ollama构建本地语音AI助手：从语音识别到自动化执行

语音识别与大型语言模型（LLM）是当前人工智能领域的两大核心技术。语音识别技术通过声学模型和语言模型将声音信号转化为文本，而LLM则基于Transformer架构理解和生成自然语言。这两项技术的结合，为构建智能交互系统提供了基础。在工程实践中，通过本地化部署开源模型，可以在保护数据隐私的同时实现高效的语音控制自动化。本项目以Whisper实现高精度离线语音转文本，结合Ollama本地运行的LLM进

李管春

507人浏览 · 2026-05-27 14:29:38

李管春 · 2026-05-27 14:29:38 发布

1. 项目概述：打造一个能听懂你说话的本地AI助手

你有没有想过，对着电脑说句话，它就能帮你写代码、做总结、甚至创建文件？这听起来像是科幻电影里的场景，但今天，借助开源的力量，我们完全可以在自己的电脑上搭建这样一个“语音控制的AI智能体”。这个项目，就是一次将语音识别、大语言模型和自动化工具链整合起来的实践，核心目标很简单： 让机器听懂你的话，并帮你把事情办了 。

我之所以选择这个方向，是因为在日常开发和学习中，经常需要反复执行一些模式化的任务，比如为新想法创建一个项目文件夹和基础代码文件，或者快速阅读一篇长文档并提取要点。每次都要手动操作，不仅打断思路，也浪费时间。而市面上的语音助手要么功能受限，要么需要联网，存在隐私顾虑。因此，一个 完全本地运行、可高度自定义 的语音AI助手就显得非常实用。

这个项目适合所有对Python编程、AI应用集成感兴趣的开发者，无论你是想了解如何将Whisper、Ollama这些热门开源项目串联起来，还是希望为自己的工作流添加一个酷炫的自动化入口，都能从中获得启发。整个系统的核心流程可以概括为： 声音输入 → 语音转文字 → 意图理解 → 执行动作 → 反馈结果 。接下来，我将为你详细拆解每一个环节的设计思路、实现细节以及我踩过的那些坑。

2. 核心架构与工具选型解析

2.1 为什么选择“Whisper + Ollama + Streamlit”这个技术栈？

构建一个本地语音AI助手，技术选型是关键。我最终确定了Python作为胶水语言，串联起OpenAI的Whisper、Ollama的本地大模型以及Streamlit构建前端。这个组合并非随意拼凑，背后有清晰的考量。

首先， Python 是机器学习领域的事实标准，拥有最丰富的库生态，能极大降低集成各组件时的复杂度。其次， Whisper 作为开源的语音识别模型，其准确性在开源领域中首屈一指，支持多种语言，并且提供了从“tiny”到“large”不同规模的模型，方便我们在精度和速度之间做权衡。最重要的是，它可以完全离线运行，满足了我们对隐私和可控性的核心要求。

对于大脑部分，我选择了 Ollama 。它极大地简化了在本地运行大型语言模型（如Llama 2、Mistral、CodeLlama等）的过程。通过一个简单的命令行工具就能拉取和运行模型，并通过API进行交互，避免了复杂的模型部署和环境配置。这让我们能把精力集中在应用逻辑，而非基础设施上。

前端展示层， Streamlit 以其“用脚本快速构建数据应用”的特性胜出。对于这样一个需要实时展示转录文本、识别出的意图以及执行结果的交互式应用，Streamlit可以在极少的代码量下实现一个清晰、美观的Web界面，并且天然支持与后端Python逻辑的无缝集成。

注意：这个技术栈对硬件有一定要求。Whisper模型和Ollama运行的LLM都需要消耗显存（GPU）或大量内存（CPU）。如果你的电脑配置较低（如内存小于8GB，或无独立显卡），建议从最小的模型开始尝试，例如Whisper的 tiny 或 base 模型，以及Ollama的 tinyllama 或 phi 这类小参数模型。

2.2 系统工作流设计：从声音到行动的完整闭环

整个系统的工作流设计，我遵循了“高内聚、低耦合”的原则，将流程分解为几个独立的模块，这样不仅便于开发和调试，也方便未来替换或升级某个组件。下图清晰地展示了数据是如何在各个模块间流动的：

输入层 ：用户通过麦克风录制或上传一个音频文件（如.wav, .mp3）。这是整个流程的起点。
语音转文本层 ：音频数据被送入Whisper模型。Whisper负责将连续的声波信号转换为离散的文字序列。这里需要处理音频的采样率、声道数等格式问题，确保Whisper能正确识别。
意图理解层 ：转录得到的纯文本被发送给Ollama托管的本地LLM。但这里不是简单地把文本扔给模型聊天，而是需要精心设计一个 系统提示词（System Prompt） ，引导模型进行“意图识别”和“结构化输出”。这是项目的核心难点之一。
工具执行层 ：根据LLM解析出的结构化意图（例如： {"intent": "write_code", "parameters": {"language": "python", "description": "hello world"}} ），系统调用对应的Python函数来执行具体操作，比如在指定目录创建文件并写入代码。
输出与展示层 ：执行的结果（成功或失败信息、生成的文件路径、代码内容等）被收集起来，通过Streamlit界面实时地展示给用户，形成一个完整的反馈闭环。

这种管道式的设计，使得每个环节都可以单独测试和优化。例如，你可以先用一段固定的文本测试意图识别是否准确，再单独测试文件创建功能，最后把整个链条串起来。

3. 核心模块实现与实操要点

3.1 语音转文本：Whisper的集成与优化

集成Whisper的第一步是安装。我推荐使用 pip 安装OpenAI官方维护的 openai-whisper 包，它依赖 ffmpeg 来处理音频文件。

pip install openai-whisper
# 在Ubuntu/Debian上安装ffmpeg
sudo apt update && sudo apt install ffmpeg
# 在macOS上
brew install ffmpeg

在实际代码中，使用Whisper非常简单。但为了提升体验，我做了几点优化：

import whisper

def transcribe_audio(audio_path, model_size="base"):
    """
    使用Whisper转录音频文件。
    
    参数:
        audio_path: 音频文件路径。
        model_size: Whisper模型大小，可选 "tiny", "base", "small", "medium", "large"。权衡速度与精度。
    
    返回:
        转录后的文本字符串。
    """
    # 加载模型（首次运行会自动下载）
    model = whisper.load_model(model_size)
    
    # 转录音频
    result = model.transcribe(audio_path)
    
    # 返回文本
    return result["text"]

实操心得与避坑指南：

模型选择 ： tiny 和 base 模型速度最快，适合实时或对精度要求不高的场景。 small 和 medium 在准确度上有显著提升，是大多数本地应用的平衡点。 large 模型最准，但也最慢最耗资源。建议从 base 开始。
音频预处理 ：Whisper对音频质量有一定要求。如果识别率低，可以尝试先用 pydub 库对音频进行预处理，如标准化音量、降噪（简单的高通滤波）、或转换为单声道16kHz采样率（Whisper的默认输入格式）。
内存管理 ：转录长音频时，Whisper可能会占用大量内存。对于超长音频，可以考虑使用 transcribe 方法的 segment 参数进行分段处理，或者先使用外部工具将音频切割成短片段。
错误处理 ：务必添加对文件不存在、格式不支持、模型加载失败等异常的处理，提高程序的健壮性。

3.2 意图识别：与大模型（Ollama）的高效对话

这是整个系统的“大脑”。我们不能让LLM自由发挥，而是要通过提示词工程（Prompt Engineering）引导它成为一个可靠的“意图解析器”。

首先，确保你已经安装并运行了Ollama。去Ollama官网下载安装后，在终端拉取一个模型，比如轻量且能力不错的 llama3.2 或专门为代码优化的 codellama 。

# 拉取并运行模型
ollama run llama3.2

在Python中，我们通过HTTP请求与Ollama的API交互。核心是构造一个包含“系统指令”和“用户查询”的提示词。

import requests
import json

def detect_intent_with_ollama(transcribed_text):
    """
    使用Ollama API分析文本，识别用户意图并返回结构化数据。
    """
    ollama_url = "http://localhost:11434/api/generate"
    
    # 精心设计的系统提示词，这是成功的关键
    system_prompt = """
    你是一个任务意图解析器。请严格根据用户输入，判断其意图，并按照指定的JSON格式输出。
    可识别的意图包括：
    1. `write_code`: 用户要求编写代码。参数包括：`language`（编程语言）， `description`（代码功能描述）。
    2. `create_file`: 用户要求创建文件。参数包括：`filename`（文件名）， `content`（文件初始内容，可为空）。
    3. `summarize`: 用户要求总结文本。参数包括：`text`（待总结的文本）。
    4. `chat`: 普通聊天或问题。参数为`question`（用户的问题）。
    
    如果输入无法匹配以上任何意图，则意图设为`unknown`。
    输出必须是且仅是一个合法的JSON对象，不要有任何额外解释。
    示例输出：{"intent": "write_code", "parameters": {"language": "python", "description": "打印欢迎信息"}}
    """
    
    # 组合完整的提示词
    full_prompt = f"{system_prompt}\n\n用户输入：{transcribed_text}"
    
    payload = {
        "model": "llama3.2", # 与你运行的模型名称一致
        "prompt": full_prompt,
        "stream": False, # 我们不需要流式响应
        "format": "json", # 强烈建议要求JSON格式输出，但并非所有模型都完美支持
        "options": {
            "temperature": 0.1 # 低温度使输出更确定、更少随机性
        }
    }
    
    try:
        response = requests.post(ollama_url, json=payload)
        response.raise_for_status()
        result = response.json()
        
        # 解析响应，尝试提取JSON
        response_text = result.get("response", "").strip()
        # 有时模型会在JSON外加一层反引号或说明，这里需要做一层清洗
        # 简单的处理：找到第一个`{`和最后一个`}`
        start = response_text.find('{')
        end = response_text.rfind('}') + 1
        if start != -1 and end != 0:
            json_str = response_text[start:end]
            intent_data = json.loads(json_str)
            return intent_data
        else:
            # 如果解析失败，返回未知意图
            return {"intent": "unknown", "parameters": {}}
            
    except (requests.exceptions.RequestException, json.JSONDecodeError) as e:
        print(f"Ollama API调用或解析失败: {e}")
        return {"intent": "error", "parameters": {"message": str(e)}}

核心技巧与注意事项：

提示词是关键 ：系统提示词必须清晰、无歧义，明确指令和输出格式。我采用了“角色定义 + 意图列表 + 输出格式示例”的结构，效果非常稳定。
要求JSON格式 ：在payload中设置 "format": "json" ，并选择支持JSON模式的模型（如llama3.2），能极大提高返回数据的结构化程度。但要做好后备解析，因为模型有时仍会“说废话”。
低温度（Temperature） ：设置为0.1-0.3，让模型的输出更聚焦、更可预测，适合这种需要稳定解析的任务。
超时与重试 ：在生产环境中，务必为API请求设置超时，并考虑加入重试逻辑，以应对Ollama服务可能的不稳定。

3.3 工具执行器：将意图转化为具体行动

得到结构化的意图数据后，我们需要一个“工具执行器”来调用对应的函数。这里我采用了一个简单的“意图-函数”映射字典。

import os
import subprocess
from pathlib import Path

# 定义一个安全的输出目录，防止误操作系统文件
SAFE_OUTPUT_DIR = Path("./agent_outputs")
SAFE_OUTPUT_DIR.mkdir(exist_ok=True)

def execute_intent(intent_data):
    """
    根据意图数据执行相应的操作。
    
    参数:
        intent_data: 包含`intent`和`parameters`的字典。
    
    返回:
        执行结果的字符串描述。
    """
    intent = intent_data.get("intent", "unknown")
    params = intent_data.get("parameters", {})
    
    if intent == "write_code":
        return _handle_write_code(params)
    elif intent == "create_file":
        return _handle_create_file(params)
    elif intent == "summarize":
        return _handle_summarize(params)
    elif intent == "chat":
        return _handle_chat(params)
    else:
        return f"无法识别的意图: {intent}"

def _handle_write_code(params):
    language = params.get("language", "text").lower()
    description = params.get("description", "")
    
    # 这里可以集成一个代码生成模型，或者使用简单的模板
    # 为了简化，我们这里根据描述生成一个非常基础的代码片段
    filename = SAFE_OUTPUT_DIR / f"generated_code.{_get_extension(language)}"
    
    if language == "python":
        code_content = f'# {description}\nprint("Hello, World from AI Agent!")'
    elif language == "javascript":
        code_content = f'// {description}\nconsole.log("Hello, World from AI Agent!");'
    else:
        code_content = f'# Language: {language}\n# Task: {description}\n// TODO: Implement this.'
    
    filename.write_text(code_content)
    return f"已生成{language}代码文件: {filename}"

def _handle_create_file(params):
    filename = params.get("filename", "new_file.txt")
    content = params.get("content", "")
    # 防止路径遍历攻击，将文件名限制在安全目录内
    safe_filename = Path(filename).name
    filepath = SAFE_OUTPUT_DIR / safe_filename
    
    filepath.write_text(content)
    return f"文件已创建: {filepath}"

def _handle_summarize(params):
    text_to_summarize = params.get("text", "")
    if not text_to_summarize:
        return "未提供需要总结的文本。"
    # 此处可以调用另一个LLM进行总结，或使用简单的文本摘要算法
    # 为简化，这里返回一个模拟的总结
    summary = text_to_summarize[:100] + "..." if len(text_to_summarize) > 100 else text_to_summarize
    return f"文本摘要：{summary}"

def _handle_chat(params):
    question = params.get("question", transcribed_text) # 可以回退到原始转录文本
    # 这里可以再次调用Ollama进行自由对话，但注意上下文管理
    # 简单返回一个回应
    return f"这是一个聊天对话。您说：{question}。这是一个本地AI助手的回应示例。"

def _get_extension(lang):
    ext_map = {"python": "py", "javascript": "js", "java": "java", "cpp": "cpp", "go": "go"}
    return ext_map.get(lang, "txt")

安全与设计考量：

沙盒环境 ：所有文件操作都限制在 SAFE_OUTPUT_DIR 目录下，这是至关重要的安全措施，防止用户通过语音指令意外删除或覆盖重要系统文件。
参数校验 ：在执行任何操作前，对传入的参数进行基本的校验和清理，例如处理文件名中的非法字符。
模块化设计 ：每个意图处理函数都是独立的，这使得添加新功能（如“发送邮件”、“查询天气”）变得非常容易，只需增加新的意图类型和对应的处理函数即可。

3.4 用户界面：用Streamlit快速搭建控制面板

Streamlit让构建一个展示界面变得异常简单。我们将上面的所有模块整合到一个Streamlit应用中。

import streamlit as st
import tempfile
from pathlib import Path
# 假设上面的函数都定义在一个叫`agent_core.py`的文件中
from agent_core import transcribe_audio, detect_intent_with_ollama, execute_intent

st.set_page_config(page_title="本地语音AI助手", layout="wide")
st.title("🎤 本地语音控制AI智能体")

# 初始化session state，用于保存状态
if 'transcription' not in st.session_state:
    st.session_state.transcription = ""
if 'intent_result' not in st.session_state:
    st.session_state.intent_result = ""
if 'execution_result' not in st.session_state:
    st.session_state.execution_result = ""

# 侧边栏用于配置和上传
with st.sidebar:
    st.header("配置")
    whisper_model = st.selectbox("Whisper模型", ["tiny", "base", "small", "medium"], index=1)
    ollama_model = st.text_input("Ollama模型", value="llama3.2")
    
    st.header("音频输入")
    audio_source = st.radio("选择输入方式", ["上传文件", "实时录制（待实现）"])
    
    audio_file = None
    if audio_source == "上传文件":
        audio_file = st.file_uploader("上传音频文件", type=['wav', 'mp3', 'm4a', 'ogg'])
    else:
        st.info("实时录制功能需集成`sounddevice`或`pyaudio`库，当前版本暂未实现。")

# 主界面
col1, col2, col3 = st.columns(3)

with col1:
    st.subheader("1. 语音转录")
    if audio_file is not None:
        # 保存上传的临时文件
        with tempfile.NamedTemporaryFile(delete=False, suffix=Path(audio_file.name).suffix) as tmp_file:
            tmp_file.write(audio_file.getbuffer())
            tmp_path = tmp_file.name
        
        if st.button("开始转录"):
            with st.spinner("Whisper正在努力转录中..."):
                st.session_state.transcription = transcribe_audio(tmp_path, model_size=whisper_model)
            # 清理临时文件
            Path(tmp_path).unlink(missing_ok=True)
    
    st.text_area("转录文本", st.session_state.transcription, height=200)

with col2:
    st.subheader("2. 意图识别")
    if st.session_state.transcription and st.button("分析意图"):
        with st.spinner("Ollama正在分析意图..."):
            st.session_state.intent_result = detect_intent_with_ollama(st.session_state.transcription)
    # 使用st.json漂亮地显示字典
    st.json(st.session_state.intent_result if st.session_state.intent_result else {})

with col3:
    st.subheader("3. 执行与结果")
    if st.session_state.intent_result and st.session_state.intent_result.get('intent') != 'unknown':
        if st.button("执行动作"):
            with st.spinner("正在执行..."):
                st.session_state.execution_result = execute_intent(st.session_state.intent_result)
    st.text_area("执行结果", st.session_state.execution_result, height=200)

# 下方显示一个连贯的工作流日志
st.divider()
st.subheader("工作流日志")
log_text = f"""
**输入音频**: {audio_file.name if audio_file else "无"}
**转录文本**: {st.session_state.transcription[:100] + '...' if len(st.session_state.transcription) > 100 else st.session_state.transcription}
**识别意图**: {st.session_state.intent_result.get('intent', 'N/A') if st.session_state.intent_result else 'N/A'}
**执行结果**: {st.session_state.execution_result}
"""
st.markdown(log_text)

这个界面清晰地分成了三个步骤，并提供了配置选项。用户上传音频后，可以依次点击按钮执行转录、意图识别和动作执行，所有中间和最终结果都会实时显示。

4. 部署、调试与性能优化实战

4.1 环境搭建与依赖管理

一个稳定的环境是项目成功的基础。我强烈建议使用虚拟环境来管理依赖。

# 创建虚拟环境
python -m venv venv_ai_agent
# 激活虚拟环境
# Windows:
venv_ai_agent\Scripts\activate
# Linux/macOS:
source venv_ai_agent/bin/activate

# 安装核心依赖
pip install openai-whisper streamlit requests
# 安装可能用到的音频处理库
pip install pydub

对于Ollama，你需要从其官网下载并安装独立的应用程序。安装后，确保它在后台运行（通常安装后会自动启动一个服务）。你可以通过命令行 ollama list 来验证。

依赖冲突排查 ：Whisper依赖特定版本的PyTorch。如果安装出现问题，可以先去PyTorch官网根据你的CUDA版本获取正确的安装命令，先安装PyTorch，再安装 openai-whisper 。

4.2 典型问题排查与解决方案

在实际运行中，你几乎一定会遇到下面这些问题。这里是我的排查清单：

问题现象	可能原因	解决方案
运行 `import whisper` 报错	1. `ffmpeg` 未安装。 2. PyTorch版本不兼容。	1. 根据系统安装 `ffmpeg` 。 2. 创建一个新的干净虚拟环境，严格按照PyTorch官网指令安装。
Ollama API调用失败，连接被拒绝	1. Ollama服务未启动。 2. 端口号错误（默认是11434）。	1. 启动Ollama应用，或在终端运行 `ollama serve` 。 2. 检查代码中 `ollama_url` 的端口是否正确。
意图识别结果总是 `unknown` 或格式错误	1. 系统提示词设计不佳。 2. 模型能力不足或温度设置过高。 3. 返回的JSON解析失败。	1. 反复迭代优化你的系统提示词，让它更清晰、更具约束力。 2. 尝试更强大的模型（如 `llama3.1:8b` ），并将 `temperature` 调至0.1。 3. 在代码中添加更健壮的JSON解析逻辑，如使用 `json5` 库或正则表达式提取。
Streamlit界面卡顿或无响应	1. Whisper或Ollama推理耗时过长。 2. 未使用 `st.spinner` 或进度提示。	1. 换用更小的模型（Whisper用 `tiny` ， Ollama用 `tinyllama` ）。 2. 确保所有耗时操作都放在按钮点击事件中，并用 `with st.spinner():` 包裹，给用户明确反馈。
文件操作权限错误	1. 安全输出目录不存在或不可写。 2. 跨平台路径问题。	1. 使用 `Path.mkdir(exist_ok=True)` 确保目录存在。检查目录权限。 2. 使用 `pathlib.Path` 处理路径，它比字符串拼接更安全、更跨平台。

4.3 性能优化与扩展思路

当基本功能跑通后，你可以从以下几个方面提升它的性能和实用性：

异步处理 ：语音转录和LLM推理都是IO密集型或计算密集型任务。可以使用 asyncio 和 threading 将耗时的操作放入后台线程，防止Streamlit界面阻塞，实现更流畅的“边录边转”或“边转边分析”体验。
模型缓存 ：Whisper加载模型较慢。可以在应用启动时预加载模型到内存中，避免每次转录都重复加载。
实时音频流处理 ：集成 pyaudio 或 sounddevice 库，直接从麦克风捕获音频流，并分块发送给Whisper进行实时转录，实现真正的实时对话体验。
意图扩展 ：当前只定义了四种意图。你可以轻松扩展，例如：
- search_web ：调用本地知识库或可控的搜索API。
- send_email ：集成 smtplib 发送邮件。
- system_control ：执行安全的系统命令（需极其谨慎）。
上下文记忆 ：为 chat 意图添加简单的对话记忆功能。可以将对话历史保存在 st.session_state 中，并在每次调用Ollama时，将历史记录作为上下文一同发送，让AI能进行多轮对话。
前端美化 ：Streamlit支持自定义主题和组件。你可以使用 st.columns 进行更复杂的布局，用 st.expander 折叠次要信息，甚至引入一些CSS来美化界面，让它看起来更专业。

5. 从项目实践中获得的经验与反思

回顾整个项目的构建过程，最大的挑战并非来自某个单一技术，而是 如何让几个独立的强大组件稳定、可靠地协同工作 。Whisper的转录精度、Ollama对提示词的理解和遵循程度、以及前后端的状态管理，任何一个环节掉链子，用户体验都会大打折扣。

我个人的一个深刻体会是： 提示词的质量直接决定了LLM应用的成败 。最初我用的提示词比较笼统，导致意图识别时好时坏。后来我采用了“角色扮演+严格格式+示例”的三段式结构，并将温度调低，输出的稳定性和准确性才有了质的飞跃。这让我意识到，与AI协作，更像是在编写一份给“超级实习生”的极其详尽、无歧义的工作说明书。

另一个教训是关于 错误处理的边界 。最初版本里，如果音频文件损坏或者Ollama服务挂掉，整个应用就会崩溃。后来我几乎在每个函数调用和外接服务交互的地方都加上了 try-except ，并给出了友好的错误提示（如“语音识别服务暂时不可用，请检查Whisper模型”），应用的健壮性大大提升。

最后，本地AI应用的资源消耗是一个无法回避的现实问题。在我的旧笔记本（无独显）上运行 whisper-small 和 llama3.2 ，一次完整的请求需要近20秒。这提醒我们，在追求功能强大的同时，必须对模型选型保持克制，在速度、精度和资源消耗之间找到符合自己硬件条件的平衡点。或许，未来通过量化技术、更高效的推理引擎（如llama.cpp），我们能在这个平衡点上做得更好。这个项目就像一个起点，它验证了想法的可行性，而更多的优化和可能性，正等待着你我去探索和添加。

加入AMD AI开发者计划！

免费领 100 小时云算力，进群参与显卡、AI PC 幸运抽奖

更多推荐

PyTorch深度学习实战（54）——使用TorchScript和ONNX导出通用PyTorch模型

AMD开发者中国社区

基于vLLM部署Gemma-4-E2B多模态大模型和调用API 服务

基于vLLM的推理引擎大幅提升模型响应速度，FastAPI接口可直接集成到业务系统中，适用于智能问答、图片分析、多模态交互等实际应用场景。多模态大模型，实现图片+文本的多模态问答功能，并通过FastAPI封装为可视化API服务，最终完成本地接口测试。服务启动后，自动加载Processor和Gemma模型到GPU，加载完成后可接收外部请求。成功部署Google Gemma-4-E2B-it多模态大模

AMD开发者中国社区

ESXi 支持哪些 GPU 直通？NVIDIA/AMD 全系列兼容与配置指南

GPU 直通（PCIe Passthrough）是 VMware ESXi 提供的硬件虚拟化技术，通过直接将物理 GPU 设备分配给单台虚拟机独占使用，绕过 ESXi 虚拟化层的资源调度，让虚拟机获得完整的 GPU 算力与功能支持，性能损耗低于 5%，可实现与物理机几乎一致的运行体验。ESXi 对 GPU 直通的支持非常完善，核心兼容型号为 NVIDIA V100/A100/RTX 全系列和 AM