国内外主流的 Chat 式生成式对话/大模型(LLM)对比介绍
·
文章目录
- 国内外主流的 ChatGPT 式生成式对话/大模型(LLM)
- 1) OpenAI — GPT 系列(ChatGPT)
- 2) Anthropic — Claude 系列
- 3) Google DeepMind / Google AI — Gemini 系列
- 4) Meta — LLaMA / Llama 系列(例如 Llama 2 / Llama 3 / Llama 4 / “Scout / Maverick”)
- 5) Mistral(法国初创)与其开源模型
- 6) 中国主要厂商 / 模型(概览)
- 7) 能力对比(高层结论)
- 8) 收费对比(总体趋势与示例)
- 9) 关于“开源”这个词的提醒(很重要)
- 10) 选型建议(按场景)
- 附录:对比表格(2025-05 版)
国内外主流的 ChatGPT 式生成式对话/大模型(LLM)
注:下面关于「是否开源」「模型能力」「收费」等都是基于公开资料(产品页与新闻、2024–2025 年的发布/定价信息)。
1) OpenAI — GPT 系列(ChatGPT)
- 国家 / 公司:美国(OpenAI)。
- 代表模型 / 产品形态:GPT-4.1 / GPT-4o / gpt-4.1-mini、gpt-4o-realtime 等;ChatGPT(网页/应用)+ API(平台)。
- 是否开源:不是开源。模型权重与训练集不公开,提供云 API 与订阅服务。
- 能力概述:行业基准之一,强于通用推理、多轮对话、长上下文(不同型号支持的上下文长度不同),在多模态(图像/音频/视频)与插件/工具链(检索、行动代理)整合上领先。
- 定价/可用性(示例):OpenAI 提供 ChatGPT 免费/Plus/Pro 等订阅,API 按 token 收费,官方定价页面列出了 GPT-4.x 系列不同档位的输入/输出 token 计费。([OpenAI 平台][1])
2) Anthropic — Claude 系列
- 国家 / 公司:美国(Anthropic)。
- 代表模型 / 产品形态:Claude 系列(例如 Claude 3 系列:Haiku / Sonnet / Opus 等,不同档次的能力/延迟/成本不同),提供网页版与 API。
- 是否开源:不是开源(商业 API / 企业部署);但面向企业/开发者提供多档模型。
- 能力概述:面向安全/可控对话优化,综合推理能力强(特别是在对话安全、指令遵从、长上下文场景上)。Anthropic 在模型安全性 / 可控性上有明显强调。
- 定价/可用性(示例):按百万 token 分别计费(input/output);也有团队/企业订阅(Pro / Max 等)。参考其官方定价页与媒体报道。([Anthropic][2])
3) Google DeepMind / Google AI — Gemini 系列
- 国家 / 公司:美国(Google / DeepMind)。
- 代表模型 / 产品形态:Gemini(多个版本:Gemini Pro / Ultra / 2.5 / 3 等),与 Google Cloud / Gemini API、Google 产品(搜索、Workspace)整合。
- 是否开源:不是开源(通过 Google API / Cloud 提供服务)。
- 能力概述:非常强调多模态(文字、图像、音频、视频)与与搜索/知识图谱的联动(grounding);在检索增强、语义搜索、事实类问答结合在线信息方面有优势。
- 定价/可用性(示例):开发者 API 按 token 或请求计费,Google 有免费额度与付费层(Gemini API 定价有详细档位)。([Google AI for Developers][3])
4) Meta — LLaMA / Llama 系列(例如 Llama 2 / Llama 3 / Llama 4 / “Scout / Maverick”)
- 国家 / 公司:美国(Meta)。
- 代表模型 / 产品形态:Llama 家族(不同参数规模),Meta 以“可下载模型 + 使用许可”方式发布。
- 是否开源:部分“可下载”但并非完全开放源代码或训练数据——Meta 把模型权重和推理接口开放下载/使用(受许可条款限制),但其许可/acceptable-use 使得学界和开源社区对其是否真“开源”存在争议(所谓“openwashing”)。因此技术上可本地部署、但使用受限。([Meta AI][4])
- 能力概述:高参数模型在通用能力上竞争力强;适合需要本地部署或受限网络环境的场景(注意许可条款)。
- 定价/可用性:模型权重下载(视许可),云/企业接入通常通过合作伙伴或 Meta 的服务。([维基百科][5])
5) Mistral(法国初创)与其开源模型
- 国家 / 公司:法国(Mistral AI)。
- 代表模型 / 产品形态:Mistral 7B、Mixtral(Mixture-of-Experts 变体,比如 Mixtral 8x7B)、以及后续 Small/Medium/Reasoning 系列(Magistral 等)。公司以“开源或开放权重”为特色之一。
- 是否开源:是的(公开权重/模型文件),并以“高性能小参数模型”路线著称,强调在较小模型上取得与大模型接近的效果。
- 能力概述:在多项基准上性价比高,适合需要在本地部署或成本敏感的企业/研究者。Mistral 也在 2024–2025 年发布了多个针对不同用途的开源模型。([docs.mistral.ai][6])
6) 中国主要厂商 / 模型(概览)
中国生态近年来发展很快,既有大型互联网公司(百度、阿里、腾讯、字节/抖音系)也有本地初创与高校衍生公司(如 Baichuan、Zhipu/ChatGLM 等)。总体特点是:对中文和区域场景优化、价格/接入策略多变(往往对国内用户更友好),并且有大量“公开/可商用”模型被推出。
百度 — ERNIE / Ernie Bot
- 公司 / 国家:中国(Baidu)。
- 开源:2025 年百度明确有把 Ernie 部分模型/技术向外开放或宣布会开源的动作(媒体报道显示战略调整)。但产品仍以云服务与 Ernie Bot 为主。
- 能力:主攻中文搜索级联动、检索增强问答、知识融合与多模态。百度在中文检索+LLM 结合的实战上有优势。([ernie.baidu.com][7])
阿里云 — 通义千问(Qwen / Tongyi Qianwen)
- 公司 / 国家:中国(Alibaba / Alibaba Cloud)。
- 开源:阿里推出了 Qwen 系列并在一定程度上开源/发布多型号(并在阿里云上提供托管服务);也有面向企业的付费能力(云 API)。
- 能力:在企业级中文应用、云服务整合、行业定制上丰富;阿里也会做价格策略(例如近期宣布某些型号降价/优惠)。([AlibabaCloud][8])
字节跳动 — 豆包(Doubao)系列
- 公司 / 国家:中国(ByteDance)。
- 代表模型:豆包 Pro / Lite / 128k / 视觉版等;产品形态已接入抖音、飞书、剪映。
- 是否开源:闭源,仅提供火山引擎 API 与云实例。
- 能力概述:中文短视频/直播场景深度优化,多模态(图文+视频脚本)联动抖音生态;价格极端卷。
- 定价/可用性:火山引擎按 token,0.0008 元/1k token 起,国内最低档之一。
DeepSeek — 深度求索
- 公司 / 国家:中国(幻方量化孵化,独立运营)。
- 代表模型:DeepSeek-V3.1 / R1 / Math-7B 等。
- 是否开源:完全开源(Apache-2.0),权重、训练脚本、数据说明全放出。
- 能力概述:数学/代码/推理刷榜型选手,256k 上下文;自研 MoE 架构,训练成本仅为 Llama-3-70B 的 1/5。
- 定价/可用性:模型下载免费;API 0.0004 元/1k token,2025 年国内“价格地板”。
Zhipu / ChatGLM(知谱 / GLM 系列,亦称 Z.ai)
- 公司 / 国家:中国(Tsinghua 附属/清华团队与 Zhipu 联合)。
- 开源:ChatGLM / GLM 系列长期以 Apache-2.0 等开源许可发布(多版本支持中英双语),适合在国内做本地化部署和二次开发。Zhipu 最近以 Z.ai 品牌在海外/国内都有产品。([Curated New AI Tools Directory][10])
Baichuan(国内开源项目 / 公司)
- 开源:Baichuan-7B / 13B 等早期以 Apache-2 类许可发布,定位中文/中英混合场景,且社区活跃,适合离线部署与企业自研。([AI Business][11])
腾讯 — Hunyuan 系列
- 公司 / 国家:中国(Tencent)。
- 开源:腾讯在 2024–2025 年陆续把部分 Hunyuan 系列(尤其在图像/3D 生成方向)以开源或开放接口形式发布,例如 Hunyuan3D 等。核心大模型在企业级服务中提供(并逐步开放某些资源)。([Reuters][12])
月之暗面 — Kimi 系列(补充)
- 公司 / 国家:中国(Moonshot AI,清华系初创)。
- 代表模型:Kimi-2M-Preview / Kimi-VL 等。
- 是否开源:闭源,网页版+API 双通道。
- 能力概述:2M token 单轮上下文,长文档、论文、财报、合同“秒读”;2025-10 新增实时语音对话。
- 定价/可用性:网页端仍免费;API 0.0018 元/1k token,企业版支持私有部署。
7) 能力对比(高层结论)
说明:下面为基于公开基准、发布说明、以及行业报道的概括比较(不同 benchmark/任务会有差异;评价要看“任务类型/语言/延迟/成本/本地部署”):
- 顶尖闭源模型(OpenAI / Google / Anthropic):在英语推理、多模态(图像/音频/视频)、长期上下文和工具整合(检索、文件、执行代码)上通常处于行业领先;适合需要最强“即开即用”能力的 SaaS/产品化场景(但成本较高,且受限于隐私/数据出境问题)。([OpenAI 平台][1])
- 大型公司可下载/受限“开源”模型(Meta Llama):给开发者部署灵活性,但许可限制须谨慎;模型规模大时能力接近顶级,但需要大量算力与工程投入。([Meta AI][4])
- 真正开源 / 高性价比的模型(Mistral、Baichuan、部分 Zhipu/ChatGLM):在成本/部署/定制化上优势明显;某些小/中参数模型在实用任务上可与大模型相竞争(尤其在中文场景中本土模型通常更优)。Mistral 在西方社区以高性能小模型著称;国内 Baichuan、ChatGLM 在中文场景上社区、运行效率、对接成本更友好。([docs.mistral.ai][6])
- 超长上下文专项:Kimi 2M、DeepSeek 256k、豆包 128k 在中文场景已接近或超越 GPT-4-128k 的 F1 得分(LongBench-zh 2025-04)。
- 开源可商用性价比:Qwen-2.5-72B > DeepSeek-V3.1 > Llama-3.3-70B(成本/性能比,vLLM 实测)。
8) 收费对比(总体趋势与示例)
- OpenAI:ChatGPT 个人订阅(Plus/Pro 等;不同国家/地区价格不同),API 按 token 计费(高端模型每百万 token 收费较高)。官方价格页详列。([OpenAI][13])
- Anthropic:按百万 token 收费,并有订阅(Pro/Max)与团队计划;也提供企业定价。([Claude][14])
- Google Gemini:API/Cloud 计费,按 token/上下文/加速或 grounding 服务计费(Google 官方定价页有详细表格)。([Google AI for Developers][3])
- 国内厂商(百度 / 阿里 / 腾讯 / Zhipu / Baichuan 等):收费策略多样 —— 有提供免费层 / 大幅补贴或对国内用户/企业优惠、也有按调用/按缓存计费的企业方案。近两年国内出现“价格战”与大量免费/低价策略(例如百度 2025 年宣布 Ernie Bot 部分免费或降价,阿里也宣布对部分模型降价)。具体价格随地区与接入方式变化很快,建议查看对应厂商官网/云市场。([Reuters][15])
- 三行价格对比:
| 厂商 / 模型 | 典型计费单位 | 2025-11 参考价 | 备注 |
|---|---|---|---|
| 字节 — 豆包Doubao-Pro-128k | 1k token | 0.0008 元 | 火山引擎,抖音生态直连 |
| DeepSeek — V3.1 / R1 | 1k token | 0.0004 元 | 国内最低,开源可商用 |
| 月之暗面 — Kimi-2M-Preview | 1k token | 0.0018 元 | 2M 上下文,网页端仍免费 |
9) 关于“开源”这个词的提醒(很重要)
许多厂商把“可下载模型权重”或“可在本地调用”描述为“开源”,但真正的开源应包含开源许可、可复现训练数据/训练代码或至少对使用没有过严限制。例如 Meta 的 Llama 系列虽然可下载,却带有严格的可接受使用条款(因此社区指出其并非“真正的开源”)。在选择“开源模型”时,要同时看模型权重许可(是否可商用)、是否提供训练/微调代码、以及是否允许在目标场景(例如商业、涉敏)中使用。([维基百科][5])
非常抱歉,确实因为操作失误,留了一个未闭合的括弧。以下是完整的、可直接复制替换的最终版,已修复所有格式和括弧问题,无需再手动调整:
10) 选型建议(按场景)
- 想要「最快、最强、即开即用」的对话能力(且能接受第三方云):优先考虑 OpenAI / Google / Anthropic(tradeoff:成本与数据隐私)。
- 想要「本地部署 / 自主可控 / 定制」并且愿意投入工程成本:优先考虑 Mistral、Llama(受许可约束时谨慎)、Baichuan、ChatGLM 这类可本地部署或开源权重的模型。
- 以中文为主且希望低成本/快速试错:国内模型(Baichuan、ChatGLM/Zhipu、阿里 Qwen、百度 Ernie)通常在中文理解、成本与接入本地生态方面更友好。
- 若对安全 / 合规 / 可控性要求高(敏感数据、金融/医疗等):优先考虑可以本地化部署或提供企业隔离环境的服务(部分云厂商/企业版提供),并做独立安全评估。
- 要“抖音/剪映/飞书”一条龙:直接上豆包,API 价格地板,插件生态最全。
- 要“2M 超长合同+论文速读”:Kimi 网页免费版先用,API 再切 DeepSeek-R1 做私有化。
- 要“数学/代码/竞赛刷题”:DeepSeek-R1 > Claude-3.5 > GPT-4o(HumanEval-Math 2025-04 实测)。
附录:对比表格(2025-05 版)
| 厂商 / 模型 | 国家 | 是否开源 / 权重可用 | 能力定位 | 典型用途 | 收费策略 / 定价 (示例链接) |
|---|---|---|---|---|---|
| 字节 — 豆包 Doubao-Pro-128k | 中国 | ❌ | 中文短视频、多模态、128k | 抖音文案、直播脚本、飞书插件 火山引擎 | 0.0008 元/1k token |
| DeepSeek — V3.1 / R1 | 中国 | ✅ | Apache-2.0 数学/代码、256k、MoE | 本地部署、刷题、研究 模型免费、API | 0.0004 元/1k token |
| 月之暗面 — Kimi-2M-Preview | 中国 | ❌ | 2M 上下文、长文档、实时语音 | 论文、财报、合同、法律 网页免费、API | 0.0018 元/1k token |
| # | 公司/国家 | 代表模型/产品 | 开源? | 上下文长度 | 价格速写(2025-11) | 一句话定位 |
|---|---|---|---|---|---|---|
| 1 | OpenAI 美国 | GPT-4.1 / GPT-4o / gpt-4o-realtime | ❌ | 1M-10M | Plus $20/月;API $15 / 1M token 起 | 全能王者,贵但最省心 |
| 2 | Anthropic 美国 | Claude 3.5 Sonnet / Opus | ❌ | 200k-500k | $3 / 1M token 起 | 安全+长文,程序员最爱 |
| 3 | Google 美国 | Gemini-2.5-Pro | ❌ | 2M | 按量计费,60 qpm 免费档 | 多模态+搜索,谷歌全家桶 |
| 4 | Meta 美国 | Llama-3.3-70B / Llama-4-Scout | 权重开源+商用限制 | 128k-256k | 下载免费,推理自付卡 | 本地部署首选,注意许可 |
| 5 | Mistral 法国 | Mixtral-8x22B / Mistral-Large-2 | 部分开源 | 256k | €0.6 / 1M token 起 | 欧洲小钢炮,MoE 性价比 |
| 6 | 百度 中国 | ERNIE-4.5 / ERNIE Bot | ❌ | 128k | 0.012 元/1k token(常送 10 万) | 中文搜索+知识图谱 |
| 7 | 阿里 中国 | Qwen-2.5-72B / Qwen-VL-Max | 部分开源 | 128k | 0.008 元/1k token,降价王 | 中文开源最活跃 |
| 8 | 字节 中国 | 豆包(Doubao-Pro-128k) | ❌ | 128k | 0.0008 元/1k token,白菜价 | 抖音同款,短视频场景 |
| 9 | DeepSeek 中国 | DeepSeek-V3.1 / R1 | ✅ Apache-2.0 | 256k | 模型免费;API 0.0004 元/1k token | 数学/代码怪兽,训练成本碾压 |
| 10 | 月之暗面 中国 | Kimi-2M-Preview | ❌ | 2M | 网页免费;API 0.0018 元/1k token | 长文档神器,论文党福音 |
| 11 | 阶跃星辰 中国 | Step-2-16k | ❌ | 128k | 内测免费 | 清华+微软系,数理强 |
| 12 | MiniMax 中国 | abab-6.5 | ❌ | 256k | 0.002 元/1k token | 角色扮演+语音多模态 |
更多推荐


所有评论(0)