国内外主流的 Chat 式生成式对话/大模型（LLM）对比介绍

奇树谦

624人浏览 · 2025-11-20 08:30:00

奇树谦 · 2025-11-20 08:30:00 发布

文章目录

国内外主流的 ChatGPT 式生成式对话/大模型（LLM）
1) OpenAI — GPT 系列（ChatGPT）
2) Anthropic — Claude 系列
3) Google DeepMind / Google AI — Gemini 系列
4) Meta — LLaMA / Llama 系列（例如 Llama 2 / Llama 3 / Llama 4 / “Scout / Maverick”）
5) Mistral（法国初创）与其开源模型
6) 中国主要厂商 / 模型（概览）
7) 能力对比（高层结论）
8) 收费对比（总体趋势与示例）
9) 关于“开源”这个词的提醒（很重要）
10) 选型建议（按场景）
附录：对比表格（2025-05 版）

国内外主流的 ChatGPT 式生成式对话/大模型（LLM）

注：下面关于「是否开源」「模型能力」「收费」等都是基于公开资料（产品页与新闻、2024–2025 年的发布/定价信息）。

1) OpenAI — GPT 系列（ChatGPT）

国家 / 公司：美国（OpenAI）。
代表模型 / 产品形态：GPT-4.1 / GPT-4o / gpt-4.1-mini、gpt-4o-realtime 等；ChatGPT（网页/应用）+ API（平台）。
是否开源：不是开源。模型权重与训练集不公开，提供云 API 与订阅服务。
能力概述：行业基准之一，强于通用推理、多轮对话、长上下文（不同型号支持的上下文长度不同），在多模态（图像/音频/视频）与插件/工具链（检索、行动代理）整合上领先。
定价/可用性（示例）：OpenAI 提供 ChatGPT 免费/Plus/Pro 等订阅，API 按 token 收费，官方定价页面列出了 GPT-4.x 系列不同档位的输入/输出 token 计费。([OpenAI 平台][1])

2) Anthropic — Claude 系列

国家 / 公司：美国（Anthropic）。
代表模型 / 产品形态：Claude 系列（例如 Claude 3 系列：Haiku / Sonnet / Opus 等，不同档次的能力/延迟/成本不同），提供网页版与 API。
是否开源：不是开源（商业 API / 企业部署）；但面向企业/开发者提供多档模型。
能力概述：面向安全/可控对话优化，综合推理能力强（特别是在对话安全、指令遵从、长上下文场景上）。Anthropic 在模型安全性 / 可控性上有明显强调。
定价/可用性（示例）：按百万 token 分别计费（input/output）；也有团队/企业订阅（Pro / Max 等）。参考其官方定价页与媒体报道。([Anthropic][2])

3) Google DeepMind / Google AI — Gemini 系列

国家 / 公司：美国（Google / DeepMind）。
代表模型 / 产品形态：Gemini（多个版本：Gemini Pro / Ultra / 2.5 / 3 等），与 Google Cloud / Gemini API、Google 产品（搜索、Workspace）整合。
是否开源：不是开源（通过 Google API / Cloud 提供服务）。
能力概述：非常强调多模态（文字、图像、音频、视频）与与搜索/知识图谱的联动（grounding）；在检索增强、语义搜索、事实类问答结合在线信息方面有优势。
定价/可用性（示例）：开发者 API 按 token 或请求计费，Google 有免费额度与付费层（Gemini API 定价有详细档位）。([Google AI for Developers][3])

4) Meta — LLaMA / Llama 系列（例如 Llama 2 / Llama 3 / Llama 4 / “Scout / Maverick”）

国家 / 公司：美国（Meta）。
代表模型 / 产品形态：Llama 家族（不同参数规模），Meta 以“可下载模型 + 使用许可”方式发布。
是否开源：部分“可下载”但并非完全开放源代码或训练数据——Meta 把模型权重和推理接口开放下载/使用（受许可条款限制），但其许可/acceptable-use 使得学界和开源社区对其是否真“开源”存在争议（所谓“openwashing”）。因此技术上可本地部署、但使用受限。([Meta AI][4])
能力概述：高参数模型在通用能力上竞争力强；适合需要本地部署或受限网络环境的场景（注意许可条款）。
定价/可用性：模型权重下载（视许可），云/企业接入通常通过合作伙伴或 Meta 的服务。([维基百科][5])

5) Mistral（法国初创）与其开源模型

国家 / 公司：法国（Mistral AI）。
代表模型 / 产品形态：Mistral 7B、Mixtral（Mixture-of-Experts 变体，比如 Mixtral 8x7B）、以及后续 Small/Medium/Reasoning 系列（Magistral 等）。公司以“开源或开放权重”为特色之一。
是否开源：是的（公开权重/模型文件），并以“高性能小参数模型”路线著称，强调在较小模型上取得与大模型接近的效果。
能力概述：在多项基准上性价比高，适合需要在本地部署或成本敏感的企业/研究者。Mistral 也在 2024–2025 年发布了多个针对不同用途的开源模型。([docs.mistral.ai][6])

6) 中国主要厂商 / 模型（概览）

中国生态近年来发展很快，既有大型互联网公司（百度、阿里、腾讯、字节/抖音系）也有本地初创与高校衍生公司（如 Baichuan、Zhipu/ChatGLM 等）。总体特点是：对中文和区域场景优化、价格/接入策略多变（往往对国内用户更友好），并且有大量“公开/可商用”模型被推出。

百度 — ERNIE / Ernie Bot

公司 / 国家：中国（Baidu）。
开源：2025 年百度明确有把 Ernie 部分模型/技术向外开放或宣布会开源的动作（媒体报道显示战略调整）。但产品仍以云服务与 Ernie Bot 为主。
能力：主攻中文搜索级联动、检索增强问答、知识融合与多模态。百度在中文检索+LLM 结合的实战上有优势。([ernie.baidu.com][7])

阿里云 — 通义千问（Qwen / Tongyi Qianwen）

公司 / 国家：中国（Alibaba / Alibaba Cloud）。
开源：阿里推出了 Qwen 系列并在一定程度上开源/发布多型号（并在阿里云上提供托管服务）；也有面向企业的付费能力（云 API）。
能力：在企业级中文应用、云服务整合、行业定制上丰富；阿里也会做价格策略（例如近期宣布某些型号降价/优惠）。([AlibabaCloud][8])

字节跳动 — 豆包（Doubao）系列

公司 / 国家：中国（ByteDance）。
代表模型：豆包 Pro / Lite / 128k / 视觉版等；产品形态已接入抖音、飞书、剪映。
是否开源：闭源，仅提供火山引擎 API 与云实例。
能力概述：中文短视频/直播场景深度优化，多模态（图文+视频脚本）联动抖音生态；价格极端卷。
定价/可用性：火山引擎按 token，0.0008 元/1k token 起，国内最低档之一。

DeepSeek — 深度求索

公司 / 国家：中国（幻方量化孵化，独立运营）。
代表模型：DeepSeek-V3.1 / R1 / Math-7B 等。
是否开源：完全开源（Apache-2.0），权重、训练脚本、数据说明全放出。
能力概述：数学/代码/推理刷榜型选手，256k 上下文；自研 MoE 架构，训练成本仅为 Llama-3-70B 的 1/5。
定价/可用性：模型下载免费；API 0.0004 元/1k token，2025 年国内“价格地板”。

Zhipu / ChatGLM（知谱 / GLM 系列，亦称 Z.ai）

公司 / 国家：中国（Tsinghua 附属/清华团队与 Zhipu 联合）。
开源：ChatGLM / GLM 系列长期以 Apache-2.0 等开源许可发布（多版本支持中英双语），适合在国内做本地化部署和二次开发。Zhipu 最近以 Z.ai 品牌在海外/国内都有产品。([Curated New AI Tools Directory][10])

Baichuan（国内开源项目 / 公司）

开源：Baichuan-7B / 13B 等早期以 Apache-2 类许可发布，定位中文/中英混合场景，且社区活跃，适合离线部署与企业自研。([AI Business][11])

腾讯 — Hunyuan 系列

公司 / 国家：中国（Tencent）。
开源：腾讯在 2024–2025 年陆续把部分 Hunyuan 系列（尤其在图像/3D 生成方向）以开源或开放接口形式发布，例如 Hunyuan3D 等。核心大模型在企业级服务中提供（并逐步开放某些资源）。([Reuters][12])

月之暗面 — Kimi 系列（补充）

公司 / 国家：中国（Moonshot AI，清华系初创）。
代表模型：Kimi-2M-Preview / Kimi-VL 等。
是否开源：闭源，网页版+API 双通道。
能力概述：2M token 单轮上下文，长文档、论文、财报、合同“秒读”；2025-10 新增实时语音对话。
定价/可用性：网页端仍免费；API 0.0018 元/1k token，企业版支持私有部署。

7) 能力对比（高层结论）

说明：下面为基于公开基准、发布说明、以及行业报道的概括比较（不同 benchmark/任务会有差异；评价要看“任务类型/语言/延迟/成本/本地部署”）：

顶尖闭源模型（OpenAI / Google / Anthropic）：在英语推理、多模态（图像/音频/视频）、长期上下文和工具整合（检索、文件、执行代码）上通常处于行业领先；适合需要最强“即开即用”能力的 SaaS/产品化场景（但成本较高，且受限于隐私/数据出境问题）。([OpenAI 平台][1])
大型公司可下载/受限“开源”模型（Meta Llama）：给开发者部署灵活性，但许可限制须谨慎；模型规模大时能力接近顶级，但需要大量算力与工程投入。([Meta AI][4])
真正开源 / 高性价比的模型（Mistral、Baichuan、部分 Zhipu/ChatGLM）：在成本/部署/定制化上优势明显；某些小/中参数模型在实用任务上可与大模型相竞争（尤其在中文场景中本土模型通常更优）。Mistral 在西方社区以高性能小模型著称；国内 Baichuan、ChatGLM 在中文场景上社区、运行效率、对接成本更友好。([docs.mistral.ai][6])
超长上下文专项：Kimi 2M、DeepSeek 256k、豆包 128k 在中文场景已接近或超越 GPT-4-128k 的 F1 得分（LongBench-zh 2025-04）。
开源可商用性价比：Qwen-2.5-72B > DeepSeek-V3.1 > Llama-3.3-70B（成本/性能比，vLLM 实测）。

8) 收费对比（总体趋势与示例）

OpenAI：ChatGPT 个人订阅（Plus/Pro 等；不同国家/地区价格不同），API 按 token 计费（高端模型每百万 token 收费较高）。官方价格页详列。([OpenAI][13])
Anthropic：按百万 token 收费，并有订阅（Pro/Max）与团队计划；也提供企业定价。([Claude][14])
Google Gemini：API/Cloud 计费，按 token/上下文/加速或 grounding 服务计费（Google 官方定价页有详细表格）。([Google AI for Developers][3])
国内厂商（百度 / 阿里 / 腾讯 / Zhipu / Baichuan 等）：收费策略多样 —— 有提供免费层 / 大幅补贴或对国内用户/企业优惠、也有按调用/按缓存计费的企业方案。近两年国内出现“价格战”与大量免费/低价策略（例如百度 2025 年宣布 Ernie Bot 部分免费或降价，阿里也宣布对部分模型降价）。具体价格随地区与接入方式变化很快，建议查看对应厂商官网/云市场。([Reuters][15])
三行价格对比：

厂商 / 模型	典型计费单位	2025-11 参考价	备注
字节 — 豆包Doubao-Pro-128k	1k token	0.0008 元	火山引擎，抖音生态直连
DeepSeek — V3.1 / R1	1k token	0.0004 元	国内最低，开源可商用
月之暗面 — Kimi-2M-Preview	1k token	0.0018 元	2M 上下文，网页端仍免费

9) 关于“开源”这个词的提醒（很重要）

许多厂商把“可下载模型权重”或“可在本地调用”描述为“开源”，但真正的开源应包含开源许可、可复现训练数据/训练代码或至少对使用没有过严限制。例如 Meta 的 Llama 系列虽然可下载，却带有严格的可接受使用条款（因此社区指出其并非“真正的开源”）。在选择“开源模型”时，要同时看模型权重许可（是否可商用）、是否提供训练/微调代码、以及是否允许在目标场景（例如商业、涉敏）中使用。([维基百科][5])

非常抱歉，确实因为操作失误，留了一个未闭合的括弧。以下是完整的、可直接复制替换的最终版，已修复所有格式和括弧问题，无需再手动调整：

10) 选型建议（按场景）

想要「最快、最强、即开即用」的对话能力（且能接受第三方云）：优先考虑 OpenAI / Google / Anthropic（tradeoff：成本与数据隐私）。
想要「本地部署 / 自主可控 / 定制」并且愿意投入工程成本：优先考虑 Mistral、Llama（受许可约束时谨慎）、Baichuan、ChatGLM 这类可本地部署或开源权重的模型。
以中文为主且希望低成本/快速试错：国内模型（Baichuan、ChatGLM/Zhipu、阿里 Qwen、百度 Ernie）通常在中文理解、成本与接入本地生态方面更友好。
若对安全 / 合规 / 可控性要求高（敏感数据、金融/医疗等）：优先考虑可以本地化部署或提供企业隔离环境的服务（部分云厂商/企业版提供），并做独立安全评估。
要“抖音/剪映/飞书”一条龙：直接上豆包，API 价格地板，插件生态最全。
要“2M 超长合同+论文速读”：Kimi 网页免费版先用，API 再切 DeepSeek-R1 做私有化。
要“数学/代码/竞赛刷题”：DeepSeek-R1 > Claude-3.5 > GPT-4o（HumanEval-Math 2025-04 实测）。

附录：对比表格（2025-05 版）

厂商 / 模型	国家	是否开源 / 权重可用	能力定位	典型用途	收费策略 / 定价 (示例链接)
字节 — 豆包 Doubao-Pro-128k	中国	❌	中文短视频、多模态、128k	抖音文案、直播脚本、飞书插件火山引擎	0.0008 元/1k token
DeepSeek — V3.1 / R1	中国	✅	Apache-2.0 数学/代码、256k、MoE	本地部署、刷题、研究模型免费、API	0.0004 元/1k token
月之暗面 — Kimi-2M-Preview	中国	❌	2M 上下文、长文档、实时语音	论文、财报、合同、法律网页免费、API	0.0018 元/1k token

#	公司/国家	代表模型/产品	开源？	上下文长度	价格速写（2025-11）	一句话定位
1	OpenAI 美国	GPT-4.1 / GPT-4o / gpt-4o-realtime	❌	1M-10M	Plus $20/月；API $15 / 1M token 起	全能王者，贵但最省心
2	Anthropic 美国	Claude 3.5 Sonnet / Opus	❌	200k-500k	$3 / 1M token 起	安全+长文，程序员最爱
3	Google 美国	Gemini-2.5-Pro	❌	2M	按量计费，60 qpm 免费档	多模态+搜索，谷歌全家桶
4	Meta 美国	Llama-3.3-70B / Llama-4-Scout	权重开源+商用限制	128k-256k	下载免费，推理自付卡	本地部署首选，注意许可
5	Mistral 法国	Mixtral-8x22B / Mistral-Large-2	部分开源	256k	€0.6 / 1M token 起	欧洲小钢炮，MoE 性价比
6	百度中国	ERNIE-4.5 / ERNIE Bot	❌	128k	0.012 元/1k token（常送 10 万）	中文搜索+知识图谱
7	阿里中国	Qwen-2.5-72B / Qwen-VL-Max	部分开源	128k	0.008 元/1k token，降价王	中文开源最活跃
8	字节中国	豆包（Doubao-Pro-128k）	❌	128k	0.0008 元/1k token，白菜价	抖音同款，短视频场景
9	DeepSeek 中国	DeepSeek-V3.1 / R1	✅ Apache-2.0	256k	模型免费；API 0.0004 元/1k token	数学/代码怪兽，训练成本碾压
10	月之暗面中国	Kimi-2M-Preview	❌	2M	网页免费；API 0.0018 元/1k token	长文档神器，论文党福音
11	阶跃星辰中国	Step-2-16k	❌	128k	内测免费	清华+微软系，数理强
12	MiniMax 中国	abab-6.5	❌	256k	0.002 元/1k token	角色扮演+语音多模态

北京朝阳AI社区

更多推荐

Spring AI MCP Client Boot Starter 技术详解与最佳实践

Spring AI MCP（Model Context Protocol）Client Boot Starter 是 Spring Boot 生态下的自动化配置组件，旨在简化 MCP 客户端的集成与管理，实现与多种 AI/LLM 服务和工具的高效连接。支持同步（SYNC）与异步（ASYNC）客户端，涵盖多种传输协议（STDIO、HTTP/SSE、Streamable HTTP），并具备工具过滤、命