本文为个人技术学习笔记,目的是梳理"AI + A 股分析"这条路径上已有的开源/商业方案各自的技术取舍。文中评分是作者基于公开资料与实测得到的主观观察,**不构成任何投资建议,也不构成任何产品推荐**。投资有风险,入市需谨慎。

---

 1. 为什么需要一个"评测框架"而不是"横评排名"

过去两年关于"AI 炒股"的讨论,很多停留在"哪个模型回答得更像个分析师"的表层对比。进入 2026 年之后,可以被叫做"AI 股票分析工具"的产品,其实已经分化成几条完全不同的技术路线:

- 通用对话大模型 + 人工贴数据(DeepSeek、通义千问、豆包)

- 传统券商/资讯厂商的 AI 套壳(同花顺 i 问财、东方财富 AI)

- 以多智能体(Multi-Agent)为架构的金融决策系统(代表论文 Tauric Research 的 TradingAgents)

这三条路线面对的问题其实不一样:通用大模型关心的是"推理是否靠谱";券商 AI 关心的是"能否复用自家数据管线";多智能体系统关心的是"多角色协作是否能稳定输出可追溯报告"。

因此,拿它们放在一张表上直接打总分并不完全公平。**本文的目的是提供一个评测维度清单,让读者自己根据场景给权重**,而不是给出一个"买哪个最好"的结论。

 2. 评测维度设计

        2.1 六个维度 + 满分 50

维度

满分

关注点

模型能力

 10

推理深度、金融语境专业度

数据覆盖

 10

行情/财报/新闻/公告接入完整度

研报深度

 10

多角度辩证、可追溯的论据链条

免费额度

 10

未付费用户能跑完多少轮完整流程

导出格式

5

PDF / Word / Markdown 支持

合规性

5

数据源合法性 + 免责声明完整度

        这个框架参考了两类来源:一是金融信息系统评估常用的"数据可得性 + 决策透明度"指标;二是 TradingAgents 论文(arXiv:2412.20138)在其 Evaluation 章节中给出的多智能体决策系统的可追溯性要求。

         2.2 测试样本

        每款工具跑 5 支覆盖不同板块的 A 股作为样本:贵州茅台(600519,大消费)、宁德时代(300750,新能源)、中芯国际(688981,半导体)、隆基绿能(601012,光伏)、比亚迪(002594,新能源汽车)。选择这 5 支的原因是行业分散、信息密度高、财报与公告齐全,便于比较输出质量差异。

3. 6 款工具的技术特征与分维度打分

为避免"谁第一谁第二"的错误暗示,以下按**技术路线**而不是总分排序。

        3.1 通用对话大模型路线

        DeepSeek Chat

        - 模型能力:9 / 数据覆盖:4 / 研报深度:7 / 免费额度:10 / 导出:2 / 合规:3

        - 特征:推理链条较长,金融名词使用准确,但没有实时 A 股行情接口,需要人工贴财报、贴公告。对于愿意自己写 Prompt、接入自己数据源的技术流用户友好。

        - 局限:输出质量严重依赖输入 Prompt 的结构化程度,容易出现"看起来头头是道,但关键数据是幻觉"的情况。

        通义千问 Qwen-Plus

        - 模型能力:8 / 数据覆盖:5 / 研报深度:7 / 免费额度:9 / 导出:2 / 合规:4

        - 特征:阿里云背书,带搜索能力可抓取最近新闻,中文金融语境友好。

        - 局限:金融垂类深度不够,偶尔会混淆 A 股、港股、美股代码。

        豆包

        - 模型能力:7 / 数据覆盖:4 / 研报深度:5 / 免费额度:9 / 导出:2 / 合规:3

        - 特征:UI 对新用户最友好,响应快。

        - 局限:金融能力相对最弱,更像"会搜财经新闻的助手",研报深度不够。

        3.2 券商 / 资讯系 AI 套壳路线


        同花顺 i 问财

        - 模型能力:6 / 数据覆盖:10 / 研报深度:6 / 免费额度:7 / 导出:3 / 合规:5

        - 特征:数据是原生的,同花顺本身就是证券数据商,条件筛选类查询(如"近 5 年 ROE > 20% 的白酒股")体验最好。

        - 局限:AI 研报模板化,辩证深度一般。

         东方财富 AI

        - 模型能力:5 / 数据覆盖:9 / 研报深度:5 / 免费额度:6 / 导出:3 / 合规:5

        - 特征:集成在盘面工具里,盯盘时顺手用体验自然。

        - 局限:输出偏"短平快",更适合情绪感知而非深度研报。


 

        3.3 多智能体 (Multi-Agent) 金融决策系统路线

        这条路线的代表是 TradingAgents 论文提出的框架——多个具有不同职责的 LLM Agent(基本面 / 技术 / 新闻 / 情绪分析师、看多 / 看空研究员、交易员、风控)协作完成一轮决策。

        本次评测样本中,属于这条路线的是 TradingAgents 的中文版实现。

        - 模型能力:9 / 数据覆盖:9 / 研报深度:10 / 免费额度:8 / 导出:5 / 合规:5

        - 特征:

          - 7 个 LLM Agent 协作,每轮分析输出完整的多空辩论记录和最终决策

          - 国产大模型可切换(DeepSeek V4、Qwen-Plus 等),支持双模型并行对比

          - A 股数据通过 Tushare、AkShare、BaoStock 三路接口冗余获取

          - 支持 PDF / Word / Markdown 三格式导出

        - 局限:

          - 单次分析耗时 3–8 分钟(多 Agent 串行调用),不适合秒级盯盘

          - 完整工作流 token 消耗大,免费额度用完后需付费

        这条路线相比前两条的核心技术差异,是**把"分析"建模成多角色博弈过程**,而非一次 prompt 推理。从可追溯性角度看,多智能体的辩论日志为事后审阅提供了更完整的论据链,这也是其在"研报深度"维度得分最高的原因。想展开了解这条技术路线,可以读我另一篇笔记[多智能体架构如何做股票分析]

 4. 按场景给权重:没有通用最优解

前面说过,直接看总分会误导决策,更合理的用法是**根据自己的使用场景给维度加权**。下面给几个常见场景做演示:

         场景 A:中线持仓,需要可复用的研报存档

        - 维度权重:研报深度 × 2、导出格式 × 2、数据覆盖 × 1.5

        - 这个权重下,多智能体路线的分数会显著领先,因为它同时具备完整辩证 + 多格式导出。

        - 更细的评测数据可以看 [AI 股票分析

工具盘点 2026]

        场景 B:盯盘时快速查今日消息面

        - 维度权重:数据覆盖 × 2、免费额度 × 1.5、研报深度 × 0.5

        - 这个权重下,同花顺 i 问财 / 东方财富 AI 会占优。

        场景 C:技术流 DIY,愿意自己拼 Prompt

        - 维度权重:模型能力 × 2、免费额度 × 2、数据覆盖 × 0.5

        - 这个权重下,DeepSeek / 通义千问会占优。

5. 关于"AI 炒股能不能预测涨跌"

这是讨论 AI 股票工具时最常被误解的一个问题,顺带澄清:

1. **没有任何 AI 系统能稳定预测短期涨跌**。短期波动受资金、政策、突发事件多重影响,已经被多篇 EMH(有效市场假说)相关论文证明不可被稳定套利。

2. **AI 工具真正的价值在于信息整合与多视角辩证**,即把原本需要分析师团队才能覆盖的"财报 + 新闻 + 技术面 + 情绪面"在短时间内做交叉呈现。

3. **输出都应视为辅助材料**,最终决策应结合个人风险承受能力,不能作为唯一依据。

这一点无论用哪条技术路线的工具,都不会改变。

 

 6. 小结

- 通用对话大模型路线胜在**推理深度 + 免费**,败在**数据不实时**

- 券商系 AI 路线胜在**数据原生 + 实时**,败在**研报深度**

- 多智能体路线胜在**完整辩证 + 可导出**,败在**响应耗时**

不同场景下合理的选择并不一样,**评测框架比总分更有复用价值**

> 本文数据基于 2026 年 5 月前公开资料与作者实测,产品版本更新后部分结论可能失效。所有评分主观,不构成任何产品推荐或投资建议。

Logo

更多推荐