cover

马斯克旗下xAI发布Grok-1.5，相比较开源的Grok-1，各项性能大幅提升，接近GPT-4！

继Grok-1开源之后，xAI宣布了Grok-1.5的内测消息，并预告即将全面商用，这一消息无疑为AI技术爱好者和开发者社区带来了新的兴奋点。

文章共876字 · 阅读需要大约3分钟

一键AI生成摘要，助你高效阅读

问答

数据学习（Datalearner）

1100人浏览 · 2024-03-29 12:07:25

数据学习（Datalearner） · 2024-03-29 12:07:25 发布

本文原文来自DataLearnerAI官方网站：马斯克旗下xAI发布Grok-1.5，相比较开源的Grok-1，各项性能大幅提升，接近GPT-4！ | 数据学习者官方网站(Datalearner)

继Grok-1开源之后，xAI宣布了Grok-1.5的内测消息，并预告即将全面商用，这一消息无疑为AI技术爱好者和开发者社区带来了新的兴奋点。

Grok-1.5的技术突破

Grok-1.5在性能上的提升是显著的。根据官方发布的数据，Grok-1.5在综合理解能力MMLU评测上达到了81.3分，超越了MistralAI的Mixtral Large模型。在数学推理能力GSM8K的评测中，Grok-1.5更是取得了90分的高分，与业界领先的GPT-4和Claude-3 Sonnet相差无几。

Grok-1.5在DataLearnerAI综合评测排行

在DataLearnerAI收集的全球大模型综合评测数据上，Grok-1.5表现也非常好。按照GSM8K排序，结果如下：

数据来源：大模型综合评测对比 | 当前主流大模型在各评测数据集上的表现总榜单 | 数据学习 (DataLearner)

可以看到，GSM8K在目前的评测上，Grok-1.5已经是全球第四，最好的模型之一了。其它评测结果也是类似，说明Grok-1.5已经达到了第一梯队。而按照编程能力评测的结果，以Human Eval排序为例，结果如下：

数据来源：大模型代码能力评测对比 | 当前主流大模型在代码能力上的表现总榜单 | 数据学习 (DataLearner)

可以看到，Grok-1.5依然排名很高，作为一个综合基础大模型，这样的成绩非常好。略超Claude3-Sonnet！

支持128K上下文长度

Grok-1.5的另一个亮点是支持最高128K的上下文长度，这是第一代Grok-1的8K上下文长度的显著提升。在大海捞针测试中，Grok-1.5表现出色，这一特性对于处理长文本和复杂对话场景具有重要意义。

关于Grok-1.5的详情参考DataLearnerAI原文：马斯克旗下xAI发布Grok-1.5，相比较开源的Grok-1，各项性能大幅提升，接近GPT-4！ | 数据学习者官方网站(Datalearner)

GitCode 开源社区

旨在为数千万中国开发者提供一个无缝且高效的云端环境，以支持学习、使用和贡献开源项目。

更多推荐

cover

GitTalk | 使用面向业务的狮偶编程语言提升开发效率

GitCode 开源社区

cover

GitTalk | DevUI Suits 场景解决方案

GitCode 开源社区

cover

GitTalk | DevUI Admin 前端项目构建

GitCode 开源社区

所有评论(0)

查看更多评论

数据学习（Datalearner）

已为社区贡献3条内容