Novite x Harbor 基于terminal-bench 2.1 89题的测评题库 linghun ai编程智能体获得名次

A-灵魂

303人浏览 · 2026-06-28 11:00:20

A-灵魂 · 2026-06-28 11:00:20 发布

Novita x Harbor Agent Benchmark是：
一个基于 Harbor评估框架 和 Novita Agent Sandbox云环境，通过 黑客松竞赛 形式，在 Terminal-Bench 2.1 任务上对AI智能体进行基准测试，并产生 实时竞技排行榜 的综合性项目。

Linghun 已完成 Novita x Harbor Agent Benchmark 四个公开 TB2.1 榜单的运行与提交：

榜单	提交时名次	Harbor记录
File & Recovery	第 2 名	f77879ac-b30f-47bb-8fb1-650108364fc0
Systems & Security	第 1 名	151a5351-bbf9-45c9-ae2f-1f8db1cd0619
Data & Science	第 1 名	dc4a720b-79a5-49dd-b083-6fc40acd1079
Code & Debug	第 3 名	23a26b7f-f1c0-4653-b0c2-4ecc4acae4de

项目地址和文档

GitHub：
https://github.com/linghungegeg/Linghun
中文白皮书：
https://github.com/linghungegeg/Linghun/blob/main/WHITEPAPER.md
英文 README：
https://github.com/linghungegeg/Linghun/blob/main/README.en.md
许可证：
Apache License 2.0

最后

欢迎大家体验、提 issue、提建议。
在这里插入图片描述

亚马逊云科技技术品牌专区

更多推荐

2026年量化工具选择，要跟着能力基础走

读者应理解，选择工具前要先判断自己的能力基础和当前任务。工具应该帮助自己补上当前最关键的缺口，而不是替代学习顺序本身。

亚马逊云科技技术品牌专区

近期零基础学量化，先按基础差异拆学习顺序

读者应明白，拆解学习顺序时要先看自己的基础缺口，再决定哪一段需要放慢。不同流程阶段都有不同检查任务，学习路线要能反映这些差异。

亚马逊云科技技术品牌专区

加州理工 CS367 C 语言系统编程笔记（一）

C语言是一种强大且广泛使用的编程语言，尤其在系统编程领域。本节课我们将学习C语言的基础语法，包括如何编写“Hello, World!”程序、声明变量以及使用基本数据类型。我们将通过实际的代码示例来加深理解。本节课中我们一起学习了C语言的基础语法，包括如何编写和运行一个简单的C程序、声明变量以及使用基本数据类型。我们还介绍了如何使用Shell环境来编译和运行程序。通过对比Java，你可以看到C语言在