
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Ta不光识别出主食、肉类、蔬菜,还苦口婆心地给出了实用的建议:“今天蛋白质有点多,可以多来点绿叶蔬菜和水果补充维生素和纤维哦”,“可以尽量选择少油少盐的烹饪方式”。这个饭搭子,懂营养搭配,也真心为我好。LongCat 看了一眼,便给出建议:“花毛衣搭配灰裙子适合通勤很舒适,棕色开衫搭配牛仔裤适合周末爬山休闲保暖”,提出“想要拍照”也能立马get出片需求——“这条白色裤子在自然光线下更清新”。面对烧

参照国际数学竞赛官方竞赛大纲,题目被划分为五大类:代数方程与不等式(11 题,占比 22%)、函数与数列(13 题,占比 26%)、几何(5 题,占比 10%)、数论(9 题,占比 18%)、组合数学(12 题,占比 24%),覆盖数学奥赛核心知识点,考察模型在不同领域是否存在能力短板。表现最优的 GPT-5-Thinking(High)正确率仅 52.4%,且大部分模型表现低于 40%,即便头部

本文提出了一站式全模态大模型评测基准——UNO-Bench。该基准通过科学的评测框架,首次揭示了多模态智能并非简单的线性叠加,而是遵循着一种乘积规律,这一规律在能力较弱的模型上体现为瓶颈限制,而在顶尖模型上则表现为协同增益的特性,这个全模态大模型的“组合定律”为行业提供了一种全新的、跨越模型规模的分析范式。LongCat团队的评测结果进一步表明,以Gemini为代表的闭源模型在单模态及跨模态理解上

本文提出了一站式全模态大模型评测基准——UNO-Bench。该基准通过科学的评测框架,首次揭示了多模态智能并非简单的线性叠加,而是遵循着一种乘积规律,这一规律在能力较弱的模型上体现为瓶颈限制,而在顶尖模型上则表现为协同增益的特性,这个全模态大模型的“组合定律”为行业提供了一种全新的、跨越模型规模的分析范式。LongCat团队的评测结果进一步表明,以Gemini为代表的闭源模型在单模态及跨模态理解上








