
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
此外,该版本在多模态性能方面也有显著提高,经过评估,VITA-1.5在 MME、MMBench 和 MathVista 等多个基准测试中的平均性能从59.8提升至70.8,展现了出色的能力。近日,腾讯旗下VITA-MLLM 团队宣布推出 VITA-1.5,这是该团队在 VITA-1.0基础上推出的升级版本,致力于提升多模态交互的实时性与准确性。为了确保多模态能力的平衡,VITA-1.5采用了渐进式

与以往不同的是,此次开源不仅包括模型本身,还涵盖了更小的版本,如QwQ-32B,这些版本可以部署在本地设备上,进一步推动AI技术的普及和应用。2月25日,阿里巴巴宣布推出基于Qwen2.5-Max的推理模型QwQ-Max-Preview,并计划全面开源其最新推理模型QwQ-Max和Qwen2.5-Max。此次开源的QwQ-Max和Qwen2.5-Max模型,预计将为开发者和企业提供更强大的推理能力

Align-DS-V是DeepSeek-R1-Distill-Llama-8B中的一个实验性视觉语言模型,由PKU-Alignment团队和香港科技大学共同开发,重点是通过全模态对齐增强推理能力。

这意味着,无论是政治、社会还是文化等领域,模型都应以中立的态度进行交流,而不是局限于特定的视角或立场。这一政策的实施将可能影响到未来 AI 的应用场景,特别是在新闻报道、教育、社交媒体等领域,用户能够接触到更为多元的观点,从而拓宽视野。在最近的一次声明中,OpenAI 正式更新了其模型规范,强调其人工智能模型将不再回避敏感话题,也不会排斥某些观点。OpenAI 在这次规范更新中展现了其对思想自由的

根据 Arc Prize 排行榜,诸如 OpenAI 的 o1-pro 和 DeepSeek 的 R1等 “推理型” AI 模型在 ARC-AGI-2测试中的得分仅在1% 到1.3% 之间,而更为强大的非推理模型,例如 GPT-4.5、Claude3.7Sonnet 和 Gemini2.0Flash 的得分也大约在1%。与此同时,Arc Prize 基金会还宣布了2025年的 Arc Prize

LLaVA-Rad 模型的训练基于来自七个不同来源的697,435对放射学图像与报告的数据集,专注于胸部 X 光(CXR)成像,这是最常见的医学影像检查类型。在生物医学领域,基于大规模基础模型的研究已经展现出良好的应用前景,尤其是在多模态生成 AI 的发展下,可以同时处理文本与图像,从而支持视觉问答和放射学报告生成等任务。LLaVA-Rad 的发布,无疑是推动基础模型在临床环境中应用的一大步,为放

从客厅插花到厨房做饭,从超市收银到工厂分拣,AgiBot World涵盖了家居、餐饮、工业、商超和办公五大核心场景,收录了八十余种日常生活技能。智元还透露了2025年的规划蓝图,包括开源全量数据、发布仿真数据集、推出具身基座大模型、发布完整工具链,并将举办一系列挑战赛。这些先进的硬件设施使机器人能够完成从简单的抓取放置到复杂的双臂协同操作等多样化任务。这个开源项目的发布,不仅标志着中国在具身智能领

它采用独特的“UltraFusion” 技术,将两颗 M3 Max 芯片融合,拥有最高32核 CPU、80核 GPU 以及32核神经网络引擎,最高支持512GB统一内存,内存带宽高达 819GB/s,性能远超前代 M2 Ultra 芯片。然而,如此强劲的性能也意味着不菲的价格。据国外知名科技博主 Dave Lee 测试,苹果最新推出的 Mac Studio 搭载 M3 Ultra 芯片,能够高效运

火山引擎发布了开源的大模型生态平台MCP Servers,旨在简化大模型应用的开发过程。该平台通过MCP协议允许企业封装和共享自研工具,形成一个互利共赢的生态系统。MCP Servers集成了多种高频场景的工具,如搜索、数据库和业务系统API,使开发变得像搭积木一样简单。此外,火山引擎推出了“MCP Market+火山方舟+Trae”的全链路开发闭环,支持从工具调用、模型推理到应用部署的一站式服务

值得注意的是,该插件还支持通过 Ollama 在本地部署 DeepSeek R1,配合知识库功能可实现离线使用,进一步保障了数据安全。2025年2月14日消息:近日,一款支持将 DeepSeek R1模型无缝接入 Visual Studio Code 的开源插件在开发者社区获得广泛关注,目前在 VSCode 插件市场的安装量已突破4万次。在用户体验方面,插件提供中文、英文等多语言界面支持,并特别注








