登录社区云,与社区用户共同成长
邀请您加入社区
暂无图片
马斯克旗下xAI发布Grok4Fast模型,以超高性价比震撼AI行业:速度达GPT-5的2.5倍,成本降低98%,支持200万token长文本处理。该模型通过"双模式合一"设计和优化token利用率实现性能突破,在多项测试中媲美甚至超越GPT-5和Gemini2.5Pro。此次发布标志着AI竞争进入"性价比+工具化+生态化"新阶段,或将加速高端AI的民主化进
摘要:清华大学与OpenBMB团队推出的InfLLM-V2框架创新性地解决了大语言模型处理长文本的效率瓶颈问题。该框架采用零额外参数的原生稀疏注意力机制,通过动态切换稠密/稀疏模式,在短文本保持原生效率,在长文本实现4-9倍加速。关键技术包括块选择机制和统一注意力计算,仅需5B训练数据即可完成适配,在128K文本处理中内存降低50%。实验显示其在保持与稠密注意力相当性能的同时,显著提升了训练和推理
复旦大学联合字节跳动团队推出AgentGym-RL智能体训练框架,基于华为昇腾910B算力,仅用70亿参数的小模型就在网页导航、科学实验等场景超越GPT-4o等大模型。该框架采用模块化设计,独创ScalingInter-RL训练方法,在效率提升1.8倍的同时,实现了小模型媲美商业大模型的性能表现。目前已在网页自动化、科学实验、机器人控制等五大场景落地应用,未来还将开放多智能体协同功能并全面开源,标
这篇指南详细介绍了在Windows系统安装和使用ClaudeCode的完整流程。主要内容包括:1)安装Node.js和Git等必要工具;2)通过npm安装ClaudeCode并验证;3)获取API密钥并配置环境变量;4)将ClaudeCode集成到VSCode扩展中。文章提供了每个步骤的详细说明和验证方法,即使是新手也能轻松完成安装。最后还展示了如何使用ClaudeCode编写俄罗斯方块程序,帮助
Academic Agents Studio是一个面向学术研究的AI智能体平台,基于Qwen-Agent框架和MCP协议构建,提供论文写作、文献分析、代码解释等学术服务。核心特色包括:深度优化的学术场景功能、多模型支持(GPT/Claude/Gemini等)、智能文档处理(PDF/LaTeX/Markdown)、友好的科技感交互界面。平台支持本地/云端部署,提供智能体协作、工具调用可视化、异步任务
DeepSeek团队开源了革命性的OCR模型DeepSeek-OCR,由Haoran Wei等研究者开发。该模型采用"视觉-文本压缩"创新思路,通过双塔融合架构(DeepEncoder视觉编码器和DeepSeek3B-MoE解码器)实现16倍下采样压缩,仅需100个视觉Token即可超越传统OCR的识别效果。其突破性技术包括:支持10倍压缩下97%的识别精度、复杂内容解析(化学
令人惊叹的是,Qwen3-Omni在音频和视频任务上取得统治级表现的同时,在文本和图像任务上的性能并未丝毫受损,甚至在某些任务上超越了参数量更大的单模态模型。这表明它不仅能看懂图片,还能进行基于视觉信息的复杂推理。最令人印象深刻的是,在需要同时理解音频和视觉信息的DailyOmni测试中,Qwen3-Omni获得75.8分,超过Gemini-2.5-Flash-Thinking的72.7分。处理视
【摘要】Anthropic发布Claude Haiku 4.5模型,这款轻量级AI实现性能跃升,支持20万token上下文窗口与图像理解,新增"扩展思考"、"电脑操作"等高级功能。实测显示其性能接近顶级Sonnet 4.5,价格仅为1/3,在编程、视觉推理等任务中表现优异。特别在计算机操作测试中,任务成功率高达50.7%,远超前代产品,成为性价比极高的AI助
美团推出5600亿参数开源大模型LongCatAI,采用混合专家(MoE)架构实现高效推理。该模型通过动态选择专家子网络和零计算专家机制,平均仅激活270亿参数,在多项基准测试中表现优异。目前已获超1.2万GitHub星标,30+工具适配,未来计划扩展多模态能力和行业解决方案。
蚂蚁集团开源万亿参数大模型Ling-1T,在12项复杂推理测试中取得领先成绩。该模型采用混合专家架构(MoE)、FP8混合精度训练等创新技术,实现高效推理和精准输出。Ling-1T在语言学习、智能交互、内容创作等领域展现强大应用潜力,支持128K长文本处理和多语言任务。模型已开源,用户可通过Hugging Face和ModelScope获取,还提供在线体验平台。文章详细介绍了技术原理、应用场景和使