logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

DeepSeek低调开源LPLB:用线性规划破解MoE训练负载均衡难题

**摘要:**DeepSeek低调开源LPLB项目,这是一个基于线性规划的MoE模型负载均衡器,旨在优化专家并行架构中的动态负载分配问题。LPLB通过动态重排序、构建副本和线性规划求解三个步骤,解决MoE训练中GPU资源利用不均的痛点。该项目目前处于研究阶段,支持多种拓扑结构,但存在求解延迟和非线性计算成本等局限。LPLB的创新在于利用数学工具优化实时分配,为MoE训练加速提供了重要参考。

文章图片
#开源#人工智能#拓扑学
在Windows上使用Codex并集成到VS Code的完整指南

本文提供Windows系统下Codex CLI安装及VSCode集成完整指南。首先需安装Node.js、Git等必备工具,通过npm安装Codex CLI并配置API密钥和环境变量。接着详细介绍如何将Codex集成到VSCode编辑器:只需安装官方插件即可实现AI编程辅助。全文包含详细的操作步骤和验证方法,帮助开发者快速搭建AI编程环境,提升开发效率。

文章图片
#windows
在Windows上使用Codex并集成到VS Code的完整指南

本文提供Windows系统下Codex CLI安装及VSCode集成完整指南。首先需安装Node.js、Git等必备工具,通过npm安装Codex CLI并配置API密钥和环境变量。接着详细介绍如何将Codex集成到VSCode编辑器:只需安装官方插件即可实现AI编程辅助。全文包含详细的操作步骤和验证方法,帮助开发者快速搭建AI编程环境,提升开发效率。

文章图片
#windows
在Windows上使用Codex并集成到VS Code的完整指南

本文提供Windows系统下Codex CLI安装及VSCode集成完整指南。首先需安装Node.js、Git等必备工具,通过npm安装Codex CLI并配置API密钥和环境变量。接着详细介绍如何将Codex集成到VSCode编辑器:只需安装官方插件即可实现AI编程辅助。全文包含详细的操作步骤和验证方法,帮助开发者快速搭建AI编程环境,提升开发效率。

文章图片
#windows
Google推出Gemini 3!又一革命性的模型!

是什么让Openai程序员深夜紧急推出GPT 5.1 pro

文章图片
#人工智能
Gemini 3还没捂热,GPT-5.1 Pro已悄然反超!OpenAI这波静默突袭太狠

OpenAI发布ChatGPT-5.1Pro,在专业推理和用户体验上实现双重突破。该模型在医疗、编程等专业领域表现出色,GPQADiamond测试达89.4%高分。创新性地引入自适应推理机制,能根据问题复杂度智能调整响应方式,并提供8种个性化对话风格选择。多模态支持扩展至音频和视频输入,实现全方位信息处理。在交互体验上,通过智能记忆和共情回应,使AI助手展现出更高情商,让对话更自然贴心。这些升级使

文章图片
#人工智能
阿里Qwen3-Omni重磅发布:多模态AI进入“全优不偏科”时代

令人惊叹的是,Qwen3-Omni在音频和视频任务上取得统治级表现的同时,在文本和图像任务上的性能并未丝毫受损,甚至在某些任务上超越了参数量更大的单模态模型。这表明它不仅能看懂图片,还能进行基于视觉信息的复杂推理。最令人印象深刻的是,在需要同时理解音频和视觉信息的DailyOmni测试中,Qwen3-Omni获得75.8分,超过Gemini-2.5-Flash-Thinking的72.7分。处理视

文章图片
#人工智能
超越视觉极限:Mini-o3复现OpenAI o3强大推理能力,开启多轮视觉搜索新纪元

o3的核心特点是能够产生数十步的思维链条,支持多种推理模式(如深度优先搜索、试错探索和自我反思),并且推理轮次越多,准确率越高。特别是在挑战性的VisualProbe-Hard数据集上,Mini-o3达到了48.0%的准确率,显著超过其他开源模型(DeepEyes为35.1%,Pixel Reasoner为28.8%)。这项工作的意义不仅在于复现了OpenAI o3类模型的能力,更重要的是为多模态

文章图片
超越视觉极限:Mini-o3复现OpenAI o3强大推理能力,开启多轮视觉搜索新纪元

o3的核心特点是能够产生数十步的思维链条,支持多种推理模式(如深度优先搜索、试错探索和自我反思),并且推理轮次越多,准确率越高。特别是在挑战性的VisualProbe-Hard数据集上,Mini-o3达到了48.0%的准确率,显著超过其他开源模型(DeepEyes为35.1%,Pixel Reasoner为28.8%)。这项工作的意义不仅在于复现了OpenAI o3类模型的能力,更重要的是为多模态

文章图片
百度发布文心一言5.0预览版大模型:多模态能力全面超越GPT-5?

百度声称,该模型的多模态融合使其能够比依赖特定模态编码器的模型更有效地生成和解读视觉内容,并具备更强的上下文感知能力。虽然百度没有公开完整的基准测试细节或原始分数,但其性能定位表明,百度有意将 ERNIE 5.0 定位为旗舰模型,而不是小众的多模态系统,该旗舰模型可以与通用推理领域最大的封闭模型相媲美。百度声称,该模型在基于文档和图表的基准测试中击败了 GPT-5-High 和 Gemini 2.

文章图片
    共 124 条
  • 1
  • 2
  • 3
  • 13
  • 请选择