logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Liquid新模型:LFM2-24B-A2B用MoE架构重新定义大模型性价比

大模型领域正在经历一场静默的架构革命。当行业还在参数规模的军备竞赛中厮杀时,一家来自麻省理工的初创公司正用一套截然不同的思路重新定义效率的边界。

#架构#人工智能
1.5B小模型逆袭!DeepScaleR如何用强化学习颠覆AI数学竞赛规则

然而,近期,加州大学伯克利分校的研究团队通过开发一款1.5B参数的DeepScaleR模型,并通过强化学习(RL)微调,成功超越了OpenAI的o1-preview。通过精巧的训练方法和高质量的数学数据集,他们在1.5B参数的小模型上成功应用了强化学习,提升了推理能力,并超越了OpenAI的o1-preview。例如,在使用大量参数和上下文的传统大模型训练时,训练成本通常会达到数百万美元,甚至更多

文章图片
#人工智能#算法
Qwen-3.5:当混合专家架构遇上原生多模态,国产大模型站上新高度

Qwen-3.5 的意义,远不止于又一个性能更强的开源模型。通过架构创新和工程优化,完全可以在有限的资源约束下,实现超越庞大参数模型的性能表现。当 OpenAI 和 Anthropic 还在用闭源 API 构筑护城河时,阿里选择了开源和普惠的道路。当行业陷入“参数军备竞赛”的焦虑时,Qwen-3.5 证明了效率与性能可以兼得。当开发者抱怨顶级模型太贵、太黑盒、太难部署时,0.8 元每百万 Toke

#架构
CSGHub 一键安装指引|从零开始搭建大模型资产管理平台

通过以上步骤,您已经成功安装并配置了 CSGHub。接下来,您可以开始使用平台的功能来管理您的大模型和相关数据。如果在安装过程中遇到任何问题,请参考我们的安装文档中常见问题解答或联系技术支持。我们期待您能通过 CSGHub 高效地管理和开发您的AI项目,助力您的企业实现更高效、更安全的AI管理!

文章图片
#人工智能#算法#开源
OpenCSG Q&A:您的国产大模型与 Agent 管理平台

随着大模型技术的飞速发展,越来越多的企业和个人开始关注国产化、私有化的大模型部署与管理方案。OpenCSG 及其核心产品 CSGHub 正是为此而生,致力于提供一站式、企业级的大模型与 Agent 管理平台。

文章图片
#人工智能#开源
传神社区|数据集合集第1期|中文NLP数据集合集

传神社区|数据集合集第1期|中文NLP数据集合集

文章图片
#人工智能
Fineweb-Edu-Chinese V2.2:重塑中文大模型训练质量的新一代高价值数据集

当大模型竞争逐步从“更大规模”转向“更高质量”,Fineweb-Edu-Chinese V2.2 所代表的,已经不仅是一份中文数据集,而是一种清晰的行业信号。中文大模型能力的下一轮跃迁,很可能不再来自参数膨胀,而来自对数据价值的重新理解与系统化建设。对于希望构建长期可演进模型能力的团队而言,Fineweb-Edu-Chinese V2.2 不只是“可用的数据”,而是一项值得纳入核心训练体系的高价值

#人工智能#深度学习#算法
为什么 Fineweb-Edu-Chinese V2.2 正在成为中文大模型训练的“隐形基础设施”

在大模型竞争日趋理性的阶段,Fineweb-Edu-Chinese V2.2 所代表的,并不是某种“捷径”,而是一种更稳健的发展路径。模型能力的根基,始终来自数据本身。当更多团队开始在数据工程上投入与模型工程同等的精力时,Fineweb-Edu-Chinese V2.2 这样的数据集,正在从“工具”转变为中文大模型生态中的关键基础组件。关于OpenCSG从社区到产业:OpenCSG打造AI模型新基

#人工智能#python#机器学习
中文大模型的底层秩序,正在被 OpenCSG 重写

大模型竞争的下半场,是数据结构的竞争。OpenCSG 并没有选择只发布模型,而是在重构中文训练数据的底层逻辑。Fineweb-Chinese 只是这个体系的起点。当数据被工程化、被规模化、被持续迭代,中文大模型的上限将不再依赖封闭资源,而建立在开放且可验证的基础设施之上。这,才是 Fineweb-Chinese 在论文中的真正价值。也是 OpenCSG 正在构建的长期优势。关于OpenCSG从社区

#人工智能
从数据集到数据体系:OpenCSG 正在重塑中文大模型的训练基础

大模型的发展已经进入更理性的阶段。模型规模依然重要,但真正决定长期上限的,是数据结构的稳定性与质量。OpenCSG 通过系统化的数据工程方法,为中文大模型建立了更加清晰的训练基础。Fineweb-Chinese 只是这个体系中的一部分,但它展示了一个方向:高质量中文语料可以通过工程化方式持续提升,而不再依赖零散资源。当数据被当作长期资产管理,模型能力的跃迁也就变得可预期。这或许是中文大模型真正进入

#开源#人工智能
    共 272 条
  • 1
  • 2
  • 3
  • 28
  • 请选择