瑞士推出 Apertus,一个为保护隐私而构建的公共开源人工智能模型

来自洛桑联邦理工学院 (EPFL)、苏黎世联邦理工学院和瑞士国家超级计算中心 (CSCS) 的研究人员推出了 Apertus,这是一个完全开源、多语言的大型语言模型 (LLM),以透明度、包容性和合规性为核心构建。

Apertus 是在瑞士人工智能计划下使用公共资金开发的,并在 CSCS 的阿尔卑斯超级计算机上使用了超过 1000 万个 GPU 小时进行训练,标志着主权人工智能基础设施的一个重要里程碑,并且是同等规模中最容易获得的模型之一。

Apertus 模型基于 15 万亿个词条训练,涵盖 1000 多种语言,是迄今为止发布的语言多样性最高的大语言模型 (LLM) 之一。独特的是,40% 的训练数据是非英语的,包括瑞士德语和罗曼什语等代表性不足的语言。

前部开放且私密

Apertus 与众多其他生成式 AI 系统的区别在于其对完全开放的承诺。与用户只能通过 API 或托管接口进行交互的常见专有模型不同,Apertus 开放其模型权重、训练数据集、文档,甚至中间检查点的访问权限。源代码和所有培训材料均根据允许商业使用的宽松开源许可证发布。

由于整个训练过程均已记录且可重复,研究人员和监管机构可以审核数据源,验证其是否符合数据保护法,并检查模型的训练方式。Apertus 的开发明确遵守瑞士数据保护和版权法,并纳入了追溯退出机制,以尊重数据源的偏好。

从隐私角度来看,Apertus 代表了人工智能领域的一次引人注目的转变。该模型仅使用公开数据,并经过过滤以排除个人信息,并尊重内容来源的退出信号。这不仅符合欧盟《人工智能法案》等新兴监管框架,也为人工智能如何既强大又尊重隐私提供了一个切实的例子。

苏黎世联邦理工学院该项目技术负责人伊曼诺尔·施拉格 (Imanol Schlag)表示,Apertus 是“为公众利益而建”,展示了如何将人工智能部署为公共数字基础设施,就像公用事业或交通运输一样。

Apertus 的部署和使用潜力

瑞士电信是首批在其 Sovereign Swiss AI 平台上部署 Apertus 的公司之一,该模型可通过专用界面供企业和开发者使用。在全球范围内,该模型也可通过Hugging Face公共 AI 推理实用程序 (Public AI Inference Utility)访问,为瑞士以外的开发者和机构提供访问点。

虽然运行一个完整的 700 亿参数模型需要大量的计算资源,但 Apertus 也提供了一个更易于管理的 80 亿参数版本,适用于小型组织、教育机构和技术精通的个人。对于普通用户或规模较小的开发者,这些较小的模型可以在本地服务器上运行,也可以通过 Swisscom 平台等云托管服务访问。

更主流的接入点是通过公共人工智能推理实用程序 (Public AI Inference Utility),它允许用户通过网页界面查询 Apertus,但保证该模型在公共基础设施原则下运行。这意味着不会收集数据用于广告,不会进行隐蔽监控,并且模型运行方式更加透明,这与公众对商业人工智能提供商不透明数据操作日益增长的担忧相一致。

Apertus 团队表示,该模型的未来版本将探索医疗保健、气候科学和法律研究等领域的特定领域适应性,同时保持透明度、多语言性和公共可访问性的核心价值。

Logo

更多推荐