logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大模型安全评估

大模型安全评估是针对大语言 / 多模态模型在训练、部署、应用全生命周期,从内容安全、数据隐私、模型鲁棒性、伦理合规、安全管理等维度开展的风险检测、能力验证与合规评定,是 AI 备案、上线与商用的核心前置环节。基准测试:MMLU、TruthfulQA、RealToxicityPrompts、BBQ、CrowS-Pairs。境外语料占比≤30%内容违规:敏感词库升级、多模型审核、人工复审、应急熔断。数

文章图片
#人工智能
大模型安全评估

大模型安全评估是针对大语言 / 多模态模型在训练、部署、应用全生命周期,从内容安全、数据隐私、模型鲁棒性、伦理合规、安全管理等维度开展的风险检测、能力验证与合规评定,是 AI 备案、上线与商用的核心前置环节。基准测试:MMLU、TruthfulQA、RealToxicityPrompts、BBQ、CrowS-Pairs。境外语料占比≤30%内容违规:敏感词库升级、多模型审核、人工复审、应急熔断。数

文章图片
#人工智能
到底了