logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

科研快报 |你的AI,其实有人格:首个科学验证的“大模型心理测试”问世

剑桥大学与谷歌DeepMind团队在《Nature Machine Intelligence》发表研究,首次建立科学评估大语言模型人格特质的心理测量框架。研究发现GPT-4等先进模型能稳定模仿并精确调控人格特征,其行为预测性甚至超过人类。该成果为AI安全性评估提供新工具,同时也警示了人格可塑性带来的潜在风险。研究采用严谨的心理测量学方法,通过52万次测试验证了模型人格的可靠性、效度及其与生成文本的

文章图片
#人工智能#AI#机器学习 +3
学习笔记丨2020-2025:关键代码数据集解析与应用指南

本文系统梳理了2020-2025年间广泛使用的权威代码数据集,涵盖预训练、评估和专项应用三大类。重点介绍了TheStack、HumanEval等核心数据集的特点与应用场景,分析了代码数据从规模向质量治理、单语言向多语言的发展趋势。提供了数据集选用建议和合规检查清单,强调在模型训练中需关注数据去重、许可合规和可执行性评估。这些数据集为代码智能研究和工程应用提供了重要基础,推动AI与软件工程的深度融合

文章图片
#学习
学习笔记丨开发者必知的数据基石:从GitHub到CodeNet

本文系统解析了全球主流代码托管平台和计算机科学数据库的互动关系。GitHub、GitLab等平台已发展为集协作、自动化于一体的综合开发环境,托管了超4亿开源项目。IBM CodeNet等专业数据库收录了5亿行代码,为AI训练提供高质量语料。

文章图片
#数据库#github#深度学习 +3
到底了