
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
高度自主智能体的长程价值对齐漂变监测:基于元学习的自我修正框架研究
价值对齐漂变的本质是智能体的价值体系与人类价值体系之间的偏离程度不断增大的过程,要精准刻画这一过程,首先需要构建价值空间的度量衡,实现价值体系的量化表征与偏离程度的精准计算。价值空间是一个抽象的高维空间,其中每个点代表一种具体的价值状态,人类价值体系与智能体价值体系分别对应价值空间中的两个点集(或分布)。价值对齐漂变的程度,即两个点集(或分布)之间的距离变化。
到底了







