
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
对《可解释人工智能导论》书籍的读书笔记记录,每个章节都会进行总结
大语言模型真的能自我验证吗,谷歌的deepmind等多团队提出质疑,认为GPT4并不具有自我纠正、自我推理、自我批评的能力,它做的只是一种检索运算

本文评估基于LLM agents在多智能体合作的文本游戏心智理论推理任务

来自2024AAAI的大模型与知识追踪结合文章,利用符号二部图和大语言模型,结合对比学习与LLM语义嵌入来生成更好的题目与学生嵌入,并将KT建模为二部图的边预测任务。

来自松鼠AI的大模型+教育综述:Large Language Models for Education: A Survey and Outlook。现有的LLM in教育综述,缺乏从技术角度的总结,因此本文以技术为中心(用下游应用区分)进行分类,对现有数据集和基准总结。

大语言模型真的能自我验证吗,谷歌的deepmind等多团队提出质疑,认为GPT4并不具有自我纠正、自我推理、自我批评的能力,它做的只是一种检索运算

来自松鼠AI的大模型+教育综述:Large Language Models for Education: A Survey and Outlook。现有的LLM in教育综述,缺乏从技术角度的总结,因此本文以技术为中心(用下游应用区分)进行分类,对现有数据集和基准总结。

对SPP(solo performance prompting)进行介绍,该方法给一个LLM分配多个角色,来释放认知协同能力,实现多角色的自我协助完成任务。

本文评估基于LLM agents在多智能体合作的文本游戏心智理论推理任务








