摆烂小火个人主页

摆烂小火

2022-11-30 19:26:33 加入 DevPress

简介

该用户还未填写简介

未填写擅长的技术栈

暂无可提供的服务

对《可解释人工智能导论》书籍的读书笔记记录，每个章节都会进行总结

大语言模型真的能自我验证吗，谷歌的deepmind等多团队提出质疑，认为GPT4并不具有自我纠正、自我推理、自我批评的能力，它做的只是一种检索运算

本文评估基于LLM agents在多智能体合作的文本游戏心智理论推理任务

来自2024AAAI的大模型与知识追踪结合文章，利用符号二部图和大语言模型，结合对比学习与LLM语义嵌入来生成更好的题目与学生嵌入，并将KT建模为二部图的边预测任务。

来自松鼠AI的大模型+教育综述：Large Language Models for Education: A Survey and Outlook。现有的LLM in教育综述，缺乏从技术角度的总结，因此本文以技术为中心（用下游应用区分）进行分类，对现有数据集和基准总结。

大语言模型真的能自我验证吗，谷歌的deepmind等多团队提出质疑，认为GPT4并不具有自我纠正、自我推理、自我批评的能力，它做的只是一种检索运算

对SPP(solo performance prompting)进行介绍，该方法给一个LLM分配多个角色，来释放认知协同能力，实现多角色的自我协助完成任务。

本文评估基于LLM agents在多智能体合作的文本游戏心智理论推理任务

到底了