
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
大模型必须要微调(Fine-tuning),例如一个预训练好的大模型就像一个刚从医学院以优异成绩毕业的全科医生(通才),他掌握了非常广泛和深厚的医学知识(语法、事实、推理能力等)。

大模型必须要微调(Fine-tuning),例如一个预训练好的大模型就像一个刚从医学院以优异成绩毕业的全科医生(通才),他掌握了非常广泛和深厚的医学知识(语法、事实、推理能力等)。

本文提出了 AgentRefine 方法,使模型能够依据环境反馈调整错误。实验结果表明,AgentRefine 在多样化智能体基准测试中的泛化能力明显优于现有的智能体微调方法。

本文提出了 AgentRefine 方法,使模型能够依据环境反馈调整错误。实验结果表明,AgentRefine 在多样化智能体基准测试中的泛化能力明显优于现有的智能体微调方法。

如果你一直在关注《Master LLMs》系列,你已经看过此前的旅程:从在“ What Even Is an LLM?”中建立直觉,到在“How Do LLMs Actually Work?”中理解其工作机制,再到在“Learn How To Steer Your AI Outputs”中学习关键原则。

LLaMA-Factory 作为一个高效、易用的微调工具,为广大开发者提供了极大的便利。适配市场主流开源模型,形成一个功能丰富,适配性好的训练框架。

在本篇文章中,我们探索了检索增强生成(RAG)应用中的文本生成部分,重点介绍了大语言模型(LLM)的使用。内容涵盖了语言建模、预训练面临的挑战、量化技术、分布式训练方法,以及大语言模型的微调。

LLaMA-Factory 作为一个高效、易用的微调工具,为广大开发者提供了极大的便利。适配市场主流开源模型,形成一个功能丰富,适配性好的训练框架。

在本篇文章中,我们探索了检索增强生成(RAG)应用中的文本生成部分,重点介绍了大语言模型(LLM)的使用。内容涵盖了语言建模、预训练面临的挑战、量化技术、分布式训练方法,以及大语言模型的微调。

最近随着大模型开始火爆,只要你一打开手机,不管是懂技术的还是不懂技术的,所有人都在聊同一个词——Agent(智能体)。








