logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

社区供稿 | 如何让大模型输出 10k+ 字长文?

我们从 GLM-4 的 SFT 数据中筛选出了 3,000 条指令(主要是中文),另外从 WildChat-1M(一个包含用户与 ChatGPT/GPT-4 对话记录的公开日志)中选择了 3,000 条指令(主要是英文),通过 AgentWrite 并利用 GPT-4o 生成了 6,000 条长输出的 SFT 数据,即 LongWriter-6k。当输出长度符合要求时,得分为 100;我们相信,在

#算法
到底了