logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

国产开源大模型都有哪些?

AGI Eval:微软发布的大模型基础能力评测基准,在2023年4月推出,主要评测大模型在人类认知和解决问题的一般能力,涵盖全球20种面向普通人类考生的官方、公共和高标准录取和资格考试,包含中英文数据。随着ChatGPT引领的大模型热潮,国内的公司开始相继投入研发自己的人工智能大模型,截止到2023年10月,国产公司的大模型有近百个,包括一些通用大模型,比如百度的文心一言,也有特定领域的专用大模型

文章图片
#开源#人工智能
理解基于LLM的Agent及多Agent架构

Agent 是一个自主单元,通过编程可以执行任务、做出决策并与环境通信。同样,基于 LLM 的 Agent 是一个高级单元,它将 LLM 作为大脑来进行思考、做出决策并采取行动完成特定任务。这些 Agent 还可以拥有记忆,可以是短期记忆( Agent 的思路),也可以是长期记忆(对话历史)。它们还可以使用工具来执行任务,如上网搜索、使用计算器等。让我们看看下面的示例–如果用户的天气条件不理想(如

文章图片
#人工智能#语言模型
从零实现大模型-BERT微调

按照顺序,轮也该轮到BERT指令微调了吧!是微调,但不是指令微调!我们在之前的文章介绍过大模型的多种微调方法,指令微调只是其中一种,就像训犬一样,让它坐就坐,让它卧就卧,同理,你让LLM翻译,它不是去总结,你让它总结,它不是去情感分析。

文章图片
#bert#人工智能#深度学习
2024下半年,前端的技术风口来了

你近期有体验过哪些大模型产品呢?你有使用大模型API做过一些实际开发吗?在你日常开发中,可以与大模型相关应用结合来完成工作吗?**最近,一直在和同事聊,关于前端可以用大模型干点啥!**从去年底开始,大模型的发展趋势就非常迅猛,这也代表着人工智能进入了一个新的时代。以上几个话题,在程序员话题圈中长期位列榜首,大家都跃跃欲试,期望在这次AI风口上抢占先机。认知和规划是重中之重

文章图片
#人工智能#学习#知识图谱
到底了