logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

微调大模型并不复杂,数据才是关键!3个实例带你深入了解

微调是对一个已经预训练好的大模型进行“调整”,使其能够更好地执行特定任务。简单来说,就是利用已有的知识,并根据新的数据对模型进行“再教育”。这种方式能够大大节省时间和成本,因为你无需从零开始训练模型。举个例子,Athene-V2-Chat-72B通过微调提升了在Chatbot Arena中的排名,表现出色。这证明了微调技术的强大能力,只要数据准备得当,微调带来的效果不容小觑!在AI模型的优化中,除

文章图片
#人工智能#机器学习#深度学习 +3
一文读懂多模态大模型:强化学习技术全面解读 SFT、RLHF、RLAIF、DPO

在深入探讨训练过程之前,首先介绍一些相关术语:智能体:训练来做正确决策的实体。在这个例子中,目标是训练机器人做出移动决策,所以机器人就是智能体。环境:环境是智能体与之互动的外部系统。在本例中,随着训练过的机器人(智能体)在网格内移动,网格就充当了环境。状态:代表智能体在每个时间 t 的位置。在起始时刻,即时间t0,机器人(智能体)位于左下角,因此时间t0的状态是左下角,由坐标(0,0)表示。动作:

文章图片
#python#人工智能#深度学习 +3
玩转大模型技能篇——提示词工程

大模型可以很好的作为人类的智能助手,和人类的关系可以作为“器”,即生产力工具。众所周知,器要想发挥好作用,还需要“道法术”三个维度的内容。我们先聚焦于“术”层面。,其中提示词工程和思维链推理是普通用户用好大模型的关键,而五项“术”是专业玩家都会玩的,因为微调大模型、基于人类反馈的强化学习和检索增强,都需要具备相应的专业技能和拥有专业硬件。因此,作为教育系统普通用户,我们就来死磕一下“

文章图片
#人工智能#开发语言#职场和发展 +1
一文带你了解大模型——智能体(Agent)

通过 API 调用 LLM 时,调用方可以描述函数,包括函数的功能描述、请求参数说明、响应参数说明,让 LLM 根据用户的输入,合适地选择调用哪个函数,同时理解用户的自然语言,并转换为调用函数的请求参数(通过 JSON 格式返回)。当发现已有的知识不足以回答这个问题,则会调用工具,比如:搜索工具、生成报告等,然后得到新的信息,基于新的信息重复进行推理和行动,直到完成这个任务。从软件工程的角度看来,

文章图片
#人工智能#语言模型#安全 +2
干货:26个用好AI大模型的提示词技巧

研究人员指出,与LLM交互时,无需多余的礼貌用语。直接、清晰地提出问题是关键。例如:“描述人体细胞的结构。”这样的提示既直接又明确,有助于模型迅速准确地给出答案。

文章图片
#人工智能#语言模型#自然语言处理 +2
为什么产品经理要学习大模型?未来人人都是产品经理?

我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。那以下这些PDF籍就是非常不错的学习资源。学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。作为普通人,入局大模型时代

文章图片
#产品经理#学习#人工智能
什么是大模型?大模型应用案例有哪些?一文搞定大模型及落地应用案例

大模型,英文名叫Large Model,大型模型。早期的时候,也叫Foundation Model,基础模型。大模型是一个简称。完整的叫法,应该是“人工智能预训练大模型”。预训练,是一项技术,我们后面再解释。我们现在口头上常说的大模型,实际上特指大模型的其中一类,也是用得最多的一类——语言大模型(Large Language Model,也叫大语言模型,简称LLM)。除了语言大模型之外,还有视觉大

文章图片
#人工智能#RAG#语言模型 +1
大模型基础知识汇总(非常详细)零基础入门到精通

基于海量文本数据训练的深度学习模型,如GPT系列、BERT等,能够理解和生成自然语言文本,能够进行复杂对话、文本创作等任务。这是AI研究的理想目标,追求创造能像人类一样学习新技能、解决广泛问题的智能体,目前仍处于理论探索和初步实践阶段。利用AI技术生成的各种内容,从文本、图像到视频,利用算法创造新颖、个性化的内容,如AI艺术画作或定制文章。在AI大模型中用于引导模型生成特定类型输出的上下文信息或指

#人工智能#机器学习#开源 +2
什么是AI Agent,一文搞定AI Agent,手把手搭建属于自己的智能体

这篇关于Agent的文章,即是对AI Agent的介绍,也是为了记录自己对AI Agent的理解。什么是AI Agent?‍‍‍‍网上的介绍说,AI Agent中文翻译叫智能体,是一种能够感知环境,进行决策和执行动作的智能实体。看了以上的定义,可能很多人还是觉得一头雾水,这都是什么玩意,能不能说点人能看懂的东西。‍‍那下面我们就用大白话介绍AI Agent,大家都说大模型的功能很强大,能回答问题,

文章图片
#人工智能#机器学习#自然语言处理 +2
从零开始学习大模型-第一章-大模型简介(附学习路线及全套资料)

大模型就像一座庞大的图书馆,里面有非常多的书籍。但与普通图书馆不同的是,这座图书馆中的每本书都是关于不同事物的描述和知识。而这些书籍中的每一页都代表了这个事物的一些特征或细节。现在,想象一下,你是一个研究员,你想了解各种各样的话题,比如天气、历史、科学等等。但是你没有时间和精力去阅读所有的书籍,而且有些书籍可能非常专业和深奥,你也未必能理解。这时,一位聪明的朋友建议你去一座巨大的图书馆,这个图书馆

文章图片
#学习#人工智能#面试 +1
    共 152 条
  • 1
  • 2
  • 3
  • 16
  • 请选择