logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

大模型

可提供的服务

暂无可提供的服务

从多模态大模型到通用具身智能体:苹果团队的最新研究

摘要:本文介绍了一种名为"通用具身智能体"(GEA)的新型AI框架,由苹果公司和佐治亚理工学院联合开发。该研究通过将多模态大语言模型(MLLM)与特定训练方法相结合,打造了一个能够同时处理机器人操作、电子游戏控制和手机界面交互等多种任务的通用智能体。GEA采用两阶段训练法:先通过监督式微调学习220万条任务轨迹,再进行在线强化学习优化性能。实验表明,GEA在未见过的任务中仍保持

文章图片
#人工智能
从多模态大模型到通用具身智能体:苹果团队的最新研究

摘要:本文介绍了一种名为"通用具身智能体"(GEA)的新型AI框架,由苹果公司和佐治亚理工学院联合开发。该研究通过将多模态大语言模型(MLLM)与特定训练方法相结合,打造了一个能够同时处理机器人操作、电子游戏控制和手机界面交互等多种任务的通用智能体。GEA采用两阶段训练法:先通过监督式微调学习220万条任务轨迹,再进行在线强化学习优化性能。实验表明,GEA在未见过的任务中仍保持

文章图片
#人工智能
时间序列大模型:TimeGPT

基础模型在时间序列预测任务中的潜力仍然未被充分探索,但有迹象表明可以在不降低性能的情况下将预训练模型转移到不同任务上,且在时间序列预测任务中存在数据和模型规模的扩展律。TimeGPT 是一种由 Nixtla 开发的专门用于预测任务的生成式预训练 Transformer 模型,具有自我关注机制,采用历史值窗口生成预测,添加局部位置编码,由多层编码器-解码器结构组成,每个结构都具有残差连接和层归一化。

文章图片
#自然语言处理
从大模型到现在的 Agent的技术发展

引一个乐观主义者的悲观估计随着大规模模型技术的兴起,我们正处于一个崭新的智能时代的黎明。我们有一个大胆的预测,未来的5到10年将可能带来一场大变局:99%的开发、设计和文字工作将被AI接管。这不仅仅是一个想象,而是对未来可能趋势的深思熟虑。在互联网时代,我们目睹了大量网站的崛起,成为互联网时代的原生应用的主要载体,这个时代有了 Web 相关的新技术,这些技术承载着 Google、Facebook、

文章图片
#人工智能#自然语言处理
分享 8篇Spotlight论文,多模态大模型、大模型优化、RLHF等

DREAMLLM 的运作遵循两个基本原则。第一个重点是通过在原始多模态空间中直接采样来对语言和图像后验进行生成建模。这种方法规避了 CLIP 等外部特征提取器固有的限制和信息丢失,并且获得了更彻底的多模态理解。其次,DREAMLLM 促进原始交错文档的生成,对文本和图像内容以及非结构化布局进行建模。这使得 DREAMLLM 能够有效地学习所有条件、边际和联合多模态分布。因此,DREAMLLM 是第

文章图片
#人工智能
为什么基于树的机器学习方法在表格数据上优于深度学习?

图 5b 表明,去除这些特征所带来的准确率下降可以通过去除非信息特征来补偿,与其他模型相比,这对 MLP 更有帮助(同时,该研究还删除了冗余特性,也不会影响模型性能)。值得注意的是,随机旋转颠倒了性能顺序:结果是 NN 在基于树的模型之上,Resnets 在 FT Transformer 之上,这表明旋转不变性是不可取的。图 6b 中显示:删除每个数据集中最不重要的一半特征(在旋转之前),会降低除

文章图片
#机器学习#随机森林#深度学习
阿里与上交大提出 LLM 长文本计算新解法:可处理文本长达 1900k 字节

随着深度学习技术在自然语言处理领域的广泛应用与深化,端到端性能的研究受到了广泛关注。在应对长文本时,这种性能飞跃的重要性尤为凸显,因为它直接影响了我们能否高效而准确地驾驭海量文本数据,并从中抽丝剥茧般提取出有价值的信息。DistAttention与DistKV-LLM的结合,通过智能管理内存资源、优化分布式计算策略,成功解决了大规模语言模型服务在长上下文处理中的难题,使系统能够从容应对超长文本序列

文章图片
#人工智能
Python机器学习经典实例

实用的案例介绍机器学习的基础知识,然后介绍一些稍微复杂的机器学习算法,例如支持向量机、极-端随机森林、隐马尔可夫模型、条件随机场、深度神经网络,等等。书中介绍的主要问题如下:1.探索分类分析算法并将其应用于收入等级评估问题  -2.使用预测建模并将其应用到实际问题中  3.了解如何使用无监督学习来执行市场细分 4.探索数据可视化技术以多种方式与数据进行交互 5.了解如何构建推荐引擎  6.理解如何

#python#机器学习#开发语言
Python机器学习经典实例

实用的案例介绍机器学习的基础知识,然后介绍一些稍微复杂的机器学习算法,例如支持向量机、极-端随机森林、隐马尔可夫模型、条件随机场、深度神经网络,等等。书中介绍的主要问题如下:1.探索分类分析算法并将其应用于收入等级评估问题  -2.使用预测建模并将其应用到实际问题中  3.了解如何使用无监督学习来执行市场细分 4.探索数据可视化技术以多种方式与数据进行交互 5.了解如何构建推荐引擎  6.理解如何

#python#机器学习#开发语言
分享 8篇Spotlight论文,多模态大模型、大模型优化、RLHF等

DREAMLLM 的运作遵循两个基本原则。第一个重点是通过在原始多模态空间中直接采样来对语言和图像后验进行生成建模。这种方法规避了 CLIP 等外部特征提取器固有的限制和信息丢失,并且获得了更彻底的多模态理解。其次,DREAMLLM 促进原始交错文档的生成,对文本和图像内容以及非结构化布局进行建模。这使得 DREAMLLM 能够有效地学习所有条件、边际和联合多模态分布。因此,DREAMLLM 是第

文章图片
#人工智能
    共 26 条
  • 1
  • 2
  • 3
  • 请选择