logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

多模态大语言模型综述

来源 | 李rumor去年以来,我们见证了以 GPT-4V 为代表的多模态大语言模型(Multimodal Large Language Model,MLLM)的飞速发展。为此我们对综述进行了重大升级,帮助大家全面了解该领域的发展现状以及潜在的发展方向。MLLM 发展脉络图MLLM 脱胎于近年来广受关注的大语言模型(Large Language Model , LLM),在其原有的强大泛化和推理能

文章图片
#语言模型#人工智能#自然语言处理
深度学习网络架构搜索(NAS)最新必读论文分享

在过去的很多年深度学习在视觉、语音等方面都已经取得了巨大的成功,其中一个很大的原因就是出现了很多新颖的网络结构——ResNet、MobileNet、ShuffleNet等。随着网络结构越来越复杂,人工设计网络的试错成本和时间成本会难以承受。超参数的自动搜索优化是一个古老的话题了。深度学习兴起前它主要针对传统机器学习算法中的模型超参数,比较经典的方法有随机搜索(Random search), 网格搜

#自动驾驶#自然语言处理#深度学习 +2
为什么说大模型训练很难?聊聊预训练的一些经验

作者:罗小黑,主要做NLP声明:本文只做分享,版权归原作者,侵权私信删除!原文:https://www.zhihu.com/question/498271491自从Bert网络模型产数量超过3亿规模,当时候只是觉得性能好,没想到GPT系列出来后,GPT-3直接用170B规模的参数量模型精度碾压竞品。

#神经网络#人工智能#自然语言处理
最新最全-中文生物医学命名实体识别最新研究论文、资源、数据集、性能整理分享

目前现存公开的中文电子病历标注数据十分稀缺,为了推动CNER系统在中文临床文本上的表现,中国知识图谱与语义计算大会(China Conference on Knowledge Graph and Semantic Computing, CCKS)在近几年都组织了面向中文电子病历的命名实体识别评测任务,下面我们主要关注CCKS CNER数据集上的结果。2.中文电子病历的命名实体识别研究进展. 杨飞洪

文章图片
#transformer#leetcode#计算机视觉
联邦学习历史最全论文、会议、博客资源整理分享

联合学习(FL)是一种新的机器学习框架,它使多个设备能够协作训练共享模型,而不会损害数据隐私和安全性。本资源整理了联合学习相关的资源,包括研究论文、会议、博客等等。资源整理自网络,源地址:https://github.com/innovation-cat/Awesome-Federated-Machine-Learning。

文章图片
#深度学习#人工智能
2022年迁移学习相关最新论文、会议、视频、竞赛整理分享

资源整理自网络,源地址:https://github.com/yuntaodu/Transfer-learning-materials/blob/master/readme.md。迁移学习(Transfer learning) 顾名思义就是把已训练好的模型(预训练模型)参数迁移到新的模型来帮助新模型训练。针对每一部分,列举了3-4篇经典论文,建议详读这些经典论文,泛读这些经典论文的后续论文,并对其

文章图片
热议!2024年迁移学习已经彻底凉凉了....

网上热议迁移学习已经凉了,不然,自2005年美国DARPA 正式提出“迁移学习”的概念,即使20年后今天,依然火爆各大AI顶会。这30个有关迁移学习的应用全部都是2024年最新的研究成果,有今年大火的ChatFlow模型,也有登上CVPR2024的研究!而迁移学习能把已有的算法和模型应用到全新的数据集上,节省大量的时间和资源,还能提高准确率!可以说无论小伙伴们的研究领域是什么,都可以从这些最新的研

文章图片
#迁移学习#人工智能#机器学习
2021年迁移学习相关最新论文、会议、视频、竞赛整理分享

迁移学习(Transfer learning) 顾名思义就是把已训练好的模型(预训练模型)参数迁移到新的模型来帮助新模型训练。本资源整理了迁移学习相关的一些资源,本部分内容适合初学者,将一些本领域中的经典论文按照时间线进行分类、梳理,分为浅层域适应、深度域适应、对抗域适应和域适应理论四部分。针对每一部分,列举了3-4篇经典论文,建议详读这些经典论文,泛读这些经典论文的后续论文,并对其中的部分算法进

文章图片
2022最新最全联邦学习(FL)论文、教程、博客和框架整理分享

联邦学习(Federated Learning)是一种分布式机器学习技术 ,其核心思想是通过在多个拥有本地数据的数据源之间进行分布式模型训练,在不需要交换本地个体或样本数据的前提下,仅通过交换模型参数或中间结果的方式,构建基于虚拟融合数据下的全局模型,从而实现数据隐私保护和数据共享计算的平衡,即“数据可用不可见”、“数据不动模型动”的应用新范式。资源整理自网络,下载及获取见源地址:https://

文章图片
#深度学习#自然语言处理#人工智能
深度强化学习必读-决策算法综述

本书介绍本书广泛介绍了不确定条件下最优决策的算法。涵盖了与决策相关的各种主题,介绍了基本的数学问题公式和解决它们的算法。提供图形、例子和练习来介绍各种方法背后的几本原理。本书是为高级本科生和研究生以及专业人士准备的。这本书需要一些数学知识,并假设之前接触过多变量微积分、线性代数和概率概念。附录中提供了一些审查材料。文zxhuoqu:https://mp.weixin.qq.com/s?__biz=

#自动驾驶#神经网络#tensorflow +2
    共 248 条
  • 1
  • 2
  • 3
  • 25
  • 请选择