
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
人工智能综合心理学、统计学、计算机科学等多领域的技术,对人类认知、决策的智能过程进行模拟、延伸和扩展,进而帮助人类创造更大的价值。人工智能可分为计算智能、感知智能和认知智能,如下图所示。计...
选自 Intento作者:Grigory Sapunov机器之心编译机器之心编辑部目前多模态任务成为行业热点,本文梳理了较为优秀的多模态文本图像模型:DALL·E、CLIP、GLIDE、DALL·E 2 (unCLIP)的模型框架、优缺点,及其迭代关系。OpenAI 最近发布了 DALL·E 2 系统,在 AI 界引发了「地震」,该系统能够根据文本描述创建图像。这是 DA...
深度学习Author:louwillMachine Learning Lab作为深度学习算法工程师,除了日常炼丹之外,也需要具备让练好的丹发挥作用的能力。具体的来说,就是需要大家...
作者:spring1.比较 LLaMA、ChatGLM、Falcon 等大语言模型的细节:tokenizer、位置编码、Layer Normalization、激活函数等。2. 大语言模型的分布式训练技术:数据并行、张量模型并行、流水线并行、3D 并行、零冗余优化器 ZeRO、CPU 卸载技术 ZeRo-offload、混合精度训练、激活重计算技术、Flash Attention、Paged At
去年以来,我们见证了以 GPT-4V 为代表的多模态大语言模型(Multimodal Large Language Model,MLLM)的飞速发展。为此我们对综述进行了重大升级,帮助大家全面了解该领域的发展现状以及潜在的发展方向。MLLM 发展脉络图MLLM 脱胎于近年来广受关注的大语言模型(Large Language Model , LLM),在其原有的强大泛化和推理能力基础上,进一步引入了
作者:胡安文(人大在读 多模态、NLP)大型语言模型LLM(Large Language Model)具有很强的通用知识理解以及较强的逻辑推理能力,但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力,但目前还未开放多模态输入接口并且不会透露任何模型上技术细节。因此,现阶段,如何利用LLM做一些多模态任务还是有一定的研究价值的。本文整理了近两年来基于LLM做vision-lanuage任.
来源:AINLP“Shikra:解锁多模态语言模型参考对话的魔法 ???? ⭐️”Shikra和用户的对话案例在人类的日常交流中,经常会关注场景中的不同区域或物体,双方都可以通过说话并指向这些区域来进行高效的信息交换。我们将这种对话模式称为参考对话(Referential Dialogue);如果多模态大语言模型(MLLM) 擅长这项技能,它将带来许多令人兴奋的应用。例如,将其应用到 Apple
鱼羊 发自 凹非寺 来源 量子位2020年,GPT-3可谓火出了圈。不仅讲故事的本职工作做得风生水起,还跨界玩起了网页设计、运维、下象棋……不过,尽管表现惊艳,GPT-3背后到底是实实...
作者:子贺Leo@知乎 (北交大 CS硕士在读)引言:大型预训练语言模型PLMs+思维链CoT成为了2023年的热潮,无数NLP任务的研究者都在致力于应用此范式开辟新的蓝海。今天带来华东师范大学的一篇KBQG方法,通过PLMs with CoT,实现了Few-Shot。题目:Prompting Large Language Models with Chain-of-Thought for Few-
来源:新智元【导读】马斯克口中全世界最聪明大模型Grok-3,终于震撼登场!20万块GPU训出的模型,实属全球首次。果然,Grok-3已火速屠榜多个排行榜,击败o3-mini(high)和DeepSeek-R1。人类史上首个在20万块GPU上训出的模型终于问世!刚刚,马斯克带队三位xAI成员在线开启直播,官宣Grok-3全家桶——Grok-3(Beta)、Grok-3 mini首个推理模型Grok