logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

85倍速度碾压:FastVLM,一款可以直接在iphone上运行的视觉语言模型

此外,高分辨率图像本身生成的 token 数量更多,这会进一步增加 LLM 的预填充时间(prefilling time,即 LLM 对包括视觉 token 在内的所有上下文 token 进行前向计算的时间),从而整体拉长初始输出时间(time-to-first-token, TTFT),即视觉编码器延迟与语言模型前填充时间之和。在该结构中,自注意力层所处理的特征图尺寸已经被以 1/32 比例降采

#iphone#语言模型#ios +2
懂3D的语言模型来了!UCLA、上交、MII联合发布,性能大涨9%

来源:新智元大型语言模型(LLM)和视觉语言模型(VLM)在各种评测基准中都展现出了强大的性能,比如可以看图说话、进行常识推理。但这些模型的训练过程并没有引入3D物理世界,也就无法理解更丰富的现实概念,包括空间关系、布局、物体反馈等。最近,加州大学洛杉矶分校、上海交大、华南理工大学、麻省理工学院等机构的研究人员联合提出了一个全新的3D-LLM任务,把3D世界的知识注入到大型语言模型中,以3D点云及

#3d#语言模型#人工智能 +1
CVPR 2024 | PromptKD: 基于Prompt的视觉语言模型蒸馏新方法

来源:CVHub标题:《PromptKD: Unsupervised Prompt Distillation for Vision-Language Models》主页:zhengli97.github.io/PromptKD论文:https://arxiv.org/pdf/2403.02781.pdf代码:https://github.com/zhengli97/PromptKD (已开源,欢迎

#语言模型#人工智能#自然语言处理
图灵奖得主Geoffrey Hinton:我的五十年深度学习生涯与研究心得

来源:数据派THU &机器学习初学者作者:王菁 林亦霖沈佳丽 程浩源 许菡如 胡燕君 贾川编辑:新智元他从未正式上过计算机课程,本科在剑桥大学读的是生理学和物理学,期间曾转向哲学,但最终拿到的却是心理学方向的学士学位;他曾因为一度厌学去做木匠,但遇挫后还是回到爱丁堡大学,并拿到「冷门专业」人工智能方向的博士学位;数学不好让他在做研究时倍感绝望,当了教授之后,对于不懂的神经科学和计算科学..

#深度学习#人工智能
轻量型模型比肩千亿大模型,新一代中文语言模型孟子,刷新CLUE纪录!

转自:机器之心近日,澜舟科技 - 创新工场团队与上海交通大学、北京理工大学等单位联合研发的中文语言模型—孟子轻量型模型,超越腾讯、搜狗等公司,在中文语言理解评测 CLUE 榜单上登顶第一,...

#机器学习#人工智能#自然语言处理 +2
Transformer 五年引用超四万,六位作者创立五家创业公司!

来源:机器之心时隔五年,Transformer 的八位作者仅有一位还留在谷歌。如果你在一家大厂做出了一份行业里程碑式的研究,那么接下来的职场生涯你会怎么走?继续留在这家大厂?换一家待遇更好的大厂?还是创业或加入有前景的创业公司?Transformer(出自论文《Attention Is All You Need》)几位作者的选择或许有一定的代表性:其中六人选择创业或加入创...

#编程语言#机器学习#人工智能 +2
冲上热搜!美团首个开源大模型来了!5600亿参数,推理速度比DeepSeek-V3快50%

与DeepSeek-V3.1、Kimi-K2、Qwen3 MoE-2507等头部开源模型相比,LongCat-Flash在通用领域、编程等场景的能力还有一定差距,技术报告链接:github.com/meituan-longcat/LongCat-Flash-Chat/blob/main/tech_report.pdf。GitHub地址:github.com/meituan-longcat/Long

AMD依然yes!官宣锐龙5000系列CPU,单核性能首次超越英特尔,苏妈:最好的游戏CPU!...

点击上方,选择星标或置顶,不定期资源大放送!阅读大概需要15分钟Follow小博主,每天更新前沿干货在 AMD 新发布的四款处理器中,AMD 表示新款 Ryzen 5900X 是“世界上...

#游戏#人工智能#分布式
ICLR2020:40篇计算机视觉github开源论文合集

关注上方“深度学习技术前沿”,选择“星标公众号”,资源干货,第一时间送达!转自极市平台1. star:9819|Weakly Supervised Disentanglement wit...

聚焦推理模型、AI Infra、AI智能体与具身大模型!DeepSeek时代首场生成式AI大会4月举行

最后,将介绍我们的项目影响力以及对行业的启示。在自动驾驶领域,终极任务是planning,这也是一项涉及场景理解、分析、和决策的复杂任务,我们首次尝试将DeepSeek R1的强化学习和推理策略迁移应用于驾驶领域,并做出一系列针对驾驶规划的策略优化,显著提升大模型自动驾驶决策规划的效果,并展现出涌现的多模态规划能力。在开源的基础架构中,高性能全闪分布式文件是训练和推理的数据底座,支撑了AI训练的高

#人工智能
    共 382 条
  • 1
  • 2
  • 3
  • 39
  • 请选择