logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

85倍速度碾压:FastVLM,一款可以直接在iphone上运行的视觉语言模型

此外,高分辨率图像本身生成的 token 数量更多,这会进一步增加 LLM 的预填充时间(prefilling time,即 LLM 对包括视觉 token 在内的所有上下文 token 进行前向计算的时间),从而整体拉长初始输出时间(time-to-first-token, TTFT),即视觉编码器延迟与语言模型前填充时间之和。在该结构中,自注意力层所处理的特征图尺寸已经被以 1/32 比例降采

#iphone#语言模型#ios +2
ECCV 2024最佳论文候选!SpikeYOLO:高性能低能耗目标检测网络

作者丨竹贤来源丨https://zhuanlan.zhihu.com/p/714264914编辑丨极市平台中国科学院自动化所李国齐课题组论文:https://arxiv.org/abs/2407.20708代码:github.com/BICLab/SpikeYOLO脉冲神经网络(Spike Neural Networks,SNN)因其生物合理性和低功耗特性,被认为是人工神经网络(Artificia

#目标检测#人工智能#计算机视觉
最新8篇ICML2020投稿论文:自监督学习、联邦学习、图学习、数据隐私、语言模型、终身学习…...

关注上方“深度学习技术前沿”,选择“星标公众号”,资源干货,第一时间送达!机器学习顶会 ICML已经 结束了 2020 年的论文投稿,作为最“硬核”的机器学习会议之一,由于 ICML 并...

计算机视觉常用数据集总结:包括MS COCO、ImageNet、VOC、人脸识别、行人检测等...

1.PASCAL VOC(权威鼻祖)PASCAL VOC是一个图像集,由Mark Everingham (University ofLeeds)、Luc van Gool (ETHZ, ...

国内首次!8.9毫秒推理速度破纪录,Agentic AI时代!

首先,团队采用了基建的协议栈,只有物理层、数据链路层、事务层三层协议,原生支持Load/Store等「内存语义」,GPU可直接访问远端节点的显存或主存。DirectCom极速架构,每计算模组配置16颗AIPU,采用了直达通信的设计,解决了传统的服务器架构下,协议转换和带宽增强问题,实现了超低延迟。可以设想,在实际高并发场景下,当请求量急剧攀升时,系统能够高效地将负载均匀分布至各个计算单元,避免了个

#人工智能
华为盘古Ultra来了:昇腾原生、135B稠密通用大模型,无需英伟达GPU

在 8192 卡规模的集群中,使用了 128 路数据并行(Data Parallelism)、8 路张量并行(Tensor Parallelism)和 8 路流水线并行(Pipeline Parallelism),同时结合了 ZeRO 和序列并行(Sequence Parallelism),以降低模型参数、优化器状态和激活值的显存占用。Pangu Ultra 采用了改进的子序列切分并行方式,针对每

佛罗里达大学邵尉老师招收深度学习/CV/医学影像方向全奖博士生

佛罗里达大学佛罗里达大学(University of Florida)是美国佛罗里达州的知名公立研究型大学,享有公立常春藤的美誉。在2023年USNews排名中,位列全美第29名,公立大学中并列第五。电子与计算机工程专业则在全美排名第27位。值得一提的是,佛罗里达大学拥有全球排名第三的超级计算机系统,含有超过1000个英伟达A100 GPU,对AI研究提供了强大的支持。这将在推动交叉学科和人工智能

#深度学习#人工智能
国际翻译大赛冠军模型,字节刚刚开源了(附夺冠代码)!

作者:钱线、封江涛、周浩转自:机器之心Transformer等文本生成主流算法的逐词生成对适合并行计算的 GPU 并不友好,会导致 GPU 利用率低下。并行生成有助于解决这一问题。前不久,字节跳动火山翻译团队的并行生成翻译系统GLAT拿下了WMT2021 De-En/En-De 的双料冠军。为了帮助大家跟进这一成果,火山翻译开源了一个名为 ParaGen 的 Py...

#算法#机器学习#人工智能 +2
CVPR 2020:华为GhostNet,超越谷歌MobileNet,已开源

关注上方“深度学习技术前沿”,选择“星标公众号”,资源干货,第一时间送达!作者:王云鹤知乎链接:https://zhuanlan.zhihu.com/p/109325275本文已由作者授...

ECCV 2022 | 适用于分类,检测,分割的生成式知识蒸馏开源

作者丨美索不达米亚平原@知乎来源丨https://zhuanlan.zhihu.com/p/539496128转自丨极市平台【导读】本文主要介绍ECCV 2022关于知识蒸馏的工作: Masked Generative Distillation。该方法在图像分类和密集预测的实验中,其学生模型均获得大幅提升。文章链接:https://arxiv.org/abs/2205...

#计算机视觉#机器学习#人工智能 +2
    共 509 条
  • 1
  • 2
  • 3
  • 51
  • 请选择