
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
DeepSeek显然就属于追求极致性能的专家用户了,根据v3.2公告的说法,在早期DeepSeek团队使用TileLang快速开发原型,之后用更底层的方法进一步优化性能。后来TileLang也以DeepSeek在这天发布的FlashMLA内核作为评测基准,在H100上的MLA解码速度,TileLang编写的内核做到与FlashMLA相当。作为编程模型的核心概念,通过显式的Tile抽象,让开发者能够
点击下方卡片,关注“CVer”公众号AI/CV重磅干货,第一时间送达点击进入—>【计算机视觉和PyTorch】交流群2023年10月18日(北京时间),PyTorch 基金会正式宣布华为作为Premier会员加入基金会,这也是中国首个、全球第十个PyTorch基金会最高级别会员。未来,华为将进一步与其他成员公司共同协作,加速PyTorch社区发展,为全球人工智能社区带来更多灵感和创新,共建开
昇思MindSpore学习打卡营,是昇思MindSpore开源社区为开发者打造的能力提升项目。在过去的两期里,集结了2000余位开发者加入,我们一起收获了心智、技术、坚持与进步。第三期国庆特辑再起航,昇思社区携手社区布道师共同打造本期课程。开发者自己的课程,更适合开发者!End点击阅读原文,即可免费报名学习!...
CVPR 2025开放注册的第一天,注册人数就已达数千人,火爆程度可见一斑。今年AAAI和ICLR都在CVPR截稿前rebuttal,想必CVPR的投稿数量会再创新高。想要从众多文章里脱颖而出,除了有一个精彩的idea,详实的实验数据也是必不可少的。目前,距离CVPR截稿已进入倒计时,许多同学正进入实验和模型验证的关键阶段,压力逐步攀升。实验算力成了此刻最紧缺的资源,而算力的高效性不仅决定了实验进
论文提出了一种名为U-KAN的新型医学图像分割框架,通过将KAN与经典的U-Net架构相结合,显著提升了分割性能。Self-Prompt-SAM是一个用于医学图像分割的框架,它通过自动生成提示来适应预训练的SAM模型,并通过3D深度融合适配器使其能够处理3D医学图像,从而在多个数据集上实现了优异的分割性能。论文提出了一种多模态医学图像分割方法,通过深度神经网络提取特征并转化为证据理论中的质量函数,
图 1 展示了具体的构建过程以及对数据集的统计分析,通过 in-context learning 的方式利用现有的强大的多模态大模型进行标注,从不同任务中的数据中获取音视频场景,为了保证结果的准确性和推理过程的合理性,原有数据的标签也作为输入,让 Gemini 1.5 Pro 针对该场景输出带有时序和空间等信息的显示推理过程。表 1 展示了与多个任务上的通用模型的对比结果,相比于其它模型,本文提出
与大部分的零样本异常检测方法相同,采取在A数据集训练,在B数据集测试的设定。现有的类别泛化方法比较有限,主要有基于元学习的方法(如 MetaUAS, RegAD),基于特征残差的方法(如 InctRL, ResAD),基于视觉语言模型的方法(如WinCLIP, APRIL-GAN)。对比的SOTA方法包括: RegAD, AnomalyGPT, FastRecon, WinCLIP, APRIL-
的单步生成建模框架,通过引入平均速度(average velocity)的概念来改进现有的流匹配方法,并在 ImageNet 256×256 数据集上取得了显著优于以往单步扩散 / 流模型的结果,FID 分数达到 3.43,且无需预训练、蒸馏或课程学习。图 1 中,本文将 MeanFlow 与之前的单步扩散 / 流模型进行了比较,如表 2(左)所示。总体而言,MeanFlow 的表现远超同类:它实
我们借助大模型的知识对多物体草图的各个物体进行初步运动规划,然后通过运动修正网络修正物体级别的运动以及建模物体内部的运动,最后采用分而治之的思想,将复杂的多物体运动进行拆解并逐一优化。具体而言,给定一个待配乐的短视频,MGSV旨在从乐曲库中检索到与之最为匹配的乐曲,并通过时间定位,自动剪辑与视频时长一致的音乐片段。在相关领域高水平期刊会议发表论文六十余篇,专利多项,主持国家自然科学基金面上、北京市
大模型的训练往往采用多机多卡的分布式训练,大模型的分布式训练挑战巨大,即使硬件足够,不熟悉分布式训练的人大概率(实验中验证有 64%-87% 的概率)会因为超参数设置(模型怎么切分和排布、数据怎么切分和排布等)不合理而无法成功运行训练过程。UniAP 是首个能实现层内并行策略(张量并行等)和层间并行策略(流水线并行等)联合优化的工作。而现有的自动并行方法存在的问题是它们要么只考虑层内或层间两类并行







