
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
大型语言模型 (LLM) 和视觉语言模型 (VLM) 已被证明在多项任务上表现出色,例如常识推理。尽管这些模型非常强大,但它们并不以 3D 物理世界为基础,而 3D 物理世界涉及更丰富的概念,例如空间关系、可供性、物理、布局等。在这项工作中,我们建议将 3D 世界注入大型语言模型中,并引入全新的 3D-LLM 系列。具体来说,3D-LLM 可以将 3D 点云及其特征作为输入,并执行一系列与 3D

测试时自适应对于领域转移下真实机器感知应用的成功至关重要,近年来,研究者们仍然在不断优化现有的方法。在今年的ICML中,TTA相关的研究也有了最新进展。

目标检测问题是识别图片中有哪些物体并且找到物体的存在位置。

来源:投稿作者:张宇编辑:学姐带你玩AI 公众号近年来,作为一项新兴的图数据学习技术,图神经网络(GNN)受到了非常广泛的关注,在各大顶级学术会议上,图神经网络相关的论文也占了相当可观的份额。我们知道图结构是最复杂的一种数据结构,其他数据结构都可以看做是图结构的一种推广。图结构在现实世界中也有很多应用,比如城市轨道交通图、社交关系图、生物医学领域等。GNN辅助医药研制图神经网络就是将图结构引入深度

return 0continuecontinueres = []return res我只写了大概,没有跑过。

本赛题旨在让参赛者熟悉MindSpore并锻炼参赛者使用MindSpore进行图像分类预处理、图像分类的能力。
近年来,由于深度学习的发展,计算机视觉取得了巨大的进步。然而,关于深度学习理论的进展,视觉研究者们却了解甚少,这导致了许多错失的联系和想法。主要目的就是帮助计算机视觉的研究者们更好地理解深度学习理论的发展,以便设计更新的架构和算法,为两个领域带来突破性进展。针对这个问题,来自LIONS、EPFL等组织的研究者们在CVPR 2023上给出了一份教程——为了方便大家学习,我还帮大家加了中文字幕,和教程

机器学习顶会ICML 2023于4月放榜,共有6538份论文提交,1827篇论文被接收,录用率27.9%,达历史之最。因为今年生成式AI的火爆,在提交的论文中,与大模型相关的论文数目也非常可观。今天我就和大家分享9篇 ICML 2023 中大模型和鲁棒性相关 Oral 文章。

最终成绩是:68.46473 第二名
随着Stable Diffusion和Midjourney等图像生成模型的爆火,今年在模型领域,稳占主导地位。因此,与之相关的新技术也层出不穷,短短1个月,扩散模型相关的论文就有上百篇了,可见其发展的火热趋势。这次我整理了一部分来和大家分享,有50+篇,希望能帮助同学们获取新的思路~
