logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

NeurIPS 23 Spotlight丨3D-LLM:将3D世界注入大语言模型

大型语言模型 (LLM) 和视觉语言模型 (VLM) 已被证明在多项任务上表现出色,例如常识推理。尽管这些模型非常强大,但它们并不以 3D 物理世界为基础,而 3D 物理世界涉及更丰富的概念,例如空间关系、可供性、物理、布局等。在这项工作中,我们建议将 3D 世界注入大型语言模型中,并引入全新的 3D-LLM 系列。具体来说,3D-LLM 可以将 3D 点云及其特征作为输入,并执行一系列与 3D

文章图片
9篇论文速览 ICML 2023 测试时自适应(TTA)最新研究进展

测试时自适应对于领域转移下真实机器感知应用的成功至关重要,近年来,研究者们仍然在不断优化现有的方法。在今年的ICML中,TTA相关的研究也有了最新进展。

文章图片
#人工智能#机器学习
学习笔记--目标检测基础知识大全

目标检测问题是识别图片中有哪些物体并且找到物体的存在位置。

文章图片
#目标检测#计算机视觉#深度学习
简单了解图神经网络就这一篇

来源:投稿作者:张宇编辑:学姐带你玩AI 公众号近年来,作为一项新兴的图数据学习技术,图神经网络(GNN)受到了非常广泛的关注,在各大顶级学术会议上,图神经网络相关的论文也占了相当可观的份额。我们知道图结构是最复杂的一种数据结构,其他数据结构都可以看做是图结构的一种推广。图结构在现实世界中也有很多应用,比如城市轨道交通图、社交关系图、生物医学领域等。GNN辅助医药研制图神经网络就是将图结构引入深度

文章图片
#神经网络#cnn#深度学习
【面试题】2023虹软计算机视觉一面

return 0continuecontinueres = []return res我只写了大概,没有跑过。

文章图片
#人工智能#计算机视觉#目标检测
华为Mindspore图像分类竞赛baseline

本赛题旨在让参赛者熟悉MindSpore并锻炼参赛者使用MindSpore进行图像分类预处理、图像分类的能力。

#深度学习#人工智能
CVPR 2023 | 计算机视觉中的深度学习理论进展(附视频+168页PPT)

近年来,由于深度学习的发展,计算机视觉取得了巨大的进步。然而,关于深度学习理论的进展,视觉研究者们却了解甚少,这导致了许多错失的联系和想法。主要目的就是帮助计算机视觉的研究者们更好地理解深度学习理论的发展,以便设计更新的架构和算法,为两个领域带来突破性进展。针对这个问题,来自LIONS、EPFL等组织的研究者们在CVPR 2023上给出了一份教程——为了方便大家学习,我还帮大家加了中文字幕,和教程

文章图片
#深度学习#计算机视觉
ICML 2023 最新大模型方向 Oral 论文盘点

机器学习顶会ICML 2023于4月放榜,共有6538份论文提交,1827篇论文被接收,录用率27.9%,达历史之最。因为今年生成式AI的火爆,在提交的论文中,与大模型相关的论文数目也非常可观。今天我就和大家分享9篇 ICML 2023 中大模型和鲁棒性相关 Oral 文章。

文章图片
#人工智能#机器学习#深度学习
2023扩散模型最新技术进展汇总

随着Stable Diffusion和Midjourney等图像生成模型的爆火,今年在模型领域,稳占主导地位。因此,与之相关的新技术也层出不穷,短短1个月,扩散模型相关的论文就有上百篇了,可见其发展的火热趋势。这次我整理了一部分来和大家分享,有50+篇,希望能帮助同学们获取新的思路~

文章图片
#人工智能
    共 432 条
  • 1
  • 2
  • 3
  • 44
  • 请选择