logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MobileVLM:移动端多模态大模型!骁龙888实时运行 | 美团、浙大等

本文来源 机器之心编辑部大模型涌向移动端的浪潮愈演愈烈,终于有人把多模态大模型也搬到了移动端上。近日,美团、浙大等推出了能够在移动端部署的多模态大模型,包含了 LLM 基座训练、SFT、VLM 全流程。也许不久的将来,每个人都能方便、快捷、低成本的拥有属于自己的大模型。MobileVLM 是一款专为移动设备设计的快速、强大和开放的视觉语言助手。它结合了面向移动设备的架构设计和技术,包括从头开始训.

Video-LLaMA:给大语言模型赋予视听觉能力

本文来源 机器之心编辑部视频在当今社交媒体和互联网文化中扮演着愈发重要的角色,抖音,快手,B 站等已经成为数以亿计用户的热门平台。用户围绕视频分享自己的生活点滴、创意作品、有趣瞬间等内容,与他人互动和交流。近期,大语言模型展现出了令人瞩目的能力。我们能否给大模型装上 “眼睛” 和 “耳朵”,让它能够理解视频,陪着用户互动呢?从这个问题出发,阿里达摩院的研究人员提出了 Video-LLaMA,一个.

#语言模型#人工智能#计算机视觉 +1
当世最强!多模态大模型GPT-4V使用说明,提示词demo示例一应俱全

克雷西 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI多模态王炸大模型GPT-4V,166页“说明书”重磅发布!而且还是微软团队出品。什么样的论文,能写出166页?不仅详细测评了GPT-4V在十大任务上的表现,从基础的图像识别、到复杂的逻辑推理都有展示;还传授了一整套多模态大模型提示词使用技巧——手把手教你从0到1学会写提示词,回答专业程度一看就懂,属实是把GPT-4V的使用门槛打到不存在了

#人工智能#microsoft
多模态大模型新基准 | GPT-4o准确率仅65.5%,模型最易犯感知错误

王家豪 投稿自 凹非寺 量子位 | 公众号 QbitAIGPT-4o再次掀起多模态大模型的浪潮。如果他们能以近似人类的熟练程度,在不同领域执行广泛的任务,这对许多领域带来革命性进展。因而,构建一个全面的评估基准测试就显得格外重要。然而评估大型视觉语言模型能力的进程显著落后于它们自身的发展。来自上海AI Lab、香港大学、上海交大、浙江大学等多家机构提出了 MMT-Bench。这是一个全方位的多模.

#人工智能
分享5篇医疗数据挖掘论文(附pdf下载)

医疗数据挖掘近些年非常火爆,相关的论文也层出不穷。我整理了5篇医疗数据挖掘领域的论文,分享给大家,后面附有pdf下载。另外还给大家准备了《医疗数据挖掘顶会写作方法》扫码加我,回复“医疗”领取《医疗数据挖掘论文.pdf》《医疗数据挖掘顶会写作方法》以下是论文写作干货详细大纲《医疗数据挖掘顶会写作方法》顶会审稿人主讲| 论文写作入门第1课 科学研究的基本流程1. 科学研究的定义2. 人工智能与机器学习

#数据挖掘#人工智能#机器学习 +2
史上最全的深度学习面经总结(附答案详解)

以下文章来源于:马东什么@知乎作者:马东什么原文链接:https://zhuanlan.zhihu.com/p/391954665本文仅用于学术分享,如有侵权,请联系后台作删文处理导读本文很全面的整理了深度学习方向的知识点以及一些面经书和GitHub项目的面经,有上百道题以及答案详解。最近参加社招,面试基本是问项目,然后问项目里的算法。所以这里还是按照实际的面试流程展开总...

#聚类#scipy#ipad
综述 | 神经网络的可解释性

点击上方“机器学习与生成对抗网络”,关注星标获取有趣、好玩的前沿干货!报道|人工智能前沿讲习 作者|知乎 机器学习小谈地址|https://zhuanlan.zhihu.com/p/36...

#神经网络#网络#决策树 +1
github优秀项目分享:基于yolov3的轻量级人脸检测、增值税发票OCR识别 等8大项目...

点击上方“机器学习与生成对抗网络”,关注"星标"获取有趣、好玩的前沿干货!文章来源:七月在线实验室01yolo-face-with-landmark 使用pytroch...

#计算机视觉#机器学习#人工智能 +2
知乎 | 计算机视觉工程师一天都大致在做些什么?

点击上方“机器学习与生成对抗网络”,关注"星标"获取有趣、好玩的前沿干货!from知乎,3d视觉工坊编辑;著作权归作者,侵删观点一作者|张旭https://www.zhi...

#人工智能#深度学习#计算机视觉 +2
基于深度学习的视觉三维重建研究总结

点击上方“机器学习与生成对抗网络”,关注"星标"获取有趣、好玩的前沿干货!三维重建意义三维重建作为环境感知的关键技术之一,可用于自动驾驶、虚拟现实、运动目标监测、行为分析...

#python#计算机视觉#神经网络 +2
    共 392 条
  • 1
  • 2
  • 3
  • 40
  • 请选择