logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Med-MAT 医疗多模态大模型超级泛化:模型在学会了各种基础要素之后,就能自己组合这些要素,用到从未直接见过的新应用场景中,而不需要再从头学起

这篇论文的主要价值在于提出并验证了多模态大模型在医疗影像领域“组合泛化”(Compositional Generalization)的重要作用,并通过构建 Med-MAT 大规模数据集和大量对比实验,证明了只有共享了模态/解剖部位/任务特征的多任务数据,才能真正帮助目标任务更好地泛化学习,对于医学多模态模型的设计、训练数据的采集与选择有着重要的理论和实践指导意义。核心思路:相同的三要素(MAT-T

文章图片
#人工智能
多模态融合算法分析

在模型的输入阶段就开始融合不同来源的数据,通常通过直接结合不同模态的特征向量来进行。

文章图片
#算法
SOTA 方法:多模态大模型学会心电图图像解析 + 100万ECG图像指令调优数据

论文:TEACH MULTIMODAL LLMS TO COMPREHEND ELECTROCARDIOGRAPHIC IMAGES代码:https://aimedlab.github.io/PULSE/Qwen 中文翻译:https://lxblog.com/efficiency/U/2YrXeXKeARnEF61PGTOhLwF2EIBKo84S论文写作框架分析:Why - 这个研究要解决什

文章图片
#人工智能
MMed-RAG:专为医学视觉语言模型设计的多功能多模态系统

MMed-RAG是一个医疗领域的多模态RAG系统,通过三个核心组件(领域感知、自适应检索、偏好微调)提高Med-LVLMs的可靠性。文章通过提出问题→分析挑战→提供解决方案的逻辑展开,MMed-RAG是对现有Med-LVLMs局限性的直接回应。针对Med-LVLMs的事实性幻觉(空)这一源于跨模态对齐与知识整合不足(雨)的问题。这些方向既保持了技术可行性,又具有显著的临床价值和创新性,能够真正推动

文章图片
#语言模型#人工智能#自然语言处理
IRENE:医学图像、文本、基因数据 + 多模态融合 + 疾病诊断模型

知网:面向深度学习的多模态融合技术研究综述医疗多模态文章:https://m.leiphone.com/category/healthai/CIeOmsPoB1YlP0An.html以前做医学图像分类,就是纯图像做的,现在是融合多个信息源来做,多模态融合了。在临床诊断中,为了做出准确的决策,医生通常需要综合考虑患者的主诉、医学影像和实验室化验结果等多模态信息。目的:开发高效的多模态融合方法,以提高

文章图片
PrimeKG:为精准医学分析设计的多模态知识图谱

PrimeKG是为精确医学研究专门设计的一个知识图谱,它集成了来自20个高质量数据源的信息,涵盖17,080种疾病和超过400万种数据关系。这些关系包括了疾病与蛋白质变化、生物过程、身体结构功能以及药物治疗作用等多个层面。与其他知识图谱不同的是,PrimeKG特别强调了包括药物的适应症、禁忌症和非标签用途等通常缺失的药物-疾病关系。

文章图片
#知识图谱
多模态数据处理系统:用AI读PDF的智能助手系统分析

多模态PDF识别子解法(因为PDF包含图文混合特征) + 锚点文本辅助子解法(因为需要位置信息辅助理解特征) + 文档结构化解析子解法(因为文档存在层级标题结构特征) + 知识图谱三元组抽取子解法(因为需要提取原子事实和关键元素特征) + 并发处理优化子解法(因为多页处理效率特征)双卡 48G 显存可部署,单卡 22 G 只能用 3B多模态模型 + 7B语言模型。这些局限性都直接来源于代码实现,体

文章图片
#人工智能
【多模态大模型】Latent Diffusion:在潜在空间而非像素空间进行操作,从而减少了计算复杂度

潜在扩散(Latent Diffusion)是一种处理和生成图像的方法,它通过在潜在空间而非直接在像素空间处理数据来提高效率和质量。

文章图片
#人工智能
【多模态大模型】GLIP:零样本学习 + 目标检测 + 视觉语言大模型

通过这些数据,GLIP学习到了丰富的视觉概念和语义信息,比如什么是“猫”,它们长什么样,常出现在哪些场景中,以及如何根据不同的描述(例如“黑色的猫”)来识别和定位具体的对象。比如,当GLIP遇到一个它在预训练数据中没有直接见过的新图片,即使这张图片中的对象是新的或者以新的方式出现,GLIP也能利用它从预训练中学到的知识,来识别和定位图片中的对象。: 在现有的视觉识别任务中,模型通常是针对一组固定的

文章图片
#学习#目标检测#人工智能
Med-PMC:模拟医生“先问后查“,医疗个性化多模态会诊系统

通过构建一个更接近真实临床场景的评估框架,Med-PMC致力于全面评估和改进MLLMs在医疗领域的应用能力,为未来AI辅助医疗诊断提供更可靠的技术支持。Med-PMC不只是测试简单的医学问答或报告生成能力,它评估的是MLLMs在复杂临床多模态任务中的整体表现。这种方法有潜力显著提高MLLMs在真实医疗环境中的表现,并为医疗AI系统的评估和改进提供一个更加全面和动态的框架。这模拟了真实医生的诊断和治

文章图片
#人工智能
    共 588 条
  • 1
  • 2
  • 3
  • 59
  • 请选择