logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

视觉文本预训练模型用于呼吸道疾病检测

清华大学等团队在《Nature Biomedical Engineering》发表研究,提出全球首个呼吸系统疾病视觉-语言预训练模型MedMPT。该模型通过自监督多模态学习,整合CT影像、放射报告和临床数据,实现了诊断、报告生成和处方推荐的一体化。评估显示,MedMPT在肺癌筛查(AUROC 0.9269)、COVID-19诊断(准确率0.8892)等任务中显著优于现有模型,报告生成质量(BLEU

#人工智能
深度学习音频降噪

降噪,或者语音增强,经过近50年的研究发展,涌现出了很多优秀的降噪算法,从最简单的谱减法,到维纳滤波,再到子空间的方法以及基于统计模型的MMSE估计器,然而传统信号处理的降噪算法在imcra-omlsa出现之后发就展趋于平缓。值得注意的是,如果单独使用SI-SDR,可能会导致模型估计输出与输入之间的幅值不稳定,并且如果训练数据中存在0值时,单独使用SISDR时会出现问题,公式计算不稳定,SNR的值

文章图片
#深度学习#音视频#人工智能
深度学习时,训练集的精度与测试集精度之间的关系

当训练集和测试集两个loss 之间的有较大的差距时, 定义为高方差;

#深度学习#机器学习#算法
深度学习中有监督,无监督, 自监督学习

半监督或弱监督混淆:(半监督和弱监督)指的是在数据集中部分一些例子X没有标签,但是数据的人工标签是存在的。

#深度学习#学习#机器学习
ch3_6多线程举例

对于我们自己来说,面临的第一个问题是,pytorch 中如何并发调用resnet18模型。本项目开始于一个简单的需求,即我们需要求得一个 X,能够实现模型推理并满足:前向接口需要是线程安全的。在主要硬件平台(如 NVIDIA GPU)以及主要通用加速引擎(如 TensorRT/Libtorch)上实现了此 X。

#人工智能#深度学习
AIGC大模型与多模态的概念

多模态是指涉及多种感官模态(如视觉、听觉、语言等)的信息,通过多种媒体形式进行表达和传递。在现实世界中,人们接收和理解信息的方式往往是多模态的,通过同时获取不同感官的输入,融合多种信息来源来构建对世界的认知。多模态数据能够提供更丰富、全面和准确的信息,因此在生成模型中具有重要的作用。将AIGC和大模型与多模态相结合,可以进一步提升系统的能力,实现更复杂、多样化的内容生成和理解任务。

#AIGC#人工智能
深度学习音频降噪

降噪,或者语音增强,经过近50年的研究发展,涌现出了很多优秀的降噪算法,从最简单的谱减法,到维纳滤波,再到子空间的方法以及基于统计模型的MMSE估计器,然而传统信号处理的降噪算法在imcra-omlsa出现之后发就展趋于平缓。值得注意的是,如果单独使用SI-SDR,可能会导致模型估计输出与输入之间的幅值不稳定,并且如果训练数据中存在0值时,单独使用SISDR时会出现问题,公式计算不稳定,SNR的值

文章图片
#深度学习#音视频#人工智能
AI 中医

随着技术演进,若能将传统医学智慧与现代 AI 系统深度融合,我们就能在全球范围内实现“人人可及的中医”,迈向更加公平、包容的数字健康未来。这些模型均为通用大语言模型,未针对医学或中医场景进行专门训练,代表了当前国际与国内主流AI的“原始水平”对比。研究者:把海量古籍和病例喂给模型,训练“中医专精版”AI,未来可能诞生24小时在线的“AI针灸师”。中医辨证、取穴:Qwen、GPT、Doubao 已接

#人工智能
多模态在医疗中的应用

多模态是把要检索的模态融合起来,做整体的检索,查询和检索的必须至少有一个模态是相同的,也就是要查询和检索的模态都已经在融合模态里了。跨模态是检索结果和查询的模态是不同,如图像检索文本,视频和音频。跨模态检索的关键在于对不同模态的关系进行建模,难点就是语义对齐。

#人工智能
TCBB|用于预测miRNA-疾病关联的深度学习方法综述:数据库、计算方法、挑战和未来方向(综述)

基于深度学习的MDA预测方法越来越多。然后,我们全面回顾了现有的48种基于深度学习的MDA计算方法,将它们分为经典的深度学习和基于图神经网络的技术。最后,讨论了不同计算方法的性能趋势,指出了目前研究中存在的问题,并提出了未来可能的9个研究方向。(2)这篇综述采用了和lncRNA-miRNA的综述相似的风格来写的:1)单独简述了每个计算方法,并给出了关键公式。(1)前年在写该篇文章的过程中发现陈兴老

文章图片
#深度学习#人工智能
    共 73 条
  • 1
  • 2
  • 3
  • 8
  • 请选择