随着计算机技术的提高,数据挖掘也得到了广泛的应用,在生物医学领域中更是如此。如今,医院的信息化发展为医学数据的获取、存储及处理提供了很大的便利,医学大数据与数据挖掘的结合,更能帮助人们从存储的大体量、高复杂的医学数据中提取有价值信息,加速医学成果转化。

因此,医疗数据挖掘同样是近年来的热门方向之一,在近期的kaggle新赛中也有体现,比如ICR疾病预测大赛,对这个比赛感兴趣的同学可以私信我哈。

不过今天我们先分享论文~这次研读了8篇医疗数据挖掘方向的论文,量少但质量高,每一篇都是必读的!链接都安排在下面了,同学们自取。

1.Enhancing Drug-Drug Interaction Extraction from Texts by Molecular Structure Information

利用分子结构信息加强从文本中提取的药物相互作用

链接:https://arxiv.org/abs/1805.05593

推荐理由:

本论文提出了一种 neural 方法来从文本中提取药物间相互作用(DDIs),使用药物分子结构信息作为外部信息。

具体做法是:

  1. 使用卷积神经网络对文本中提到的药物对编码,获取文本特征
  2. 使用图卷积网络对药物分子结构对编码,获取分子特征
  3. 将这两个网络的输出结果连接在一起

实验结果表明:

  1. 图卷积网络能够以高准确率从药物分子结构中预测药物相互作用
  2. 分子信息能够在 DDIExtraction 2013 数据集上增加2.39个百分点的 F 分数,增强基于文本的 DDI 潜在关系抽取效果
推荐内容

2.KGNN: Knowledge Graph Neural Network for Drug-Drug Interaction Prediction

KGNN:基于知识图谱的神经网络预测药物相互作用

链接:https://www.ijcai.org/Proceedings/2020/0380

推荐理由:

本论文提出一个名为Knowledge Graph Neural Network(KGNN) 的框架,用来预测药物间相互作用(DDI prediction)。

预测药物间相互作用是一个重要但具有挑战性的问题,在临床试验期间有效识别潜在的相互作用对患者和社会很重要。现有的AI模型侧重于整合多个数据源和结合嵌入方法,但较少关注药物与其他实体(如靶点和基因)之间的潜在相关性。最近的研究使用知识图谱(KG)预测相互作用,但这些方法直接学习节点嵌入,限制了获取知识图谱中每个实体的邻域信息。

论文提出的KGNN框架能有效获取药物及其潜在邻域关系信息:

  • KGNN从每个实体的邻域作为局部感受野来学习,然后将其与当前实体表示整合
  • 这样 receptive 字段就可以扩展到多个跳之遥,模拟高阶拓扑信息和获取药物的长距离相关性

实验表明,与经典模型和最先进模型相比,KGNN 的效果更好。总的来说,KGNN是一个基于知识图谱的框架,它旨在弥补现有预测方法的限制,有效利用知识图谱中的邻域信息。

3.BERTKG-DDI: Towards Incorporating Entity-specific Knowledge Graph Information in Predicting Drug-Drug Interactions

BERTKG-DDI:充分利用实体特定知识图谱信息预测药物相互作用

链接:https://arxiv.org/abs/2012.11142

推荐理由:

本论文提出了一种结合知识图谱嵌入与预训练语言模型来提高关系分类效果的方法。

在论文中,作者探讨如何吸收来自知识图谱(KG)嵌入的生物医学实体知识(如药物、疾病、基因),从文本语料中预测药物相互作用。

对此,作者提出了一种新方法BERTKG-DDI,它将药物与其他生物医学实体的交互信息混合到BioBERT 基于RC的架构中。在DDIExtraction 2013语料集上进行的实验清楚地表明,此策略比其他基线架构有4.1%的宏观F1分值改进。

4.A Comparison of Linear GeneticProgramming and Neural Networksin Medical Data Mining

线性基因编程与神经网络在医疗数据挖掘中的对比

链接:https://www.cs.mun.ca/~banzhaf/papers/IEEETA

推荐理由:

本论文提出了一种新的线性基因编程(GP)方法,提到了以下2种加速GP方法:

  • 1)一个可高效消除内含子码的算法
  • 2)一种微内化进化算法,可以在单一处理器上实现虚拟并行化加速运行

文章比较了GP在医疗分类问题上的性能(来自基准数据库),结果表明:GP在分类和泛化上与神经网络相当。

5.Data Mining Techniques for MedicalData A Review

医疗数据的数据挖掘技术综述

链接:https://ieeexplore.ieee.org/document/7955586

推荐理由:

本论文总结数据挖掘在医疗保健领域中的运用。

主要内容:

  • 数据挖掘在不同领域如金融、临床研究、教育、医疗保健等具有重要价值。
  • 从医疗数据中提取知识是一个挑战性且复杂的任务。
  • 介绍了之前研究的互动关系和交叉。
  • 比较了在医疗和医疗数据领域常用的数据挖掘技术的优缺点。
  • 讨论了数据挖掘任务在医疗保健中的应用。
  • 提出了医疗数据在医疗保健中的独特性分析方法。

这篇论文着重于数据挖掘在医疗保健领域中的应用,总结了相关研究,比较了流行的数据挖掘技术,并分析了医疗数据的独特性。

6.Medical data mining: knowledge discovery in a clinical data warehouse

医疗数据挖掘:来自临床数据仓库中的知识发现

链接:https://webdocs.cs.ualberta.ca/~zaiane/courses/cmput605/2008/pdf/medical_data_mining_prather.pdf

推荐理由:

临床数据库中存有大量关于患者和医疗状况的信息,数据中的关系和模式可能提供新医学知识。不幸的是,很少有方法被开发和应用来发现这些隐藏知识。在这项研究中,使用数据挖掘(也称为数据库中的知识发现)技术来在一个大型临床数据库中搜索关系。

这篇论文描述了数据挖掘临床数据库所涉及的过程,包括数据仓库化、数据查询和清理以及数据分析。数据挖掘技术有助于分析庞大的临床数据库,发现新的医学知识。总的来说,这篇文章介绍了如何使用数据挖掘技术分析临床数据库,这里采用了探索性因子分析,发现3个与早产有关的潜在因素。

7.Specifics of Medical Data Mining forDiagnosis Aid A Survey

医学数据挖掘辅助诊断的具体方法综述

链接:https://www.sciencedirect.com/science/article/abs/pii/S0957417418306389

推荐理由:

这篇文章总结了数据挖掘在医疗保健领域的应用。

医学信息学在现代医疗保健中发挥着 increasingly important role,信息技术的进步产生了大量的复杂临床数据,这些数据可被利用来发现有价值的医学见解,而数据挖掘技术是挖掘这些数据模式和知识的有用工具。

本论文讨论了数据挖掘方法应用于医疗保健数据的研究,包括预测患者结局、风险分层、疾病检测和药品安全等多个医疗应用。介绍了分类、聚类和关联规则挖掘等常见数据挖掘算法,强调了医疗数据挖掘中的挑战,特别是数据质量、模型可解释性和临床验证。

总结,数据挖掘为基于证据的医学和改进临床决策提供了很大希望,建议未来的研究方向,以优化数据挖掘在医疗保健体系中的整合。

8.Uniqueness of Medical Data MiningHow the new technologies and datathey generate are transformingmedicine

医疗数据挖掘的独特性新技术及其产生的数据

链接:https://arxiv.org/abs/1905.09203

推荐理由:

本论文的独特之处在于使用案例研究来说明新技术如何影响医学实践。

重点内容:

  • 介绍了机器学习/人工智能方法来处理医疗数据。
  • 使用案例研究来说明新技术如何影响医学实践。

总的来说,这篇论文着重于描述新技术和大数据如何影响医学,强调医疗数据的独特性,并通过案例研究来说明新技术如何改变医学实践。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“医疗”获取医疗数据挖掘必读论文合集

码字不易,欢迎大家点赞评论收藏!

点击阅读全文
Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐