【人工智能通识专栏】第二十九讲:Deepseek助力文献检索
(5)打开Microsoft Edge浏览器,点击菜单栏右上角的扩展按钮,选择“Zotero connector–更多操作–扩展选项”,在参数设置页选择“Advanced”,点击“Translator”下面的“Reset Translator”按钮进行复位,复位完成后该按钮更新为“Translator updated!Zotero作为一款免费开源的文献管理工具,具有文献收集、管理、阅读、引用功能,
10.1.1 文献检索实战指南
传统的文献检索需要确定关键词、设计检索式、人工筛选和手动归档来完成,不仅耗时费力,而且对研究者的学科知识和检索经验要求很高。Deepseek通过模型驱动的语义联想与策略优化,以智能提问转化、自动语义扩展、精准分级呈现和动态追踪更新的流程实现快速响应,极大地提高了搜索效率。
图10-1:基于Deepseek的智能文献检索实战指南
Deepseek文献检索对于新手特别友好,并不需要掌握什么方法,直接提问就行。例如,根据研究课题提问如下:
【我是一名硕士研究生,我要对研究课题“人工智能在ROP问题的应用”进行文献检索,请你介绍使用Deepseek和相关工具进行文献检索的实现方法。】。
如图10-1所示,Deepseek针对课题生成了【基于Deepseek的智能文献检索实战指南】。
使用Deepseek进行文献检索的步骤
1. 科研问题解构。
将研究课题拆解为三元组:【研究目标】+【技术手段】+【适用场景】。拆解示例如下。
[早产儿视网膜病变筛查] →通过 [卷积神经网络/Transformer模型] → 实现[眼底图像自动分级]
2. 动态构建检索式。
(1)基础输入:AI/人工智能 + ROP/早产儿视网膜病变 + 筛查/诊断。
(2)智能补全:根据基础输入,Deepseek语义联想功能建议如下。
- 扩展词:transfer learning(迁移学习)
- 近义词:retinopathy of prematurity staging
- 关联技术:OCT image processing(光学相干断层扫描)
3. 跨库定点挖掘。
(1)PubMed (https://pubmed.cn/) :基于MEDLINE数据源的免费生物医学文献数据库,收录超过3200万篇文摘,涵盖医学、护理学及健康科学领域。
(2)IEEEXplore (https://ieeexplore.ieee.org/) :全球科研技术核心数据库,专注于电气工程、计算机科学、电子技术及相关领域,覆盖630万份文献,包含IEEE期刊及会议论文集。
(3)中国知网 (https://www.cnki.net/) :全球最大的中文学术文献数据库,涵盖期刊、博硕士论文、会议论文、报纸、工具书等领域,收录了国内95%以上的正式出版中文学术资源。
学术增强工具链
1. 文献发现工具
(1)Connected Papers (https://www.connectedpapers.com/) :通过分析种子论文的引用和内容关联性生成文献图谱,快速定位领域内的核心文献、前沿研究及潜在研究方向。
(2)Research Rabbit (https://www.researchrabbit.ai/) :可视化文献网络的探索工具,通过智能关联与分析论文关系高效追踪领域动态、发现相关研究,并支持文献管理与协同分享。
2. 全文获取渠道
(1)Unpaywall 浏览器插件:自动探测文献的合法开放获取版本,帮助用户便捷获取全文。
(2)Research Gate (https://www.researchgate.net/) :面向科研人员的学术社交平台,支持作者联系渠道以便索取文献。
3. 文献分析工具
(1)Elicit (https://elicit.org) :基于AI的文献研究工具,通过自然语言提问处理自动检索、筛选和内容总结,可以快速提取关键结论与数据,优化文献综述的效率。
(2)Consensus (https://consensus.app) :基于AI的文献分析工具,通过自然语言处理快速检索并整合多篇论文的研究结论与证据,辅助数据驱动的学术决策与知识验证。
4. 文献管理工具
(1)Zotero (https://www.zotero.org/) :智能化文献管理工具,基于AI技术实现文献自动分类、智能摘要生成及个性化推荐。结合丰富插件能够实现自动分析文献、解读内容、生成摘要、提炼观点,帮助用户高效整理与解读学术资料。
(2)Scite (https://scite.ai):基于AI的文献检索与分析工具,通过智能分类引文为支持、反对或提及三种态度,优化文献综述和研究验证流程。
高效检索策略
1. 迭代检索策略:
按照“初步检索→阅读摘要→提炼新关键词→二次检索”的过程循环,直到在搜索结果中反复出现相同的核心文献。
2. 引文珠形增长策略:
按照“锁定核心论文→追踪其参考文献→跟踪引用该文的文献”的方法,快速梳理研究领域的发展轨迹和演进关系。
3. 多数据库校验:
同时检索中文数据库(CNKI、万方)和英文库,防止检索结果不全面。
10.1.2 生成检索表达式
本节以课题“人工智能在ROP筛查和诊断中的应用”为例,具体介绍使用Deepseek生成检索表达式的方法。根据研究课题提问如下:
【我的研究课题是“人工智能在ROP筛查和诊断中的应用”,首先需要明确检索目标与关键词。请:(1)提取核心概念,(2)扩展关键词形式,(3)分别列出PubMed, Web of Science, IEEE/IEL, 知网的检索表达式(Query box)。】。
如图10-2所示,Deepseek针对课题生成了【基于Deepseek的精准文献检索策略设计】。
分析核心概念
根据研究主题,核心概念可分为三部分:
(1)领域锚点:"Retinopathy of Prematurity (ROP)" × "Artificial Intelligence (AI)"。
(2)技术路径:筛查(Screening) ∩ 诊断(Diagnosis)。
(3)交叉学科:医学影像(Medical Image) → 计算机视觉(Computer Vision)。
关键词扩展
1. 基础关键词(人工定义):ROP, ROP screening, infant retinal imaging
2. 通过DeepSeek生成扩展关键词,如表10-1所示。
3. 通过DeepSeek生成补充控制词如下。
(1)技术相关:segmentation, transfer learning, attention mechanism。
(2)数据相关:fundus images, retinal photography, neonatal screening。
(3)评价指标:sensitivity, specificity, AUC, F1-score。
图10-2:基于Deepseek的精准文献检索策略设计
表10-1:检索关键词与扩展关键词
维度 |
主要术语 |
扩展术语 |
疾病本体 |
Retinopathy of Prematurity (ROP) |
Premature Retinopathy,早产儿视网膜病变 |
技术方法 |
Artificial Intelligence (AI) |
Machine Learning, Deep Learning, Convolutional Neural Networks (CNN) |
任务类型 |
Screening |
Early detection, Automated staging, Risk prediction |
数据模态 |
Fundus Images |
Retinal Photography, OCT Images, Fluorescein Angiography |
检索表达式设计
DeepSeek构建的检索表达式(Query box)如下。
1. PubMed
检索逻辑:结合自由词(标题/摘要)与MeSH主题词,限制近10年文献。
(("Retinopathy of Prematurity"[MeSH] OR ROP OR "retinal disease in preterm")
AND
("Artificial Intelligence"[MeSH] OR "Deep Learning"[MeSH] OR "Neural Networks, Computer"[MeSH]
OR "computer-aided diagnosis" OR "image analysis")
AND
(screen* OR diagnos* OR classif*))
FILTER: 2014/01/01 - 2024/12/31
2. Web of Science
检索式:TS=主题,时间限制近10年。
TS= (( "Retinopathy of Prematurity" OR ROP OR "preterm retinopathy" )
AND
( "artificial intelligence" OR "deep learning" OR "convolutional neural network" )
AND
( screen* OR diagnos* OR "severity grading" ))
Timespan: 2014-2024, English Articles
3. IEEE/IEL(工程技术类文献)
("Retinopathy of Prematurity" OR ROP)
AND
("deep learning" OR "convolutional neural network" OR "medical imaging")
AND
(screening OR diagnosis)
AND
("fundus image" OR "retinal image")
4. 中国知网(CNKI)
检索式:专业检索模式,时间限制近10年。
SU=(早产儿视网膜病变 + ROP) * (人工智能 + 深度学习 + 卷积神经网络) * (筛查 + 诊断 + 分级)
时间:2015-2025 年
10.1.3 Zotero文献管理工具
本节使用Deepseek生成的检索表达式(Query box),从PubMed、知网等检索文献,将其导出到Zotero文献管理工具。
Zotero及其插件安装
Zotero作为一款免费开源的文献管理工具,具有文献收集、管理、阅读、引用功能,支持浏览器集成,支持丰富的插件扩展,特别是可以集成 Deepseek 进行AI辅助文献阅读。
1. 下载Zotero安装包。打开 Zotero官网(https://www.zotero.org),根据Windows、macOS 或 Linux操作系统选择版本下载安装包。
2. 安装Zotero软件。双击下载的安装包,按照提示安装。推荐选择非C盘安装路径。
3. 登录Zotero账户。点击菜单栏“编辑–设置–同步”登录Zotero,可以同步用户数据。
4. 安装Zotero Connector浏览器插件。
通过Zotero Connector 插件,可以一键抓取网页文献信息保存到Zotero中。支持 Chrome、Firefox、Edge等主流浏览器,PubMed、Google Scholar、知网等主流数据库。
(1)打开Microsoft Edge浏览器,点击“设置–扩展–获取Edge扩展”进入扩展商店。
(2)如图10-3所示,搜索“Zotero Connector”。
(3)点击“获取”,在弹出窗口点击“添加扩展”按钮,安装Zotero Connector插件。
(4)管理插件:点击Edge浏览器右上角的扩展按钮“
”显示扩展设置弹窗。点击“管理扩展”可以开启/禁用所选插件,点击Zotero Connector插件之后的按钮,可以把插件固定到工具栏。
5. 安装茉莉花(Jasminum)插件,用于识别中文元数据,优化对知网等中文文献的支持。
(1)从 Zotero中文社区插件商店(https://zotero-chinese.com/plugins/)下载Jasminum插件安装包(.xpi)。
(2)打开Zotero,点击顶部菜单栏的“工具–插件”,在插件管理页面选择“Install Add-on From File”,选择下载的.xpi安装包进行安装。
(3)安装完成后重启Zotero以激活插件。
(4)点击顶部菜单栏的“编辑–设置”,进入如图10-4所示的Zotero设置页面。
从左侧菜单选择 “茉莉花” 选项卡,勾选“当前位于中国大陆”、“添加中文PDF/CAJ时自动从知网抓取元数据”、“自动更新转换器”,并点击“立即更新” 按钮更新转换。
(5)打开Microsoft Edge浏览器,点击菜单栏右上角的扩展按钮,选择“Zotero connector–更多操作–扩展选项”,在参数设置页选择“Advanced”,点击“Translator”下面的“Reset Translator”按钮进行复位,复位完成后该按钮更新为“Translator updated!”。
图10-3:安装Zotero Connector插件
图10-4:安装和配置Zotero Jasminum插件
图10-5:将PubMed检索结果导入Zotero
图10-6:将PubMed检索结果导入Zotero
PubMed 检索
1. 访问 PubMed 网站(https://pubmed.ncbi.nlm.nih.gov/),登录 PubMed。
2. 输入表达式检索。将上节中DeepSeek生成的检索表达式粘贴到搜索框,点击“Search”检索。如图10-5所示,检索到116篇文献。
3. 抓取PubMed检索文献导入到Zotero。
(1)打开Zotero。
(2)点击浏览器右上角的Zotero Connector图标(图10-5①),弹出Zotero Item Selector 窗口后点击“Select All”按钮,选择保存到指定的文件夹中(图10-5④)。
(3)Zotero自动识别文献信息,将选择的116篇文献导入到指定文件夹“ROP_AI”中,如图10-6所示。如果页面包含PDF文件,Zotero会同时下载并关联到文献条目。
知网(CNKI)检索
1. 访问中国知网(https://www.cnki.net/)。登录知网。点击“高级检索”。
2. 输入表达式检索。将上节中DeepSeek生成的检索表达式粘贴到搜索框,点击“检索”就行检索。如图10-7所示,检索到41篇文献。
3. 抓取知网检索文献导入到Zotero需要茉莉花(Jasminum)插件支持。
(1)打开Zotero。
(2)点击浏览器右上角的Zotero Connector图标(图10-7①),弹出Zotero Item Selector窗口,点击“Select All”按钮,选择保存到指定的文件夹中(图10-7④)。
(3)Zoter自动识别文献信息,将选择的41篇文献导入到指定文件夹“ROP_中文期刊”中。如果页面包含 PDF 文件,Zotero会同时下载并关联到文献条目。
图10-7:将中国知网检索结果导入Zotero
补充检索
根据之前的检索结果,发现对于早期使用传统图像处理方法而不是深度学习、神经网络方法的文献可能有遗漏。通过与Deepseek继续对话,可以进一步生成补充搜索的表达式,然后再根据该表达式进行补充搜索。对话示例如下。
用户:针对早期使用传统图像处理方法而不是深度学习、神经网络方法,例如形态学、特征提取、分形等方法,进行 ROP计算机辅助诊断,请给出 PubMed 优化检索表达式。
DeepSeek-R1:以下是针对 使用传统图像处理方法(如形态学、特征提取、分形)进行 ROP 计算机辅助诊断 的 PubMed 优化检索表达式,结合 MeSH 词与自由词策略,同时排除深度学习与神经网络相关文献:
【PubMed 检索式】
…
用户:类似的,生成采用传统方法计算机辅助在ROP 应用的 中国知网的检索式
DeepSeek-R1:以下是针对 中国知网(CNKI) 中关于 使用传统图像处理方法(形态学、特征提取、分形分析等)的ROP计算机辅助应用 的优化检索式及策略:
【核心检索式】
…
往期回顾:
更多推荐
所有评论(0)