10.1.1 文献检索实战指南

传统的文献检索需要确定关键词、设计检索式、人工筛选和手动归档来完成,不仅耗时费力,而且对研究者的学科知识和检索经验要求很高。Deepseek通过模型驱动的语义联想与策略优化,以智能提问转化、自动语义扩展、精准分级呈现和动态追踪更新的流程实现快速响应,极大地提高了搜索效率。

图10-1:基于Deepseek的智能文献检索实战指南

Deepseek文献检索对于新手特别友好,并不需要掌握什么方法,直接提问就行。例如,根据研究课题提问如下:

【我是一名硕士研究生,我要对研究课题“人工智能在ROP问题的应用”进行文献检索,请你介绍使用Deepseek和相关工具进行文献检索的实现方法。】。

图10-1所示,Deepseek针对课题生成了【基于Deepseek的智能文献检索实战指南】。

使用Deepseek进行文献检索的步骤

1. 科研问题解构。

将研究课题拆解为三元组:【研究目标】+【技术手段】+【适用场景】。拆解示例如下。

[早产儿视网膜病变筛查] →通过 [卷积神经网络/Transformer模型] → 实现[眼底图像自动分级]

2. 动态构建检索式。

(1)基础输入:AI/人工智能 + ROP/早产儿视网膜病变 + 筛查/诊断。

(2)智能补全:根据基础输入,Deepseek语义联想功能建议如下。

- 扩展词:transfer learning(迁移学习)

- 近义词:retinopathy of prematurity staging

- 关联技术:OCT image processing(光学相干断层扫描)

3. 跨库定点挖掘

(1)PubMed (https://pubmed.cn/) :基于MEDLINE数据源的免费生物医学文献数据库,收录超过3200万篇文摘,涵盖医学、护理学及健康科学领域。

(2)IEEEXplore (https://ieeexplore.ieee.org/) :全球科研技术核心数据库,专注于电气工程、计算机科学、电子技术及相关领域,覆盖630万份文献,包含IEEE期刊及会议论文集。

(3)中国知网 (https://www.cnki.net/) :全球最大的中文学术文献数据库,涵盖期刊、博硕士论文、会议论文、报纸、工具书等领域,收录了国内95%以上的正式出版中文学术资源。

学术增强工具链

1. 文献发现工具

(1)Connected Papers (https://www.connectedpapers.com/) :通过分析种子论文的引用和内容关联性生成文献图谱,快速定位领域内的核心文献、前沿研究及潜在研究方向。

(2)Research Rabbit (https://www.researchrabbit.ai/) :可视化文献网络的探索工具,通过智能关联与分析论文关系高效追踪领域动态、发现相关研究,并支持文献管理与协同分享。

2. 全文获取渠道

(1)Unpaywall 浏览器插件:自动探测文献的合法开放获取版本,帮助用户便捷获取全文。

(2)Research Gate (https://www.researchgate.net/) :面向科研人员的学术社交平台,支持作者联系渠道以便索取文献。

3. 文献分析工具

(1)Elicit (https://elicit.org) :基于AI的文献研究工具,通过自然语言提问处理自动检索、筛选和内容总结,可以快速提取关键结论与数据,优化文献综述的效率。

(2)Consensus (https://consensus.app) :基于AI的文献分析工具,通过自然语言处理快速检索并整合多篇论文的研究结论与证据,辅助数据驱动的学术决策与知识验证。

4. 文献管理工具

(1)Zotero (https://www.zotero.org/) :智能化文献管理工具,基于AI技术实现文献自动分类、智能摘要生成及个性化推荐。结合丰富插件能够实现自动分析文献、解读内容、生成摘要、提炼观点,帮助用户高效整理与解读学术资料。

(2)Scite (https://scite.ai):基于AI的文献检索与分析工具,通过智能分类引文为支持、反对或提及三种态度,优化文献综述和研究验证流程。

高效检索策略

1. 迭代检索策略:

按照“初步检索→阅读摘要→提炼新关键词→二次检索”的过程循环,直到在搜索结果中反复出现相同的核心文献。

2. 引文珠形增长策略:

按照“锁定核心论文→追踪其参考文献→跟踪引用该文的文献”的方法,快速梳理研究领域的发展轨迹和演进关系。

3. 多数据库校验:

同时检索中文数据库(CNKI、万方)和英文库,防止检索结果不全面。

10.1.2 生成检索表达式

本节以课题“人工智能在ROP筛查和诊断中的应用”为例,具体介绍使用Deepseek生成检索表达式的方法。根据研究课题提问如下:

【我的研究课题是“人工智能在ROP筛查和诊断中的应用”,首先需要明确检索目标与关键词。请:(1)提取核心概念,(2)扩展关键词形式,(3)分别列出PubMed, Web of Science, IEEE/IEL, 知网的检索表达式(Query box)。】。

图10-2所示,Deepseek针对课题生成了【基于Deepseek的精准文献检索策略设计】。

分析核心概念

根据研究主题,核心概念可分为三部分:

(1)领域锚点:"Retinopathy of Prematurity (ROP)" × "Artificial Intelligence (AI)"。

(2)技术路径:筛查(Screening) ∩ 诊断(Diagnosis)。

(3)交叉学科:医学影像(Medical Image) → 计算机视觉(Computer Vision)。

关键词扩展

1. 基础关键词(人工定义):ROP, ROP screening, infant retinal imaging

2. 通过DeepSeek生成扩展关键词,如表10-1所示。

3. 通过DeepSeek生成补充控制词如下。

(1)技术相关:segmentation, transfer learning, attention mechanism。

(2)数据相关:fundus images, retinal photography, neonatal screening。

(3)评价指标:sensitivity, specificity, AUC, F1-score。

图10-2:基于Deepseek的精准文献检索策略设计

表10-1:检索关键词与扩展关键词

维度

主要术语

扩展术语

疾病本体

Retinopathy of Prematurity (ROP)

Premature Retinopathy,早产儿视网膜病变

技术方法

Artificial Intelligence (AI)

Machine Learning, Deep Learning, Convolutional Neural Networks (CNN)

任务类型

Screening

Early detection, Automated staging, Risk prediction

数据模态

Fundus Images

Retinal Photography, OCT Images, Fluorescein Angiography

检索表达式设计

DeepSeek构建的检索表达式(Query box)如下。

1. PubMed

检索逻辑:结合自由词(标题/摘要)与MeSH主题词,限制近10年文献。

(("Retinopathy of Prematurity"[MeSH] OR ROP OR "retinal disease in preterm")

AND

("Artificial Intelligence"[MeSH] OR "Deep Learning"[MeSH] OR "Neural Networks, Computer"[MeSH]

 OR "computer-aided diagnosis" OR "image analysis")

AND

(screen* OR diagnos* OR classif*))

FILTER: 2014/01/01 - 2024/12/31

2. Web of Science

检索式:TS=主题,时间限制近10年。

TS= (( "Retinopathy of Prematurity" OR ROP OR "preterm retinopathy" )

  AND

  ( "artificial intelligence" OR "deep learning" OR "convolutional neural network" )

  AND

  ( screen* OR diagnos* OR "severity grading" ))

Timespan: 2014-2024, English Articles

3. IEEE/IEL(工程技术类文献)

("Retinopathy of Prematurity" OR ROP)

AND

("deep learning" OR "convolutional neural network" OR "medical imaging")

AND

(screening OR diagnosis)

AND

("fundus image" OR "retinal image")

4. 中国知网CNKI

检索式:专业检索模式,时间限制近10年。

SU=(早产儿视网膜病变 + ROP) * (人工智能 + 深度学习 + 卷积神经网络) * (筛查 + 诊断 + 分级)

时间:2015-2025 年

10.1.3 Zotero文献管理工具

本节使用Deepseek生成的检索表达式(Query box),从PubMed、知网等检索文献,将其导出到Zotero文献管理工具。

Zotero及其插件安装

Zotero作为一款免费开源的文献管理工具,具有文献收集、管理、阅读、引用功能,支持浏览器集成,支持丰富的插件扩展,特别是可以集成 Deepseek 进行AI辅助文献阅读。

1. 下载Zotero安装包。打开 Zotero官网(https://www.zotero.org),根据Windows、macOS 或 Linux操作系统选择版本下载安装包。

2. 安装Zotero软件。双击下载的安装包,按照提示安装。推荐选择非C盘安装路径。

3. 登录Zotero账户。点击菜单栏“编辑–设置–同步”登录Zotero,可以同步用户数据。

4. 安装Zotero Connector浏览器插件。

通过Zotero Connector 插件,可以一键抓取网页文献信息保存到Zotero中。支持 Chrome、Firefox、Edge等主流浏览器,PubMed、Google Scholar、知网等主流数据库。

(1)打开Microsoft Edge浏览器,点击“设置–扩展–获取Edge扩展”进入扩展商店。

(2)如图10-3所示,搜索“Zotero Connector”。

(3)点击“获取”,在弹出窗口点击“添加扩展”按钮,安装Zotero Connector插件。

(4)管理插件:点击Edge浏览器右上角的扩展按钮“

”显示扩展设置弹窗。点击“管理扩展”可以开启/禁用所选插件,点击Zotero Connector插件之后的按钮,可以把插件固定到工具栏。

5. 安装茉莉花(Jasminum)插件,用于识别中文元数据,优化对知网等中文文献的支持。

(1)从 Zotero中文社区插件商店(https://zotero-chinese.com/plugins/)下载Jasminum插件安装包(.xpi)。

(2)打开Zotero,点击顶部菜单栏的“工具–插件”,在插件管理页面选择“Install Add-on From File”,选择下载的.xpi安装包进行安装。

(3)安装完成后重启Zotero以激活插件。

(4)点击顶部菜单栏的“编辑–设置”,进入如图10-4所示的Zotero设置页面。

从左侧菜单选择 “茉莉花” 选项卡,勾选“当前位于中国大陆”、“添加中文PDF/CAJ时自动从知网抓取元数据”、“自动更新转换器”,并点击“立即更新” 按钮更新转换。

(5)打开Microsoft Edge浏览器,点击菜单栏右上角的扩展按钮,选择“Zotero connector–更多操作–扩展选项”,在参数设置页选择“Advanced”,点击“Translator”下面的“Reset Translator”按钮进行复位,复位完成后该按钮更新为“Translator updated!”。

图10-3:安装Zotero Connector插件

图10-4:安装和配置Zotero Jasminum插件

图10-5:将PubMed检索结果导入Zotero

图10-6:将PubMed检索结果导入Zotero

PubMed 检索

1. 访问 PubMed 网站(https://pubmed.ncbi.nlm.nih.gov/),登录 PubMed。

2. 输入表达式检索。将上节中DeepSeek生成的检索表达式粘贴到搜索框,点击“Search”检索。如图10-5所示,检索到116篇文献。

3. 抓取PubMed检索文献导入到Zotero。

(1)打开Zotero。

(2)点击浏览器右上角的Zotero Connector图标(图10-5①),弹出Zotero Item Selector 窗口后点击“Select All”按钮,选择保存到指定的文件夹中(图10-5④)。

(3)Zotero自动识别文献信息,将选择的116篇文献导入到指定文件夹“ROP_AI”中,如图10-6所示。如果页面包含PDF文件,Zotero会同时下载并关联到文献条目。

知网(CNKI)检索

1. 访问中国知网(https://www.cnki.net/)。登录知网。点击“高级检索”。

2. 输入表达式检索。将上节中DeepSeek生成的检索表达式粘贴到搜索框,点击“检索”就行检索。如图10-7所示,检索到41篇文献。

3. 抓取知网检索文献导入到Zotero需要茉莉花(Jasminum)插件支持。

(1)打开Zotero。

(2)点击浏览器右上角的Zotero Connector图标(图10-7①),弹出Zotero Item Selector窗口,点击“Select All”按钮,选择保存到指定的文件夹中(图10-7④)。

(3)Zoter自动识别文献信息,将选择的41篇文献导入到指定文件夹“ROP_中文期刊”中。如果页面包含 PDF 文件,Zotero会同时下载并关联到文献条目。

图10-7:将中国知网检索结果导入Zotero

补充检索

根据之前的检索结果,发现对于早期使用传统图像处理方法而不是深度学习、神经网络方法的文献可能有遗漏。通过与Deepseek继续对话,可以进一步生成补充搜索的表达式,然后再根据该表达式进行补充搜索。对话示例如下。

用户:针对早期使用传统图像处理方法而不是深度学习、神经网络方法,例如形态学、特征提取、分形等方法,进行 ROP计算机辅助诊断,请给出 PubMed 优化检索表达式。

DeepSeek-R1:以下是针对 使用传统图像处理方法(如形态学、特征提取、分形)进行 ROP 计算机辅助诊断 的 PubMed 优化检索表达式,结合 MeSH 词与自由词策略,同时排除深度学习与神经网络相关文献:

【PubMed 检索式】

用户:类似的,生成采用传统方法计算机辅助在ROP 应用的 中国知网的检索式

DeepSeek-R1:以下是针对 中国知网(CNKI) 中关于 使用传统图像处理方法(形态学、特征提取、分形分析等)的ROP计算机辅助应用 的优化检索式及策略:

【核心检索式】


往期回顾:

【人工智能通识专栏】第二十六讲:Deepseek网页代码生成

【人工智能通识专栏】第二十七讲:Deepseek编程助手

【人工智能通识专栏】第二十八讲:IDE集成Deepseek

Logo

更多推荐