logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

paperMind 项目阶段总结:面向学术论文阅读的 AI 文献智能平台

paperMind 当前已经完成了学术论文智能阅读平台的核心链路:PDF 解析、元数据提取、论文分块、向量检索、智能问答、深度阅读、幻觉检查、术语翻译、文献检索和用户系统都已经串联起来。这个项目的重点不只是“调用大模型回答问题”,而是把论文从静态 PDF 转换成可检索、可追问、可分析、可翻译的结构化知识对象。通过 MinerU、ChromaDB、LangGraph、DeepSeek Chat 和本

#论文阅读#人工智能
Papermind平台搭建(三):深度阅读功能的实现

本文介绍了学术文献阅读平台中深度阅读功能的实现方案。该功能采用三级协同设计:先由AI阅读器系统拆解文献方法、数学推导和实验设计,再由检查器验证分析结果的可靠性(通过可信度评分机制),最后生成深层思考问题。关键技术包括:1)Langgraph架构下的条件循环控制,实现分析-验证-修正的迭代流程;2)结构化输出处理,确保程序可解析可信度评分;3)双模式设计(首次分析/重写)保证准确性。该功能区别于普通

#人工智能
学术文献阅读平台开发(一):PDF文献解析实现

本文介绍了面向学术场景的文献解析平台的PDF解析模块实现过程。该模块通过MinerU开源工具实现复杂PDF文档的解析与内容抽取,能够处理多模态PDF文件中的文本、图片、表格和公式等元素。开发过程中采用FastAPI后端架构,实现了PDF上传、任务状态管理和结果获取等功能接口。技术难点包括双栏排版处理、图片表格识别、公式转换和章节结构恢复等。最终解决方案整合了MinerU的解析引擎,通过异步任务处理

PaperMind:学术论文阅读平台开发(二)

上周工作聚焦于文献解析与智能平台搭建。在PDF解析方面,通过正则匹配实现了文献元数据提取功能,解决了作者识别、机构过滤等问题。技术架构上引入LangGraph框架构建多智能体系统,完成了Router路由节点和QA、Retrieval等基础Agent节点的搭建,采用DeepSeekLLM和本地Embedding模型,实现了论文分块向量化存储(ChromaDB)。前端重构新增功能导航栏,平台从单一解析

#python#pytorch
PaperMind:学术论文阅读平台开发(二)

上周工作聚焦于文献解析与智能平台搭建。在PDF解析方面,通过正则匹配实现了文献元数据提取功能,解决了作者识别、机构过滤等问题。技术架构上引入LangGraph框架构建多智能体系统,完成了Router路由节点和QA、Retrieval等基础Agent节点的搭建,采用DeepSeekLLM和本地Embedding模型,实现了论文分块向量化存储(ChromaDB)。前端重构新增功能导航栏,平台从单一解析

#python#pytorch
学术文献阅读平台开发(一):PDF文献解析实现

本文介绍了面向学术场景的文献解析平台的PDF解析模块实现过程。该模块通过MinerU开源工具实现复杂PDF文档的解析与内容抽取,能够处理多模态PDF文件中的文本、图片、表格和公式等元素。开发过程中采用FastAPI后端架构,实现了PDF上传、任务状态管理和结果获取等功能接口。技术难点包括双栏排版处理、图片表格识别、公式转换和章节结构恢复等。最终解决方案整合了MinerU的解析引擎,通过异步任务处理

到底了