
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
paperMind 当前已经完成了学术论文智能阅读平台的核心链路:PDF 解析、元数据提取、论文分块、向量检索、智能问答、深度阅读、幻觉检查、术语翻译、文献检索和用户系统都已经串联起来。这个项目的重点不只是“调用大模型回答问题”,而是把论文从静态 PDF 转换成可检索、可追问、可分析、可翻译的结构化知识对象。通过 MinerU、ChromaDB、LangGraph、DeepSeek Chat 和本
本文介绍了学术文献阅读平台中深度阅读功能的实现方案。该功能采用三级协同设计:先由AI阅读器系统拆解文献方法、数学推导和实验设计,再由检查器验证分析结果的可靠性(通过可信度评分机制),最后生成深层思考问题。关键技术包括:1)Langgraph架构下的条件循环控制,实现分析-验证-修正的迭代流程;2)结构化输出处理,确保程序可解析可信度评分;3)双模式设计(首次分析/重写)保证准确性。该功能区别于普通
本文介绍了面向学术场景的文献解析平台的PDF解析模块实现过程。该模块通过MinerU开源工具实现复杂PDF文档的解析与内容抽取,能够处理多模态PDF文件中的文本、图片、表格和公式等元素。开发过程中采用FastAPI后端架构,实现了PDF上传、任务状态管理和结果获取等功能接口。技术难点包括双栏排版处理、图片表格识别、公式转换和章节结构恢复等。最终解决方案整合了MinerU的解析引擎,通过异步任务处理
上周工作聚焦于文献解析与智能平台搭建。在PDF解析方面,通过正则匹配实现了文献元数据提取功能,解决了作者识别、机构过滤等问题。技术架构上引入LangGraph框架构建多智能体系统,完成了Router路由节点和QA、Retrieval等基础Agent节点的搭建,采用DeepSeekLLM和本地Embedding模型,实现了论文分块向量化存储(ChromaDB)。前端重构新增功能导航栏,平台从单一解析
上周工作聚焦于文献解析与智能平台搭建。在PDF解析方面,通过正则匹配实现了文献元数据提取功能,解决了作者识别、机构过滤等问题。技术架构上引入LangGraph框架构建多智能体系统,完成了Router路由节点和QA、Retrieval等基础Agent节点的搭建,采用DeepSeekLLM和本地Embedding模型,实现了论文分块向量化存储(ChromaDB)。前端重构新增功能导航栏,平台从单一解析
本文介绍了面向学术场景的文献解析平台的PDF解析模块实现过程。该模块通过MinerU开源工具实现复杂PDF文档的解析与内容抽取,能够处理多模态PDF文件中的文本、图片、表格和公式等元素。开发过程中采用FastAPI后端架构,实现了PDF上传、任务状态管理和结果获取等功能接口。技术难点包括双栏排版处理、图片表格识别、公式转换和章节结构恢复等。最终解决方案整合了MinerU的解析引擎,通过异步任务处理







