logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

MinerU LlamaIndex 集成深度指南:一键打通复杂文档与大模型数据索引架构

MinerU是一款开源的文档解析工具,能够将PDF、Word等各类文档转换为结构化Markdown。文章介绍了其与LlamaIndex的集成方案,主要内容包括: MinerU核心能力:支持PDF转Markdown、公式识别、表格提取等功能,在基准测试中表现优异 安装与使用:提供Python安装指南和简单代码示例 两种解析模式:Flash模式(免Token)和Precision模式(需Token)的

文章图片
MinerU + RAG 集成实战:从 PDF 结构化解析到精准检索

本文介绍了如何将MinerU与RAG系统集成,提升PDF文档的解析质量和检索效果。主要内容包括: MinerU作为结构化抽取层的关键作用,相比传统PDF解析工具能更好地保留文档的版面结构、公式和表格信息,输出Markdown或元素级JSON格式。 详细对比了MinerU与传统工具在输出结构、公式处理、表格识别等方面的差异,展示MinerU在保留语义完整性上的优势。 提供了从环境安装到端到端实现的完

文章图片
MinerU + DeepSeek V4:竖排繁体 PDF转简体横排阅读方案

竖排繁体PDF高效转换方案 传统PDF工具难以处理竖排繁体文本,导致阅读和提取困难。MinerU通过视觉理解技术,在布局分析阶段同步预测文本旋转角度和阅读顺序,准确还原竖排结构,输出结构化Markdown。再结合DeepSeek V4 Flash进行繁简转换与横排重排,实现本地化高效处理。 核心优势: MinerU原生支持竖排识别,避免传统OCR的顺序错乱 两阶段处理:先提取结构,再语言转换,确保

文章图片
#java#前端
Deepseek V4 Pro 新手极速上手指南

本文详细介绍了Deepseek V4 Pro大模型的应用开发全流程。从模型能力解析到环境配置,再到API调用实战,重点解决了开发者在实际落地中的痛点问题。文章包含智能对话构建、提示词工程、长文本处理等核心应用场景的实操方案,并提供了代码示例和常见错误排查方法。特别针对响应速度优化、并发调用等生产环境需求,给出了具体可行的技术策略,帮助开发者高效完成从原型到上线的完整流程。

文章图片
#人工智能#语言模型
DeepSeek-TUI 也能读 PDF 了:Skill + MinerU CLI 终端文档解析实战

DeepSeek-TUI 没有多模态能力,无法直接读取 PDF。本文介绍通过 Skill + MinerU CLI 的替代方案,让终端 Agent 自动调用 mineru-open-api 完成文档解析,包含安装步骤、两种解析模式对比、实战演示和批量处理技巧。

文章图片
#人工智能#深度学习#后端
MCP 服务器配置:让 AI 助手直接解析 PDF 文档

MinerU是一款由上海人工智能实验室开发的文档解析工具,可将PDF、Word等文件转换为结构化格式。最新版本MinerU2.5-Pro在1.2B小参数量下实现了95.69分的行业领先性能。通过MCP协议,用户可轻松配置Claude、Cursor等AI客户端直接调用MinerU解析文档。安装只需一条uvx命令,支持两种模式:免登录的Flash模式(20页限制)和需要Token的精准模式(600页上

#服务器#人工智能
MCP协议2025年大爆发,2026年反而相对平静——是真的走向成熟期,还是走向衰退?

MCP协议在2025年因解决AI工具互联标准化问题引发热潮,大厂纷纷跟进,但2026年热度骤降。质疑者指出MCP在工程实践中存在连接不稳定、上下文膨胀等问题,基准测试显示其效率低于CLI。尽管技术圈争议不断,大厂仍持续投入,MCP通过规范更新优化认证与连接机制。当前阶段,MCP的平静期反映技术成熟与泡沫消退并存:个人开发者倾向CLI的简洁性,而企业级应用等待协议完善。最终,AI编程的真实需求仍将回

文章图片
MinerU JS/TS SDK 深度指南:JavaScript/TypeScript 开发者的 PDF/文档解析利器

MinerU JS/TS SDK (`mineru-open-sdk`) 是专为 JavaScript 和 TypeScript 开发者打造的一站式文档解析利器。通过简单的代码集成,即可将 PDF、图片及 Office 文档精准转换为结构化 Markdown,其公式识别率高达 98%。SDK 深度适配 Node.js 环境,提供 Flash(免登录极速解析)与 Precision(全功能精准解析)

文章图片
#javascript#typescript
MinerU + DeepSeek V4:竖排繁体 PDF转简体横排阅读方案

竖排繁体PDF高效转换方案 传统PDF工具难以处理竖排繁体文本,导致阅读和提取困难。MinerU通过视觉理解技术,在布局分析阶段同步预测文本旋转角度和阅读顺序,准确还原竖排结构,输出结构化Markdown。再结合DeepSeek V4 Flash进行繁简转换与横排重排,实现本地化高效处理。 核心优势: MinerU原生支持竖排识别,避免传统OCR的顺序错乱 两阶段处理:先提取结构,再语言转换,确保

文章图片
#java#前端
把公司知识库装进 Claude:MinerU MCP + 私有文档的智能问答实战

通过 MinerU MCP,Claude Desktop、Cursor 等 AI 客户端可以直接读取 PDF、Word、PPT 等原始文档并实时解析回答,无需提前搭建 RAG 知识库。本文从产品手册问答、合同合规审查、研发文档查阅三个实战场景出发,详细拆解 MinerU MCP 的配置步骤、Flash 与 Token 模式差异、隐私策略以及团队落地建议。

文章图片
#人工智能#零知识证明
    共 32 条
  • 1
  • 2
  • 3
  • 4
  • 请选择