
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
Docker+wsl部署MinerU 2.5.3(Windows)|获得接近demo的vlm模式PDF识别效果
MinerU是一款将PDF转化为机器可读格式的工具(如markdown、json),可以很方便地抽取为任意格式。主要功能如下:删除页眉、页脚、脚注、页码等元素,确保语义连贯输出符合人类阅读顺序的文本,适用于单栏、多栏及复杂排版保留原文档的结构,包括标题、段落、列表等提取图像、图片描述、表格、表格标题及脚注自动识别并转换文档中的公式为LaTeX格式自动识别并转换文档中的表格为HTML格式自动检测扫描

到底了







