
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
PP -ChatOCRv2_doc模型训练教程

本教程属于训练其他语言的训练教程,中文英文已经拥有他自己的模型,但是其他语言没有,我实习的内容是大模型性能提升,负责的是OCR部分,需要训练没有发布的语言模型。此训练教程希望对大家有帮助

PaddleOCR-VL 是一款为文档解析任务量身打造的、性能顶尖 (SOTA) 且轻量高效的模型。它的核心是 PaddleOCR-VL-0.9B——一个紧凑而强大的视觉语言模型 (VLM)。该模型创新地集成了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,从而能够精准地识别各类文档元素。这款模型不仅能高效支持 109 种语言,还擅长识别文本、表格、公式、图表等

PaddleOCR-VL 是一款为文档解析任务量身打造的、性能顶尖 (SOTA) 且轻量高效的模型。它的核心是 PaddleOCR-VL-0.9B——一个紧凑而强大的视觉语言模型 (VLM)。该模型创新地集成了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,从而能够精准地识别各类文档元素。这款模型不仅能高效支持 109 种语言,还擅长识别文本、表格、公式、图表等
由于框架在不断迭代,最新版的指导希望能帮助新手掌握训练自己的数据集与知识蒸馏过程

本教程属于训练其他语言的训练教程,中文英文已经拥有他自己的模型,但是其他语言没有,我实习的内容是大模型性能提升,负责的是OCR部分,需要训练没有发布的语言模型。此训练教程希望对大家有帮助

由于框架在不断迭代,最新版的指导希望能帮助新手掌握训练自己的数据集与知识蒸馏过程

PP-Structure是PaddleOCR团队研发的智能文档分析系统,旨在帮助开发者更好地完成版式分析、表格识别等文档理解相关的任务。

由于框架在不断迭代,最新版的指导希望能帮助新手掌握训练自己的数据集与知识蒸馏过程








