凌skr 个人主页

@m0_66579097

凌skr

2023-10-23 15:58:50 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

实践2模型训练-文档场景信息抽取（PP-ChatOCRv2_doc）

PP -ChatOCRv2_doc模型训练教程

#python #人工智能 #语言模型 +3

PaddleOCR多语言模型训练教程--泰语训练自己的其他语言数据集（语料，词典，字体，背景图片，文本图片生成器工具）

本教程属于训练其他语言的训练教程，中文英文已经拥有他自己的模型，但是其他语言没有，我实习的内容是大模型性能提升，负责的是OCR部分，需要训练没有发布的语言模型。此训练教程希望对大家有帮助

#语言模型 #人工智能 #自然语言处理 +3

基于 PaddleOCR-VL 与 PaddleFormers 的多模态文档解析微调项目

PaddleOCR-VL 是一款为文档解析任务量身打造的、性能顶尖 (SOTA) 且轻量高效的模型。它的核心是 PaddleOCR-VL-0.9B——一个紧凑而强大的视觉语言模型 (VLM)。该模型创新地集成了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型，从而能够精准地识别各类文档元素。这款模型不仅能高效支持 109 种语言，还擅长识别文本、表格、公式、图表等