logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

PaddleOCR多语言模型训练教程--泰语 训练自己的其他语言数据集(语料,词典,字体,背景图片,文本图片生成器工具)

本教程属于训练其他语言的训练教程,中文英文已经拥有他自己的模型,但是其他语言没有,我实习的内容是大模型性能提升,负责的是OCR部分,需要训练没有发布的语言模型。此训练教程希望对大家有帮助

文章图片
#语言模型#人工智能#自然语言处理 +3
基于 PaddleOCR-VL 与 PaddleFormers 的多模态文档解析微调项目

PaddleOCR-VL 是一款为文档解析任务量身打造的、性能顶尖 (SOTA) 且轻量高效的模型。它的核心是 PaddleOCR-VL-0.9B——一个紧凑而强大的视觉语言模型 (VLM)。该模型创新地集成了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,从而能够精准地识别各类文档元素。这款模型不仅能高效支持 109 种语言,还擅长识别文本、表格、公式、图表等

文章图片
#人工智能#自然语言处理#计算机视觉 +1
基于 PaddleOCR-VL 与 PaddleFormers 的多模态文档解析微调项目

PaddleOCR-VL 是一款为文档解析任务量身打造的、性能顶尖 (SOTA) 且轻量高效的模型。它的核心是 PaddleOCR-VL-0.9B——一个紧凑而强大的视觉语言模型 (VLM)。该模型创新地集成了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,从而能够精准地识别各类文档元素。这款模型不仅能高效支持 109 种语言,还擅长识别文本、表格、公式、图表等

#人工智能#自然语言处理#计算机视觉 +1
2024年最新新手掌握PaddleOCR使用(训练自己数据集与知识蒸馏)

由于框架在不断迭代,最新版的指导希望能帮助新手掌握训练自己的数据集与知识蒸馏过程

文章图片
#paddlepaddle#计算机视觉#人工智能 +1
PaddleOCR多语言模型训练教程--泰语 训练自己的其他语言数据集(语料,词典,字体,背景图片,文本图片生成器工具)

本教程属于训练其他语言的训练教程,中文英文已经拥有他自己的模型,但是其他语言没有,我实习的内容是大模型性能提升,负责的是OCR部分,需要训练没有发布的语言模型。此训练教程希望对大家有帮助

文章图片
#语言模型#人工智能#自然语言处理 +3
2024年最新新手掌握PaddleOCR使用(训练自己数据集与知识蒸馏)

由于框架在不断迭代,最新版的指导希望能帮助新手掌握训练自己的数据集与知识蒸馏过程

文章图片
#paddlepaddle#计算机视觉#人工智能 +1
PP-Structure 快速入门

PP-Structure是PaddleOCR团队研发的智能文档分析系统,旨在帮助开发者更好地完成版式分析、表格识别等文档理解相关的任务。

文章图片
#计算机视觉#人工智能#图像处理 +1
2024年最新新手掌握PaddleOCR使用(训练自己数据集与知识蒸馏)

由于框架在不断迭代,最新版的指导希望能帮助新手掌握训练自己的数据集与知识蒸馏过程

文章图片
#paddlepaddle#计算机视觉#人工智能 +1
到底了