logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[Paddle] ERNIE-Layout 使用测试 - 文心多语言跨模态布局增强文档智能大模型

近期遇到需要从电子文档中进行内容提取的需求,突然想到 Paddle 的 ERNIE-Layout 模型,对其进行分析和测试。采用此方法,避免了很笨的 OCR + 正则匹配 的思路。

文章图片
#paddle
NLP 双数组字典树(double array trie) 基于darts-java改进,增加词性存储

在 NLP 世界中,中英文环境的很大一个差别就是中文不存在英文中的空格,所以在实际的应用中往往需要提前内置大量的字典(词),用这些已经被定义好的字典(词)来进行文本的快速分词,本文介绍的双数组字典树就是其中的一种解决方案。在使用 darts-java 的过程中,发现它只存储了字典字符串,没有存储其他的比如词性的信息,期望在进行查找的过程中,不仅仅能够查找出来字典,还能够查询出来额外的数据。这样改进

文章图片
#自然语言处理#java
[Paddle] ERNIE-Layout 使用测试 - 文心多语言跨模态布局增强文档智能大模型

近期遇到需要从电子文档中进行内容提取的需求,突然想到 Paddle 的 ERNIE-Layout 模型,对其进行分析和测试。采用此方法,避免了很笨的 OCR + 正则匹配 的思路。

文章图片
#paddle
图像处理-Java-OpenCV-水印编码/解码

使用JAVA+OpenCV实现基于离散余弦变换(DCT)的水印编码/解码功能,将水印隐藏到图像中,从而可以达到类似版权保护的要求。

文章图片
#图像处理#opencv
EasyExcel导出-自适应图像尺寸

EasyExcel导出-自适应图像尺寸》最近在使用EasyExcel进行图像数据导出的时候,需要在单元格内自适应缩放图像,防止图像被拉伸。

文章图片
到底了