logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

[AI]给 AI 立规矩:Spring Boot3 项目 gemini.md 最佳实践。

近期在使用 AI 帮助进行代码编写,但是遇到了一些问题,为了更好地让 AI 按照期望的方式帮助我,特写了如下的 gemini.md 文件于项目根目录。

[Paddle] ERNIE-UIE 通用信息抽取模型(含自定义细分领域模型训练)

ERNIE-UIE信息抽取模型可以进行关键信息抽取,可参照官网安装流程进行配置和使用。但是在实际的细分领域中(细分的应用场景),信息抽取的效果并不好(中文书写习惯截然不同),本文按照官网的方式,进行模型训练从而进一步提升效果,并进行记录。

文章图片
#paddle
Nginx的上传模块NginxHttpUploadProgressModule

Nginx提供了NginxHttpUploadProgressModule模块,用来处理文件上传的进度它不是nginx内置的模块,编译时需要加上一下选项–add-module=../nginx_uploadprogress_module配置内容:#开启上传进度,使用8M空间存储每个连接的进度信息upload_progress proxied 8m;#

#虚拟机
图像处理 - 自动纠偏 -JAVA

使用JAVA实现傅里叶频谱平移图,之后使用霍夫变化获得图像的倾斜角度,最后进行纠偏。

文章图片
#java#图像处理
图像处理-Java-TIFF转换JPG

使用JAVA语言实现,将给定的TIF格式的图像转换为JPG,其中TIF格式的图像有两种,一种是未经过压缩的,另一种是经过 LZW 压缩的。本文提供两个函数对其进行分别处理。

文章图片
#图像处理#java
ubuntu 下 ffmpeg安装 添加h264支持,支持转码mp4文件

apt-get remove libMP3lame-devapt-get install nasmapt-get install lameapt-get install build-essential subversion git-core checkinstall yasm texi2html libfaac-dev libMP3lame-dev libopencore-amrnb-de

#linux#ubuntu
[Paddle] ERNIE-Layout 使用测试 - 文心多语言跨模态布局增强文档智能大模型

近期遇到需要从电子文档中进行内容提取的需求,突然想到 Paddle 的 ERNIE-Layout 模型,对其进行分析和测试。采用此方法,避免了很笨的 OCR + 正则匹配 的思路。

文章图片
#paddle
[Paddle] ERNIE-Layout 使用测试 - 文心多语言跨模态布局增强文档智能大模型

近期遇到需要从电子文档中进行内容提取的需求,突然想到 Paddle 的 ERNIE-Layout 模型,对其进行分析和测试。采用此方法,避免了很笨的 OCR + 正则匹配 的思路。

文章图片
#paddle
NLP 双数组字典树(double array trie) 基于darts-java改进,增加词性存储

在 NLP 世界中,中英文环境的很大一个差别就是中文不存在英文中的空格,所以在实际的应用中往往需要提前内置大量的字典(词),用这些已经被定义好的字典(词)来进行文本的快速分词,本文介绍的双数组字典树就是其中的一种解决方案。在使用 darts-java 的过程中,发现它只存储了字典字符串,没有存储其他的比如词性的信息,期望在进行查找的过程中,不仅仅能够查找出来字典,还能够查询出来额外的数据。这样改进

文章图片
#自然语言处理#java
[Paddle] ERNIE-Layout 使用测试 - 文心多语言跨模态布局增强文档智能大模型

近期遇到需要从电子文档中进行内容提取的需求,突然想到 Paddle 的 ERNIE-Layout 模型,对其进行分析和测试。采用此方法,避免了很笨的 OCR + 正则匹配 的思路。

文章图片
#paddle
到底了