logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Linux上使用python代码将docx转pdf--LibreOffice安装、文件乱码、转换执行权限等问题

由于最近要使用到文件转换的功能,我把pdf转word还是挺轻松的(pdf2docx),想着word转pdf也不在话下,轻轻松松搞定,结果却大相径庭,通过一系列的尝试,最终问题解决。本来刚开始在windows下功能都写完了,但一上linux立马不行,说没这没那的,通过调研才发现,有很多工具都是windows好好的,但是Liunx确无法兼容,比如:python的docx2pdf,java的docume

#python
【LLM01】基于LangChain+LLM的本地知识库问答:什么是LangChain及langchain的整体组成架构

过去半年,随着ChatGPT的火爆,直接带火了整个LLM这个方向,然LLM毕竟更多是基于过去的经验数据预训练而来,没法获取最新的知识,以及各企业私有的知识为了获取最新的知识,ChatGPT plus版集成了bing搜索的功能,有的模型则会调用一个定位于 “链接各种AI模型、工具”的langchain的bing功能为了处理企业私有的知识,要么基于开源模型微调,要么更可以基于langchain里集成的

spark读写时序数据库 TDengine 错误总结

spark读写时序数据库 TDengine 错误总结

#tdengine
java按顺序读取docx文件中的内容(包括文字、表格、图片)

近期在工作中需要解析word,里面包括文字、表格、图片等,在网上找了很多关于解析word的,都是单独处理的,由于我需要按顺序解析内容,而且要清晰的指导每个内容的位置在哪儿,所以单独处理显然不行,最开始使用python的docx类库,这种解决起来有点小问题,后来切换到了java来处理这个,没想到POI有这么好用的类库

#自然语言处理
ObjectMapper的使用和使用过程中引发的思考

在Java开发中,ObjectMapper是Jackson库的核心类,用于将Java对象序列化为JSON字符串,或者将JSON字符串反序列化为Java对象。由于其功能强大且易于使用,ObjectMapper成为了处理JSON数据的常用工具,它可以帮助我们快速的进行各个类型和Json类型的相互转换。

#java
关于虚拟机设置静态ip和克隆后重启网关报错的问题以及配置DNS

1.首先,用 ifconfig 命令查询是否存在eth0网卡2.vi /etc/sysconfig/network-scripts/ifcfg-eth0 编辑ifcfg-eth0文件,如图:加入如下配置BOOTPROTO=staticIPADDR=192.168.183.201NETMASK=255.255.255.0GATEWAY=192.168.183.1#网关DNS...

CentOS7安装CDH6.2.0安装过程--详细版

准备建议最少4台物理机或者虚拟机(一个控制节点,3个数据节点),4核16G,硬盘500G,挂载根目录如果用于学习,可以4核8G,如果是生产部署,推荐8核32G以上系统为CentOS7.6,使用root用户登录CDH版本为6.2.0节点说明规划:cdh1 主节点cdh2 从节点cdh3从节点cdh4从节点基础配置挂载磁盘操作请参考这篇文章 : https://blog.csdn.net/Alex_8

#大数据#linux
大模型系列——解读RAG

RAG即检索增强生成,为 LLM 提供了从某些数据源检索到的信息,并基于此修正生成的答案。RAG 基本上是 Search + LLM 提示,可以通过大模型回答查询,并将搜索算法所找到的信息作为大模型的上下文。查询和检索到的上下文都会被注入到发送到 LLM 的提示语中。嵌入式搜索引擎可以通过 Faiss 来实现,向量搜索领域成为了RAG的一个助力。像pinecone 这样的向量数据库可以构建开源搜索

#人工智能
SpringBoot 项目打包后不加载 application.properties 配置文件

今天打完项目jar,Linux启动时,发现总是报错,找不到application.properties配置文件:class path resource [applicationContext.xml] cannot beopened because it does not exist推测原因是打包未扫描(没有找到)到这个配置文件,修改办法如下:添加pom文件中的打包资源即可:<resourc

#spring boot#java#jar
到底了