爱吃雪糕的小布丁个人主页

@qq_47188967

爱吃雪糕的小布丁

2022-10-24 15:35:24 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

python提取图片型pdf中的文字（提取pdf扫描件文字）

文字型pdf提取，python的库一大堆，但是图片型pdf和pdf扫描件提取，还是有些难度的，我们需要用到OCR（光学字符识别）功能。需要注意的是，Tesseract OCR对于一些复杂或低质量的图像可能识别效果不佳。

#python #开发语言

基于 LangChain1.1 从零搭建 AI 文档审核系统

本文详细介绍了如何基于 LangChain1.1 从零搭建一个 AI 文档审核系统，包括智能文档审核 Agent 的技术架构、MinerU 解析 PDF、DeepSeek 大模型审核、Pydantic 结构化输出、自定义审核规则、大文档分块处理，以及最后通过 HITL（Human-in-the-Loop）实现人机交互审核。简单来说，就是让 AI 先自动发现文档中的问题，再让人工在关键操作前进行确认

#人工智能

基于 LangChain1.1 从零搭建 AI 文档审核系统

#人工智能

Agentic-GraphRAG 应用开发实战

本文详细介绍了如何从零搭建一个垂直领域 Agentic-GraphRAG 智能问答系统，包括 RAG 痛点分析、GraphRAG 技术方案、LangExtract 信息抽取、MinerU PDF 解析、ChromaDB 向量存储、知识图谱构建，以及最后使用 LangChain Agent 实现可溯源问答。简单来说，就是让大模型不仅能“查资料”，还能根据问题自己选择向量检索、图谱检索或者混合检索，并

#前端 #html

LangChain v1.0 文档审核类 Agent 开发实战

本文介绍了如何使用LangChain v1.0开发文档审核Agent系统，主要功能包括票据识别审核和合同文档解析审核。系统通过多模态大模型Qwen3-VL-Plus实现票据图像识别，结合LangChain、Pydantic等技术实现结构化数据提取和规则校验。文章详细说明了环境配置、API密钥设置、票据识别Agent的实现方法，包括发票模型定义、多模态模型初始化和图像数据处理。该系统将传统人工审核工

#前端 #服务器

Pycharm中Pyinstaller打包Pyside6时，找不到res图标资源文件的解决方法ModuleNotFoundError: No module named ‘res_rc‘

报错提示：File “G:\系统开发\python\管理控制系统\pyside6-mcs\src\MainServer.py”, line 14, inFile “G:\系统开发\python\管理控制系统\pyside6-mcs\src\view\Server.py”, line 28, inFile “G:\系统开发\python\管理控制系统\pyside6-mcs\ui\server\Ma

#pycharm #ide #python

几款主流好用的markdown编辑器介绍

Typora 是一款极受欢迎的Markdown编辑器，它提供了所见即所得（WYSIWYG）的编辑体验。Typora将Markdown源代码与预览合并在同一个界面中，这意味着您在编写时即可看到最终的排版效果。Markdown Pad 是专为Windows用户设计的另一款流行的Markdown编辑器，它支持完整的Markdown功能以及额外的自定义选项，如自定义主题和高级导出功能。StackEdit是

#编辑器

spring整合mybatis的配置源

我的数据源用的是c3p0，用maven导包如下：<dependency><groupId>org.springframework</groupId><artifactId>spring-webmvc</artifactId><version>5.3.9</version></dependency>

#spring #maven #java

springboot整合redis存入一个对象时报错：org.springframework.data.redis.serializer.SerializationException: Cannot

org.springframework.data.redis.serializer.SerializationException: Cannot serialize; nested exception is org.springframework.core.serializer.support.SerializationFailedException: Failed to serialize ob

#redis #spring boot #java

记录大模型应用开发过程中遇到的问题

undefined 当前分组 default 下对于模型 gpt-3.5-turbo 无可用渠道 (request id: 2024100809061365160529568802677)ollama默认会开启CPU+GPU混合运行的方式来运行模型，不需要特别配置，前提是电脑上配置了显卡驱动、CUAD、cuDNN。

共 32 条

请选择