花千树-010 个人主页

@fenglingguitar

花千树-010

2022-12-04 00:41:55 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

LangChain教程 - RAG - PDF问答

我们使用RAG（检索增强生成）技术，将检索到的文档与生成模型（如ChatOllama）结合，生成最终的答案。方法提供了一个预定义的RAG提示模板。# 定义RAG提示模板# 格式化检索到的文档# 定义RAG链| prompt在这里，我们将检索到的文档内容格式化为字符串，并将其与用户的查询一起传递到生成模型中，以生成最终的答案。通过本教程，我们展示了如何使用FastAPI和LangChain框架，结合

#AIGC #python #nlp +1

J-LangChain - RAG - PDF问答

是一个基于 Java 的链式模型开发框架，旨在帮助开发者利用现代语言模型（如 ChatGPT、Ollama 等）进行多步骤的推理和数据处理。它特别适合用于构建编排复杂的应用程序，这些应用程序涉及到多个步骤的转换、文档处理、模型推理等。本文展示了如何使用 J-LangChain 框架从 PDF 文件中提取信息并进行基于问题的回答。我们通过加载 PDF 文档、切分文档、向量化文档内容并存储到 Milv

#AIGC #java #nlp +1

Nginx 从 0 到 1 配置 HTTPS：实战指南（含 Certbot 自动签发）

为网站配置 HTTPS 是保障用户数据传输安全、提升用户信任感的重要手段。本文将手把手带你完成 Nginx HTTPS 配置，包括域名准备、证书申请、Nginx 配置及自动续期等关键步骤。

#nginx #https #运维

Manus 技术探索 - 使用 gVisor 在沙箱内运行 Ubuntu 容器并通过远程浏览器访问

本文介绍了如何利用 gVisor 沙箱技术运行带 GUI 的 Ubuntu 容器，并通过 VNC/NoVNC 实现远程浏览器访问。安装并配置 gVisor：下载 runsc，配置 Docker 使用 gVisor 作为运行时，并重启 Docker。运行 Ubuntu 容器并安装 VNC 服务：启动容器，更新软件包，安装 XFCE 桌面环境和 tightvncserver。配置 VNC 服务器：初始

#AIGC #ubuntu #运维 +2

Fine-Tuning：从零开始训练文本润色模型

在自然语言处理（NLP）任务中，文本润色（text polishing）是一项重要的应用，例如帮助用户提升写作质量、改善语法或增强表达清晰度。T5（Text-to-Text Transfer Transformer）模型以其强大的泛化能力和灵活的文本转换特性，成为 Fine-Tuning 任务的理想选择。本文将通过一个简单的示例，介绍如何对 T5 模型进行 Fine-Tuning，使其具备自动文本

#AIGC #nlp #pytorch +3

详细介绍Tess4J的使用：从PDF到图像的OCR技术实现

Tess4J是Tesseract OCR引擎的Java封装，提供了便捷的API接口，使得Java开发者能够轻松地将OCR功能集成到自己的项目中。Tesseract本身是一个开源项目，由Google支持，广泛应用于文档扫描、图像文字提取等领域。Tess4J允许开发者通过Java代码调用Tesseract引擎，处理图片、PDF等文件中的文本。Tesseract支持多语言的文本识别，包括中文、英文、法语

#java #AIGC

OmniParser：安装、测试与原理剖析

如何让 AI 智能控制电脑和手机？首先要让 AI 模仿人理解设备屏幕的内容，微软开源的 **OmniParser** 是一个专为图文信息解析任务设计的多模态模型，它支持图标检测、图标描述（Caption）、OCR 区域校验等任务，集成了 YOLOv8 和 FLORENCE/BLIP2 等主流视觉模型，协助 AI 看懂屏幕，从而进一步执行智能操作。本篇博客将从 **安装配置、简单测试、原理解构**

#AIGC #计算机视觉 #图像处理 +1

Java中的自然语言处理（NLP）工具：Stanford NLP、Apache OpenNLP、DL4J

无论是需要处理简单文本分析任务，还是要构建复杂的深度学习模型，Java中都有丰富的NLP库可以选择。适合需要全面语言处理功能的场景，是一个轻量级的开源选择，适合快速集成和定制，DL4J则适用于需要深度学习支持的复杂NLP任务。根据项目需求的不同，你可以选择最合适的工具来完成自然语言处理任务。希望这篇文章能够帮助你更好地理解这些库的特点，并帮助你在Java中实现NLP功能。如何在Java中使用深度学

#java #自然语言处理 #apache +2

Java 生态系统中处理 PDF 的库和工具

在现代开发中，PDF 文件因其兼容性和广泛使用而成为文档管理、存储和交换的标准格式。无论是生成动态报告、提取文本信息，还是编辑现有的 PDF 文档，都需要强大的 PDF 处理工具。本文将详细介绍几款在 Java 生态系统中广泛使用的 PDF 处理库和工具，它们各自具有不同的功能和优势，可以满足不同开发需求。重点介绍文本提取的功能，并附上具体的代码示例。

#java #开发语言 #AIGC

全面了解 Stanford NLP：强大自然语言处理工具的使用与案例

（斯坦福自然语言处理工具包）是斯坦福大学开发的一个开源项目，致力于为开发者提供一个全面的自然语言处理工具。这个工具包包含了多种自然语言处理（NLP）任务的实现，包括但不限于：分词、词性标注、句法分析、命名实体识别、情感分析等。Stanford NLP 的目标是提供一个高效且功能丰富的 NLP 解决方案，使研究人员、开发者和数据科学家能够更轻松地处理和分析大量文本数据。Stanford NLP 是用

#自然语言处理 #人工智能 #java +1

共 26 条

请选择