logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

RAG从入门到精通(六)——嵌入技术介绍

核心逻辑:“把复杂信息翻译成机器能懂的‘通用语言’”人类通过视觉、听觉、触觉等感官接收信息,最终在大脑中转化为 “神经编码信息”(一种统一的神经信号);而 AI 嵌入技术的本质是将文本、图像、音频等不同类型的信息,转化为统一的 “向量表示”(如 [0.2, 0.5, …, -0.8] 这样的数值数组),让机器能像人类大脑处理神经信号一样,对这些信息进行 “比较、检索、理解”。嵌入技术的核心是 语义

文章图片
#人工智能
解锁非结构化数据价值:unstructured 库常用处理方法全解析

from unstructured . chunking import chunk_elements # 按最大字符数分块 chunks = chunk_elements(elements , chunk_size = 500 , # 每个块最多500字符 chunk_overlap = 50 # 块之间重叠50字符)库以简洁的 API 解决了非结构化数据处理的痛点,让开发者无需深陷格式解析的细节

#rxjava#android
RAG从入门到精通(四)——结构化数据读取与导入

对于 JSON 文件,它会直接读取 JSON 的原始字符串(包括 {}、“”、逗号等语法符号),不会将其转换为 Python 字典或列表。使用 LangChain 的 WebBaseLoader 加载并解析网页内容,核心功能是从指定网页(维基百科《黑神话:悟空》词条)中提取信息,并通过配置只保留网页的主体内容,过滤掉广告、导航栏等无关元素。是“懂 Markdown 语法”的加载器,让 Markdo

文章图片
#人工智能
RAG从入门到精通(三)——非结构化数据读取与导入

在 LangChain 中, 是处理文本数据的核心数据结构,用于封装原始文本内容及相关元数据,是连接文档加载、分割、存储、检索等环节的基础载体。 的设计目的是标准化文本数据的表示形式,让不同来源(如网页、PDF、本地文件等)、不同格式的文本都能以统一的结构在 LangChain 流程中流转(例如分块、嵌入、检索等)。 是 LangChain 中文本数据的标准化容器,通过存储核心文本,通过携带额外信

文章图片
#java#开发语言
RAG从入门到精通(一)——什么是RAG?

本文详细介绍了Cursor编程工具的安装配置与使用方法。主要内容包括:1)将Cursor安装到指定目录的操作步骤;2)常用键盘快捷键汇总;3)功能详解,涵盖从VS Code迁移、自动完成、AI聊天、代码生成与编辑、代码库索引、代码重构、隐私模式等15项核心功能。文章提供了具体操作方法和实用示例,帮助用户快速掌握Cursor的各项功能,提升编程效率。特别介绍了AI相关功能的配置使用,包括模型选择、自

#软件工程
RAG从入门到精通(一)——什么是RAG?

本文详细介绍了Cursor编程工具的安装配置与使用方法。主要内容包括:1)将Cursor安装到指定目录的操作步骤;2)常用键盘快捷键汇总;3)功能详解,涵盖从VS Code迁移、自动完成、AI聊天、代码生成与编辑、代码库索引、代码重构、隐私模式等15项核心功能。文章提供了具体操作方法和实用示例,帮助用户快速掌握Cursor的各项功能,提升编程效率。特别介绍了AI相关功能的配置使用,包括模型选择、自

#软件工程
Cursor新手必看:快速配置Python环境指南

Python作为当今最热门的编程语言之一,在数据分析、人工智能、Web开发等诸多领域都有着广泛应用。而Cursor则是一款功能强大的编程工具,支持多种语言开发,其代码补全、语法高亮等功能,能显著提升开发效率。对于新手而言,在Cursor中快速配置好Python环境,是开启编程之旅的重要一步。本文就将详细为大家介绍这一过程。##1.Python与Cursor的关系Python是一种编程语言,要运行.

文章图片
#python#开发语言
Cursor新手必看:快速配置Python环境指南

Python作为当今最热门的编程语言之一,在数据分析、人工智能、Web开发等诸多领域都有着广泛应用。而Cursor则是一款功能强大的编程工具,支持多种语言开发,其代码补全、语法高亮等功能,能显著提升开发效率。对于新手而言,在Cursor中快速配置好Python环境,是开启编程之旅的重要一步。本文就将详细为大家介绍这一过程。##1.Python与Cursor的关系Python是一种编程语言,要运行.

文章图片
#python#开发语言
langchain从入门到精通(十二)——不同记忆组件介绍

缓冲记忆组件是 LangChain 中最简单的记忆组件,绝大部分都不对数据结构和提取算法做任何处理,就是简单的原进原出,也是使用频率最高的记忆组件,在 LangChain 中封装了几种内置的缓冲记忆组件,涵盖:① ConversationBufferMemory:缓冲记忆,最简单,最数据结构和提取算法不做任何处理,将所有对话信息全部存储作为记忆。② ConversationBufferWindow

文章图片
#java#前端
深度学习之超分辨率算法——SRCNN

网络为基础卷积层tensorflow 1.14scipy 1.2.1numpy 1.16大概意思就是针对数据,我们先把图片按缩小因子照整数倍进行缩减为小图片,再针对小图片进行插值算法,获得还原后的低分辨率的图片作为标签。main.py 配置文件from model import SRCNNfrom utils import input_setupimport numpy as npimport t

文章图片
#tensorflow#深度学习#python
    共 211 条
  • 1
  • 2
  • 3
  • 22
  • 请选择