eahba 个人主页

@eahba

eahba

2025-02-13 20:57:20 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

探索 Bittensor：去中心化区块链上的机器学习网络

Bittensor非常适用于需要进行协作和分享模型的机器学习任务。例如，在全球范围内进行语言模型的训练，可以通过Bittensor网络来充分利用各地的数据和计算能力。此外，它也为个人开发者提供了一个低成本试验和开发新模型的机会。如果遇到问题欢迎在评论区交流。

#区块链 #去中心化 #机器学习 +1

使用LangChain加载Markdown文档

Markdown是一种轻量级标记语言，用于使用纯文本编辑器创建格式化文本。在本文中，我们将介绍如何将Markdown文档加载为对象，以便在后续处理中使用。LangChain实现了一个对象，该对象需要包支持。

#python #github

在 LangChain 中使用 LanceDB 实现向量存储

随着自然语言处理技术的飞速发展，如何高效地存储和检索向量成为了许多应用的关键问题。LanceDB 提供了一套易于使用的数据库解决方案，可以作为向量存储的一部分，与 LangChain 这样的框架无缝集成。

#oracle #数据库 #python

使用Amazon Textract自动提取文档数据并结合LangChain进行处理

Amazon Textract是一项机器学习服务，能够自动从扫描的文档中提取文本、手写内容和数据。它不仅仅是光学字符识别（OCR），还能识别和提取表格和表单中的数据。许多公司依靠人工方式或简单的OCR软件，从PDF、图像、表格和表单等扫描文档中提取数据，这些方法常常需要人工配置并在表单更改时更新。为了解决这些繁琐且昂贵的过程，Amazon Textract使用机器学习来读取和处理任何类型的文档，准

#python #人工智能

使用HyDE进行高效文档检索：原理与实战

HyDE，全称Hypothetical Document Embeddings，是一种增强检索的方法。它的核心理念在于，对输入查询生成一个假设文档，将该文档进行嵌入，然后使用该嵌入来查找与假设文档相似的实际文档。假设文档在嵌入空间中可能比查询更接近实际文档，从而提高检索效果。详细原理请参考此论文。

#python

使用Confluence进行知识管理和协作

Confluence是一个由Atlassian开发的企业级wiki协作平台，主要用于保存和组织项目相关的资料。它不仅是一个强大的知识库，还能高效处理内容管理任务，使团队协作更加便捷。

#java #前端 #服务器 +1

如何为RAG应用中的生成内容添加引用

在AI应用中，尤其是基于检索增强生成（Retrieval-Augmented Generation, RAG）的应用中，为生成的答案添加引用是一项重要任务。这不仅可以提高答案的可信度，还能让用户追溯信息来源。我们建议根据模型支持的特性，从上到下选择最合适的方法。如果模型支持工具调用，优先选择方法1或2；否则选择后续的方法。以下是每种方法的详细实现以及代码示例。

#python #windows #linux

使用Cube Semantic Layer构建数据应用程序的指南

Cube作为一种语义层，旨在帮助数据工程师和应用开发者访问现代数据存储，组织数据为一致的定义，并将其交付给每个应用程序。Cube简化了数据管理，使得创建数据应用变得高效和灵活。

#数据库 #javascript #前端 +1

使用阿里云Tair进行高效的内存数据库操作

阿里云Tair是一款云原生的内存数据库服务，完全兼容开源Redis，支持多种数据模型和企业级能力，适用于多种实时在线场景。Tair还引入了基于新型非易失性存储介质(NVM)的持久性内存优化实例，提供了更高的性能和稳定性。在这篇文章中，我们将探讨如何使用阿里云Tair进行高效的内存数据库操作，并提供一些实战代码示例。Tair通过优化内存管理、数据模型以及持久化机制，提供了高吞吐量、低延迟的数据存取服

#数据库 #阿里云 #oracle +1

使用DashScope Embedding实现文本嵌入

文本嵌入是一种将文本转换为向量表示的方法，广泛应用于自然语言处理任务如文本分类、相似度计算和信息检索。DashScope Embeddings 提供了一种高效的方式，通过API调用，轻松获取文本的嵌入向量。

#python

共 12 条

请选择