logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

如何使用Fauna实现分布式文档-关系型数据库

在现代应用开发中,数据存储需要兼顾灵活性、事务性和可扩展性。传统的关系型数据库提供了强大的ACID(原子性、一致性、隔离性、持久性)特性,但在面对文档型数据和需要高度可扩展的场景下显得乏力。Fauna结合了文档型和关系型数据库的优点,提供了一个分布式、ACID兼容的解决方案。

文章图片
#分布式#数据库#python
使用 Argilla 进行数据标注与模型反馈

Argilla 是一个开源的数据管理平台,专为大语言模型(LLM)而设计。通过 Argilla,用户可以通过人机结合的方式快速进行数据管理,从而构建出更为稳健的语言模型。Argilla 提供了数据标注到模型监控全过程的支持,是 MLOps 循环中的重要工具。

#python
如何从大语言模型(LLM)流式获取响应

在与大语言模型进行交互时,流式响应是一个非常有用的功能。它允许你在生成完整响应之前逐步获取数据,这在某些实时应用场景中非常重要。所有的LLM都实现了Runnable接口,这个接口提供了标准的可运行方法的默认实现,例如invokebatchastream等。在这些方法中,stream和astream(异步)是用于流式处理的重点。

文章图片
#语言模型#microsoft#人工智能 +1
使用Telegram Chat Loader将聊天记录转换为LangChain消息

Telegram Chat Loader是一个工具类,专门用于将导出的Telegram聊天记录映射为LangChain中的聊天消息。它允许开发者轻松地将导出的聊天数据转换为可以直接用于AI应用开发的格式。这对从事对话AI开发的人员尤其有帮助,因为可以利用实际聊天记录对模型进行微调或测试。

文章图片
#人工智能#python
在Intel GPU上使用IPEX-LLM进行本地BGE嵌入的实战指南

IPEX-LLM是一个PyTorch库,通过针对Intel CPU和GPU的优化技术,加速大语言模型的推理过程。借助这种优化,我们可以在本地PC或Intel独立显卡(如Arc, Flex和Max系列)上实现非常低的延迟。在特定硬件上,尤其是在Windows系统的Intel Arc A系列GPU上运行效果最为显著。

#python
使用LLMLingua进行文档压缩的实践

LLMLingua是一种使用紧凑、训练良好的语言模型(例如,GPT2-small, LLaMA-7B)来识别并移除提示中的非必要token的技术。这种方法使得在大型语言模型(LLMs)上进行推理更加高效,能够实现高达20倍的压缩,同时性能损失最小。本文将介绍如何使用LLMLingua进行文档压缩。

文章图片
#python#开发语言
使用 Argilla 进行数据标注与模型反馈

Argilla 是一个开源的数据管理平台,专为大语言模型(LLM)而设计。通过 Argilla,用户可以通过人机结合的方式快速进行数据管理,从而构建出更为稳健的语言模型。Argilla 提供了数据标注到模型监控全过程的支持,是 MLOps 循环中的重要工具。

#python
如何处理AI工具调用中的错误

在使用语言模型(如ChatGPT)与工具交互时,调用工具通常比纯粹的提示更可靠,但这并不意味着没有风险。通过保持模式简单、减少同时传递的工具数量、并拥有良好的名称和描述,可以帮助减轻风险,但不能完全避免错误。

#python
使用VikingDB管理和检索大型向量数据

VikingDB是一种专门用于存储、索引和管理由深度神经网络和其他机器学习模型生成的大规模嵌入向量的数据库。在处理自然语言处理、图像识别等高维数据时,VikingDB能够高效地进行相似性搜索和向量管理。

文章图片
#easyui#前端#javascript +1
使用 ChatGPTLoader 加载 ChatGPT 数据导出的会话记录

ChatGPT 是由 OpenAI 开发的人工智能聊天机器人,它能够与用户进行自然语言对话。很多开发者在使用 ChatGPT 的过程中会需要导出和分析对话记录,以便进行进一步的数据处理和模型训练。本文将介绍如何使用来加载从 ChatGPT 数据导出文件中提取的会话记录。

文章图片
#人工智能#python
    共 12 条
  • 1
  • 2
  • 请选择