
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文总结了如何使用 Langchain 的 AgentExecutor 封装 tools, 构造我们自己的 Agent, 然后通过 LLM 调用,或者通过 Agent 调用,最后总结了如何让我们的 Agent 带有记忆功能,可以保存历史对话记录,这里为了简单就没有使用实际的数据库,实际生产中还是要使用数据库去保存这些信息的,感兴趣的朋友可以尝试下。

Apache Flink 自诞生以来经历了重大演变,如今,它不仅充当批处理和流数据处理的统一引擎,而且为迈向新时代铺平了道路:流式数据湖。Apache Flink 的概念是动态表,与数据库中的物化视图类似,但是,动态表不能直接查询,因此社区提出使用中间表进行查询,就演变出了 Paimon。

ClickHouse通过高度协调配合的存储引擎和计算引擎,实现了令人惊叹的单机性能,但是再强的单机性能也会遇到瓶颈,此时分布式架构就成为解决单机瓶颈的一个选择。本文介绍ClickHouse分布式架构的原理及使用方法。本文介绍了ClickHouse的分布式架构及其运作机制。ClickHouse的强项并不在分布式架构上,其自身的分布式能力也只是聊胜于无。应当将ClickHouse应用到其擅长的领域,不

在数字时代,数据已成为公司的命脉。但是,仅仅拥有数据是不够的,数据真正的价值在于如何有效地管理、存储和处理。管理数据的组件就像复杂机器中的齿轮,每个都有自己的职责,但又同步工作实现共同的目标。本文将从一些最实用的存储解决方案开始说起,包括数据集市、可实操的数据存储方案和数据中心。以及有效管理和利用数据所涉及的广泛流程,还会讨论主数据管理数据虚拟化数据目录和数据市场等概念。

HBase是一种开源的、分布式的非关系型数据库,它构建在Apache Hadoop之上。HBase被设计用于存储和处理大规模的结构化数据。本文就是对 HBase 的架构设计的总结。

向量数据库是当今大模型知识库检索落地实践的核心组件,向量查询的数据与 query 的相似度,直接影响到 prompt 的好坏,本文将对市面上已有的向量数据库进行简单介绍,然后会对其使用到的索引方法进行说明,包括倒排索引,KNN,Approximate KNN, Product Quantization, HSNW 等,会对这些算法的设计理念和方法进行说明。

人们对流式处理的理解非常混乱。有太多关于流式处理的定义,它们混淆了实现细节、性能需求、数据模型和软件工程很多方面的东西。在关系数据库领域也面临类似的窘境,关系模型的抽象定义总是夹杂了数据库引擎的实现细节和特定局限性。流式处理还处在发展阶段,一些流行的实现方案的处理方式可能很特别,或者有特定的局限性,但这并不能说明它们的实现细节就是流式处理的固有组成部分。

Agent是目前大模型行业蓬勃发展的全新方向,行业的产品和技术设计也都在早期初级阶段,我们团队也是服务客户这条路上不断“摸着石头过河”,后续还可以在Agent方向进行更多进行探索,比如目前Agent主要是调用了“开箱即用”的工具API,但是这些工具都是基于微应用开发的,开发成本和周期还是比较高的,因此如何让大模型Agent能更准确的调度细粒度的API能力,降低工具的开发配置成本,以及如何结合思维树

本文结合 Flink 对几大数据湖选型进行了对比,最终选择使用 Flink + Paimon 技术栈。

本文使用阿里云的向量检索服务(DashVector),结合ONE-PEACE多模态模型,构建实时的“文本搜图片”的多模态检索能力。多模态数据Embedding入库。通过ONE-PEACE模型服务Embedding接口将多种模态的数据集数据转化为高维向量。多模态Query检索。基于ONE-PEACE模型提供的多模态Embedding能力,我们可以自由组合不同模态的输入,例如单文本、文本+音频、音频+
