logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

机器学习_特征工程

通过以上步骤和案例,你可以系统掌握特征工程的实施方法,并在实际项目中灵活应用!

#机器学习
4-知识图谱的抽取与构建-4_1重新理解知识工程和知识获取

💡 什么是知识工程?知识工程是通过计算机技术对人类知识进行建模、管理和应用的一门交叉学科。它不仅仅是编写代码,更是通过构建知识库、实现智能问答、推荐系统等应用,让技术真正服务于人类!💡🔥 什么是知识获取?知识获取是从现有数据、文本、图像等多种来源中提取有价值的知识,构建知识表示的过程。它包括自然语言处理、数据挖掘、机器学习等多种技术!🔥🔧 知识工程与知识获取的关系知识工程依赖知识获取,而

文章图片
#知识图谱#人工智能
kafka从简到深入理解01

理解Kafka的相关概念;掌握Kafka的基本API使用;了解Kafka的背后原理。[[008-字典卡片/dict/详细解释下 Kafka 系统中的控制器角色]][[kafka-KRaft和zookeeper模式]]首先Kafka是什么。Kafka起初是由LinkedIn公司采用Scala语言开发的一个多分区、多副本且基于ZooKeeper协调的分布式消息系统,现已被捐献给Apache基金会。

文章图片
#kafka#中间件#分布式
Kafka Consumer 核心设计原理 | Apache Kafka 官方学习文档

Kafka 消费者是从 Broker 读取并处理事件的客户端应用,向目标分区的主副本 Broker发起拉取请求,通过指定日志偏移量获取对应数据块。消费组是来自同一应用的一组消费者,协同消费一个或多个 Topic 的消息;任意时刻,一个分区在一个消费组内仅被一个消费者消费。消费者偏移量是一个唯一的整数标识,标记消费者在一个分区中下次要读取的下一条消息;偏移量会被周期性持久化到内部 Topic中。La

文章图片
#kafka#分布式#中间件
Kafka 常见问题 | Apache Kafka 官方学习文档

本文基于 Confluent 官方 Kafka 常见问题解答文档(https://docs.confluent.io/kafka/faq.html#how-do-i-get-started-with-ak)整理,涵盖Kafka核心定义、工作原理、核心概念、优势及快速上手方式,是Kafka入门的核心参考内容。

文章图片
#kafka#分布式
Langchain_v1.0|核心模块-core_component_05_short_term_memory

本文介绍了Langchain_v1.0中的短期记忆(Short Term Memory)模块,该功能使AI代理能够记住单个线程或对话中的先前交互。文章详细阐述了短期记忆的概述、使用方法、生产环境配置以及自定义选项。关键点包括:短期记忆通过检查点(checkpointer)实现线程级持久化,支持内存或数据库存储;长对话场景下需采用修剪、删除或总结消息等优化策略;演示了如何通过SQLite和Postg

文章图片
Kafka 副本复制与消息提交核心设计 | Apache Kafka 官方学习文档

Kafka 以主题分区为最小复制单元,将分区的日志数据复制到集群中可配置数量的Broker节点,实现节点故障时的自动故障转移,保证消息的高可用性。分区的核心处理节点,接收生产者的写请求和消费者的读请求;维护分区的ISR集合,监控从副本的同步状态,超时则将其移出ISR;是分区的日志源节点,所有从副本均从主副本拉取日志进行同步。已提交的消息指分区的所有ISR同步副本均已将消息写入自身本地日志;只要集群

文章图片
#kafka#中间件#分布式
Apache Kafka 简介 | Apache Kafka 官方入门学习文档

Apache Kafka是一个分布式事件流处理平台,用于构建实时数据管道和流处理应用。它采用发布-订阅模型,通过生产者写入主题(Topic),消费者订阅消费。核心特性包括分区(Partition)实现并行处理、复制(Replication)保障高可用、高性能TCP协议传输等。Kafka支持多种场景,如金融交易处理、物联网数据采集、系统解耦等。主要组件包括Broker服务器集群、生产者/消费者API

文章图片
#kafka#中间件#分布式
Kafka 与文件系统 | Apache Kafka 官方学习文档

本文基于 Confluent 官方 Kafka 设计文档(https://docs.confluent.io/kafka/design/file-system-constant-time.html#related-content)整理,深度解析 Kafka 为何基于文件系统设计存储架构、如何利用操作系统内核特性优化性能,以及核心的**恒定时间 O(1)**操作设计逻辑,是理解 Kafka 高性能底

文章图片
#分布式#kafka
Kafka Producer 核心设计原理 | Apache Kafka 官方学习文档

最多一次(At most once):消息可能丢失,不会重复(acks=0,不重试);至少一次(At least once):消息不会丢失,可能重复(acks=1/-1,开启重试);精确一次(Exactly once):消息不丢失、不重复(幂等性 + 事务)。Producer 核心架构:由「序列化→分区→批次累加→异步发送」四大核心环节组成,RecordAccumulator 和 Sender 线

文章图片
#kafka#分布式#中间件
    共 32 条
  • 1
  • 2
  • 3
  • 4
  • 请选择