logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

三台ubuntu22.0.4虚拟机搭建Hadoop+Hive集群

在搭建 Hadoop 和 Hive 集群的过程中,笔者遇到了一些常见的坑。为了帮助其他同学减少踩坑的机会,特此总结这篇文章,希望能帮助大家顺利完成环境搭建。本文介绍了如何在 VMware 上搭建一个简单的 Hadoop 集群和 Hive 环境。关键步骤包括配置主机名、设置 SSH 免密登录、安装 Java 和 Hadoop、配置 Hive 与 MySQL,以及启动相关服务。完成这些步骤后,你将拥有

文章图片
#大数据#数据仓库#hadoop +1
一种多人在线图形编辑设计

本文探讨了在图形编辑器中实现多人协作功能的创新方案。作者分析了主流协作技术OT算法和CRDT算法的优缺点:OT算法成熟但依赖中心化架构,CRDT去中心化但资源消耗大。提出了一种融合两者优势的混合架构:以图形元素为单元进行增量传输,采用CRDT的LWW策略解决冲突,同时利用OT思想管理操作历史和撤销功能。后端使用WebSocket实现实时通信,RocketMQ进行广播,优化了数据传输效率。文章还展示

文章图片
#中间件#golang
解析倒排索引

倒排索引是一种高效的数据结构,用于快速存储和检索文档中的词项。它将多个关键词映射到包含这些词项的文档ID,特别适合文本检索和搜索引擎。相比于正排索引,倒排索引能快速响应复杂查询,利用空间更高效,并在文档和词项数量增加时保持良好的性能。广泛应用于搜索引擎、文档检索系统和自然语言处理等领域。其实现方式多样,使用位图等结构可以提高检索速度和效率。

文章图片
#golang#搜索引擎
到底了