logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

大数据入门(五)YARN简介以及工作流程详解

Apache YARN(Yet Another Resource Negotiator,另一种资源协调者)是Hadoop的集群资源管理系统。YARN的核心思想是将资源管理和作业调度/监控的功能拆分为单独的守护进程——其中ResourceManager用来管理集群资源,NodeManager用来启动和监控容器。一、YARN相关概念解析Container(容器):是集群资源(包含内存、CPU、磁盘、网

#big data#yarn#hadoop
大数据入门(一)Hadoop伪分布式安装

1、前言1.1 大数据的定义大数据(Big Data)是一种规模大到在获取、存储、管理、分析方面大大超出传统数据库软件工具能力范围的数据集合 ,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征(4V特征)。IBM公司提出大数据具有5V特点:Volume(大量化)、Velocity(快速化)、Variety(多样化)、Value(价值低)、Veracity(真实性)。1.2 H

#大数据#hadoop
小爱音箱接入大模型DeepSeek及更改音色为海绵宝宝(MiGPT应用)

小爱音箱接入大模型DeepSeek及更换默认TTS为海绵宝宝

文章图片
小爱音箱接入大模型DeepSeek及更改音色为海绵宝宝(MiGPT应用)

小爱音箱接入大模型DeepSeek及更换默认TTS为海绵宝宝

文章图片
小爱音箱接入大模型DeepSeek及更改音色为海绵宝宝(MiGPT应用)

小爱音箱接入大模型DeepSeek及更换默认TTS为海绵宝宝

文章图片
Antlr4入门(二)基本概念解析

在上一章中(Antlr4入门(一)IDEA中Antlr的安装与使用),我们安装了Antlr,并编写运行了第一个程序“Hello world”。而在本章中,我们将学习语言类应用程序相关的重要过程、术语和数据结构。一. 术语语言(language)是由一系列有意义的语句组成,语句(sentence)由词组组成,词组(phrase)是由更小的子词组(subphrase)和词汇符号(vocabulary

数据仓库之拉链表的设计以及实现

一、简介增量表: 有日期分区,存放增量数据,即新增量和变化量。全量表: 无日期分区(每天覆盖更新),存放截止至当前,数据的最新的状态,所以无法记录数据的历史变化快照表: 有日期分区,每天的数据都是全量的(无论有无变化),缺点是每个分区存储了许多重复的数据,浪费存储空间拉链表: 拉链表是用来维护历史状态,以及最新状态数据的一种表,拉链表根据拉链粒度的不同,实际上相当于快照,只不过做了优化,去除了一部

#大数据#nosql
文本相似度计算——HanLP分词+余弦相似度算法

通过余弦相似度算法来计算文本相似性。

#算法
    共 25 条
  • 1
  • 2
  • 3
  • 请选择