社区云

写文章

登录社区云

登录社区云，与社区用户共同成长

邀请您加入社区

欢迎加入社区

热门标签

#人工智能
#python
#java
#开发语言
#spring boot
#数据库

hadoop

0订阅用户 · 5.6w篇文章

weixin1_danpianji889 来自魔乐社区

modelers.csdn.net · 2023-09-26 11:00:00

教学质量评价数据分析系统计算机毕设源码59670

教学质量评价数据分析系统主要功能模块包括轮播图（轮播图管理）公告消息管理（公告消息）资源管理（校园资讯、资讯分类）系统用户（管理员、学生用户、教师用户）模块管理（课程信息、选课信息、学生评价、教师评价），采取面对对象的开发模式进行软件的开发和硬体的架设，能很好的满足实际使用的需求，完善了对应的软体架设以及程序编码的工作，采取MySQL作为后台数据的主要存储单元，采用Hadoop框架、python技

#hadoop #java #mysql +3

265 
cpuCode 来自魔乐社区

modelers.csdn.net · 2022-02-17 23:29:44

3. 业务数据采集平台概述

业务数据采集平台电商业务简介电商业务流程电商常识SKU和SPU平台属性和销售属性电商业务数据电商系统表结构模拟生成业务数据MySQL安装业务数据生成业务数据梳理工具业务数据采集模块数仓环境准备电商业务简介电商业务流程以用户的浏览足迹为例说明用户点开电商首页开始浏览，通过分类查询或通过全文搜索寻找自己中意的商品 , 将商品添加到购物车后，对商品进行结算，这时候购物车的管理和商品订单信息的生成都会对业

#hadoop #hive #sql +2

1527 
qq_44993286 来自魔乐社区

modelers.csdn.net · 2025-08-25 16:58:38

基于Python+大数据的王者荣耀战队的数据分析系统设计与实现(精品源码+论文+答辩PPT)

摘要：本文设计并实现了一款基于Python与MySQL的王者荣耀战队数据分析系统，涵盖大数据处理、爬虫技术（Scrapy）、数据可视化等功能。系统采用前后端分离架构（Vue+Django），支持用户登录、比赛信息管理、数据爬取与智能分析，助力电竞战队优化战术决策。开发过程包括功能设计、数据库建模、代码实现及测试，提供论文辅导、降重等一站式毕设服务。系统通过Hadoop处理海量比赛数据，结合机器学

#大数据 #python #hadoop +2

1048 

8 
美妙人生WonderfulLife 来自魔乐社区

modelers.csdn.net · 2021-08-13 10:46:39

第十五讲.元数据分析：查看解析fsimage和Edits文件

视频：【美妙人生】Hadoop课程系列之HDFS--手把手教你精通HDFS【美妙人生】Hadoop课程系列之HDFS--手把手教你精通HDFS【视频笔记】元数据-------------------------1.查看fsimage文件$>hdfs oiv -i fsimage_0000000000000000022 -o ~/fs22.xml -p XML【<?xml version

#hadoop

407 

1 
vx1_Biye_Design 来自魔乐社区

modelers.csdn.net · 2024-08-10 10:00:00

JavaHadoop毕业生就择业数据分析系统-计算机毕业设计源码87379

（1）登录：管理员在后台可以输入用户名+密码进行登录，管理员的用户名和密码是在数据库中直接设定好的。（2）后台首页：管理员在此页面可以页面的数据信息统计、攻略分析统计、点评分析统计管理统计网站的数据情况，统计图根据模块数据统计。（3）系统用户：管理员点击“系统用户”菜单可以对系统中存在的用户进行管理，包含了管理员用户和普通用户。（4）招聘信息管理：管理员对招聘信息管理列表信息进行管控。（5）招聘数

#mysql #hadoop #redis +4

839 

21 
Thinking double Ha 来自魔乐社区

modelers.csdn.net · 2023-03-27 18:03:48

数据采集——hadoop安装时出现问题（此时不应有 \hadoop-3.1.3\bin\。）

如果出现与系统变量中不一样的路径，多半是有问题了，我的系统路径如下↓。【关于配置环境，现阶段大学学习直接修改系统变量就OK，用户变量是修改的当前用户的】首先，配置hadoop-3.1.3\etc\hadoop目录下的三个文件时，注意修改hdfs-site.xml中的的文件路径，改到自己的安装路径下。首先试了各种路径、环境变量不能有空格的一系列方法（加引号和改成PROGRM~1都试过了），还有一些极

#hadoop #大数据 #分布式

1167 
Vxin_CXSJ881 来自魔乐社区

modelers.csdn.net · 2023-12-10 08:30:00

基于hadoop的邮政数据分析系统毕业设计-附源码46670

管理员：（1）登录：管理员在后台可以通过账号和密码进行登录，管理员的账号和密码是在数据库中直接设定的，如果忘记密码可以点击“忘记密码”进行密码找回；（2）个人信息：管理员点击“个人信息”按钮，可以对个人的头像、昵称、手机号码等信息进行更新。（3）修改密码：管理员点击“修改密码”按钮，可以对登录密码进行更改，首先输入原密码，然后再输入新密码和确认密码，当原密码正确，输入两次新密码一致，则修改成功，否

#hadoop #spring boot #django +2

1055 

17 
淮奕来自魔乐社区

modelers.csdn.net · 2023-12-29 19:29:33

关于sqoop连接mysql失败报错的问题

manager.CatalogQueryManager: Failed to list databases java.sql.SQLException: Access denied for user 'hive'@'localhost' (using password: YES)我遇到的问题是linux的普通用户无法登录mysql，需要使用sudo命令才能使用mysql服务。若非该问题请另寻他法。

#sqoop #mysql #hadoop

901 

11 
小企鹅推雪球! 来自魔乐社区

modelers.csdn.net · 2021-09-14 23:17:20

数据采集工具Flume高级特性

如果flush到HDFS的时候，数据flush了一半之后出问题了，这意味着已经有一半的数据已经发送到HDFS上面了，现在出了问题，同样需要调用doRollback方法来进行回滚，回滚并没有“一半”之说，它只会把整个takeList中的数据返回给channel，然后继续进行数据的读写。如 Sink取数据慢，而 Source 放数据速度快，容易造成 Channel 中数据的积压，如果 putList

#java #hadoop #服务器 +2

650 

1 
weixin_61498557 来自魔乐社区

modelers.csdn.net · 2025-06-03 14:21:32

基于Hadoop的海鲜交易市场数据分析系统的设计与实现毕业设计-附源码06791

（一）普通用户管理模块：注册登录：提供普通用户注册新账户并进行登录的功能，以便能够访问系统的各项功能和个人信息。首页：展示海鲜交易市场数据分析系统的主要信息和功能入口，包括海鲜资讯、海鲜商城等内容，让用户快速了解市场动态和购物选项。交流论坛：为普通用户提供交流讨论的平台，让用户可以在论坛中进行海鲜交易相关的信息交流和经验分享。海鲜资讯：提供与海鲜行业相关的资讯和新闻内容，包括市场价格、养殖技术、消

#hadoop #大数据 #vue.js +4

1148 

19 
QQ79120063 来自魔乐社区

modelers.csdn.net · 2025-07-21 18:33:10

大数据毕业设计基于Hadoop的电子消费品大数据分析可视化系统

本文介绍了一个基于Hadoop的电子消费品大数据分析可视化系统。系统采用SpringBoot+Vue框架，结合Hadoop分布式处理技术，实现对电子消费市场数据的高效管理分析。主要功能包括产品统计、价格分析、销量排名等可视化展示，帮助企业管理库存、优化运营。系统分为用户和管理员两大模块：用户端提供商品浏览、公告查看等功能；管理端支持用户管理、商品维护等操作。通过分布式计算和可视化技术，系统能够处理

#大数据 #hadoop

401 

5 
q_3375686806 来自魔乐社区

modelers.csdn.net · 2024-12-11 22:25:22

基于python电影数据分析系统可视化 Flask框架豆瓣电影 requests爬虫技术 hadoop大数据技术大数据毕业设计✅

基于python电影数据分析系统可视化 Flask框架豆瓣电影 requests爬虫技术 hadoop大数据技术大数据毕业设计✅

#python #大数据 #flask +3

868 

30 
Java计算机毕设来自魔乐社区

modelers.csdn.net · 2024-10-12 20:27:03

基于Hadoop的租房数据分析系统

Django-Admin来自django.contrib也就是Django的标准库，默认被配置好，只需要激活启用即可，它的优势在于可以快速对数据库的各个表进行增删改查，一行代码即可管理一张数据库表，相比于手动后台1个模型一般需要4个urls，4个视图函数和4个模板，可以说Django完成了一个程序编写的大部分重复工作，并且对于图书管理这种以管理工作为重系统来说，极度契合。（3）模板（Templat

#hadoop #大数据 #分布式 +3

1003 

21 
浅谈_ 来自魔乐社区

modelers.csdn.net · 2021-06-24 00:47:09

数据采集工具Sqoop

Sqoop是一种用于在Hadoop和结构化数据存储(如关系数据库)之间高效传输批量数据的工具。Sqoop官网提供了Sqoop1和Sqoop2，Sqoop1只是一个普通的应用程序，通过给定参数就可以运行该程序。Sqoop2拥有服务端的应用程序，简单的功能变得复杂化，但是更加统一化、规范化。

#sqoop #hadoop #hive

1438 

1 
Zsigner 来自魔乐社区

modelers.csdn.net · 2019-10-12 15:31:16

[面试题]海量数据处理-从10亿个数中找频率最高的1000个数

方法一：分治思想通常比较好的方案是分治+Trie树/hash+小顶堆（就是上面提到的最小堆），即先将数据集按照Hash方法分解成多个小数据集，然后使用Trie树或者Hash统计每个小数据集中的query词频，之后用小顶堆求出每个数据集中出现频率最高的前K个数，最后在所有top K中求出最终的top K。方法二：hadoop的map,reducetop K问题很适合采用MapReduce...

#hadoop #面试

1493 
ku_code_ku 来自魔乐社区

modelers.csdn.net · 2022-11-26 12:13:24

ubantu+hadoop+spark+scale分布式数据分析框架搭建

ubantu+hadoop+spark+scale分布式数据分析框架搭建

#hadoop #分布式 #spark

5962 

2 
杨林伟来自魔乐社区

modelers.csdn.net · 2022-03-03 23:53:53

Flink教程（01）- Flink知识图谱

文章目录01 引言02 Flink 知识结构2.1 Flink介绍2.2 环境准备2.3 Flink编程模型2.4 DataStream API2.5 Flink状态管理和容错2.6 DataSet API2.7 Table API & SQL2.8 Flink组件栈2.9 Flink部署与应用2.10 Flink监控与性能优化03 Flink 知识图谱04 文末01 引言最近因为工作需要

#hadoop #大数据

3913 

1 
itszkt计算机项目源代码来自魔乐社区

modelers.csdn.net · 2024-10-13 09:15:00

springboot毕业设计选题基于Hadoop短视频流量数据分析与可视化[文档+开题+PPT

改革开放以来，中国社会经济体系复苏，人们生活水平稳步提升，中国社会已全面步入小康社会。同时也在逐渐转型，具有生活的现代化和劳动的社会化等特点。这不仅基于人们过快的工作节奏与生活方式，也是源于人们对于生活品质越来越严苛的要求。如何从工作压力与生活压力中得到解放，是现代人追求的永恒话题[1]。单从工作压力来讲，短视频流量数据分析与可视化管理在很大程度上可以解决一部分问题，逐渐进入人们的视野。短视频流量

#spring boot #hadoop

1105 

20 
2401_85506100 来自魔乐社区

modelers.csdn.net · 2024-07-05 13:16:30

计算机毕业设计之基于hadoop的租房数据分析系统的设计与实现

对于大数据环境下对信息管理系统所带来的影响，将从传统管理信息系统与大数据环境下的管理信息系统进行对比分析，从硬件优化、软件开发，这几个方面来论述爬虫实现网站数据可视化的优势所在，分析租房数据分析系统在大数据时代发展的变化趋势。并且以租房数据分析系统信息为例，分析在网站数据可视化的客观需求分析，针对其中的问题对网站数据可视化做出一些无论是加强相关政策的立法工作还是建立及时的信息反馈等等的合理化建议，

#hadoop #大数据

345 

3 
IT毕设梦工厂来自魔乐社区

modelers.csdn.net · 2025-09-18 23:19:16

大数据毕业设计选题推荐-基于大数据的农作物产量数据分析与可视化系统-Hadoop-Spark-数据可视化-BigData

本文介绍了一个基于Hadoop+Spark的农作物产量数据分析与可视化系统，采用Python/Java开发，后端基于Django/Spring Boot，前端使用Vue+ElementUI+Echarts构建。系统整合大数据技术，实现农业数据的多维度分析（地理环境、生产措施、作物种类、气候条件等），通过HDFS存储、Spark SQL计算和MySQL管理数据，最终以可视化图表辅助决策。项目展示了大

#大数据 #数据分析 #spark +1

1404 

22 
cumudi0723 来自魔乐社区

modelers.csdn.net · 2020-07-15 15:05:32

系统结构图数据结构_数据结构图简介

系统结构图数据结构What you are going to learn?你要学什么？In this article, we learn about the introduction to Graphs in Data Structure and Algorithm.在本文中，我们将了解图在数据结构和算法中的介绍。What are the components in Grap...

#数据结构 #算法 #python +2

752 
haochengxu2022 来自魔乐社区

modelers.csdn.net · 2024-06-24 00:00:00

计算机毕业设计hadoop+hive美食推荐系统知识图谱美团餐厅推荐系统美团推荐系统美食价格预测美团爬虫美食数据分析美食可视化大屏

计算机毕业设计hadoop+hive美食推荐系统知识图谱美团餐厅推荐系统美团推荐系统美食价格预测美团爬虫美食数据分析美食可视化大屏

#hive #hadoop #spark +3

650 

9 
Dongle74 来自魔乐社区

modelers.csdn.net · 2021-01-08 11:28:10

Hadoop+Hive+Mysql数据分析与入库

环境准备JDK 1.8Hadoop环境集群模式(伪分布式亦可），3.3.0hive环境 3.1.2mysql环境 5.7sqoop工具1.4.7_hadoop以上工具安装步骤省略，hadoop集群安装参考配置hive及初始化配置元数据到mysql编辑 $HIVE_HOME/conf/hive-site.xml文件<?xml version="1.0" encoding="UTF-8" st

#hadoop #sqoop #hive

1003 
weixin_39458365 来自魔乐社区

modelers.csdn.net · 2023-10-05 12:31:27

电商数仓（用户行为数据采集）

bin/bash case $1 in "start"){ for i in hadoop102 hadoop103 hadoop104 do echo ---------- zookeeper $i 启动 ------------ ssh $i "/opt/module/zookeeper-3.5.7/bin/zkServer.sh start" done };元数据层面：每个小文件都有一份元数

#hadoop

744 
QQ2279239102 来自魔乐社区

modelers.csdn.net · 2024-06-10 07:49:07

209springboot基于Hadoop短视频流量数据分析可视化系统（源码+文档+PPT+运行视频+讲解视频）

项目技术：springboot + Maven + Vue 等等组成，B/S模式 + Maven管理等等。环境需要1.运行环境：最好是java jdk 1.8，我们在这个平台上运行的。其他版本理论上也可以。2.IDE环境：IDEA，Eclipse,Myeclipse都可以。推荐IDEA;3.tomcat环境：Tomcat 7.x,8.x,9.x版本均可4.硬件环境：windows 7/8/10 1

#hadoop #java #maven

521 

5 
大数据研习社来自魔乐社区

modelers.csdn.net · 2020-03-06 11:40:07

DolphinScheduler工作流调度引擎致力于解决数据处理流程中错综复杂的依赖关系

速点链接加入高手战队：http://www.dajiangtai.com/course/112.doDS是什么Apache DolphinScheduler是一个分布式去中心化，易扩展的可视化DAG工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系，使调度系统在数据处理流程中开箱即用。DolphinScheduler曾用名为“EasyScheduler”，由易观开发，美...

#hadoop

5288 

1 
Bohemian—Rhapsody 来自魔乐社区

modelers.csdn.net · 2023-04-23 23:52:26

使用spark组件做数据处理(加工映射-keytab认证异常)

spark加工映射提示spark认证异常：AccessControlException: Client cannot authenticate via:[TOKEN, KERBEROS]虽然服务器执行命令kinit -kt xxx 是认证成功的。

#spark #大数据 #hadoop

502 
Albert_XZR 来自魔乐社区

modelers.csdn.net · 2023-06-30 10:55:54

尚硅谷物流数仓数据采集通道平台到数仓建模部分问题解决方案

尚硅谷物流数仓数据采集通道平台到数仓建模部分内容不一致问题解决方案

#linux #hadoop #数据仓库 +2

752 

5 
q_3375686806 来自魔乐社区

modelers.csdn.net · 2024-10-25 22:29:09

大数据毕业设计：招聘数据分析可视化系统爬虫 BOSS直聘（建议收藏）hadoop技术 spark✅

大数据毕业设计：招聘数据分析可视化系统爬虫 BOSS直聘（建议收藏）hadoop技术 spark✅

#大数据 #数据分析 #爬虫 +2

863 

19 
weixin_43556059 来自魔乐社区

modelers.csdn.net · 2025-07-01 05:15:12

基于hadoop的餐饮平台数据分析

餐饮外卖平台向广大用户提供网上订餐服务，其市场占有量在近年不断增加。当用户在Z平台订餐完成后，平台会引导用户对于品尝过的菜品进行评价打分，最高为5分，最低为1分。通过用户的评分数据，可以分析外卖平台的受欢迎度、客户的体验度，现总结为用户评分数据（见附件评分.txt）和菜品数据集(见附件菜品.txt)。要求如下：技术栈：hadoop，mapduce，hive（1）代码（2）运行结果（3）清洗后数据食

#hadoop #数据分析 #大数据

296 

5 
m0_74226293 来自魔乐社区

modelers.csdn.net · 2024-10-18 02:18:50

（计算机毕设选题推荐）基于Hadoop的汽车销量数据分析与研究

摘要本文聚焦于基于Hadoop平台的汽车销量数据分析与研究。随着大数据技术的快速发展，汽车行业积累了海量销售数据，如何高效处理并利用这些数据以洞察市场趋势、优化销售策略成为企业关注的焦点。本文首先介绍了Hadoop分布式计算框架及其在大数据处理中的优势，随后详细阐述了数据收集、预处理、存储、分析及可视化等关键步骤在汽车销量数据分析中的应用。通过构建分析模型，本文深入探讨了影响汽车销量的多种因素，包

#hadoop #数据分析 #eclipse

1474 

23 
小薄冲冲冲来自魔乐社区

modelers.csdn.net · 2020-12-24 15:07:01

Hadoop运行任务sqoop将hdfs文件导入mysql时一直卡在: INFO mapreduce.Job: Running job

查看nodemanager运行日志在hadoop安装路径/logs文件夹下发现node节点日志卡在Skipping monitoring container container_1583042746449_0003_01_000005 since CPU usage is not yet available.后来在resourcemanager的主机上在etc/hadoop/yarn-site.

#hadoop #hdfs #sqoop +1

2372 
卿洲同学的好哥哥来自魔乐社区

modelers.csdn.net · 2023-07-26 23:54:14

## MapReduce入门案例——某东手机和电脑销售数据分析

利用Python爬虫从平台爬取部分时段销售数据，按照一定格式存储在文本文档（input目录下的computerfinal.txt和Pone）中。通过MapReduce进行数据分析输出处理结果到output目录下part-r-00000文件（其余文件为crc校验信息等），之后将结果利用前端页面展示。

#mapreduce #hadoop #java +1

429 
youyouxiong 来自魔乐社区

modelers.csdn.net · 2024-06-30 10:28:07

使用hadoop进行数据分析

使用Hadoop进行数据分析是一个复杂的过程，需要对Hadoop的各个组件和生态系统工具有深入的了解。如果你有具体的数据分析任务或者需要帮助编写MapReduce程序，可以提供更多的信息，我可以提供更具体的帮助。Hadoop是一个开源框架，它允许分布式处理大数据集群上的大量数据。Hadoop由两个主要部分组成：HDFS（Hadoop分布式文件系统）和MapReduce。

#hadoop #数据分析 #大数据

849 

5 
G3259093417 来自魔乐社区

modelers.csdn.net · 2024-12-08 10:54:21

基于Hadoop的租房数据分析系统

开发语言：Java框架：springbootJDK版本：JDK1.8服务器：tomcat7数据库：mysql 5.7（一定要5.7版本）数据库工具：Navicat11开发软件：eclipse/myeclipse/ideaMaven包：Maven3.3.9浏览器：谷歌浏览器后台路径地址：localhost:8080/项目名称/admin/dist/index.html。

#hadoop #大数据 #分布式 +4

882 

19 
数据社来自魔乐社区

modelers.csdn.net · 2020-09-22 07:00:00

用户行为分析之数据采集

用户行为简介用户行为分析主要关心的指标可以概括如下：哪个用户在什么时候做了什么操作在哪里做了什么操作，为什么要做这些操作，通过什么方式，用了多长时间等问题，总结出来就是WHO，WHEN，...

#java #大数据 #编程语言 +2

1.3w 

2 
Tell黑夜吻白天来自魔乐社区

modelers.csdn.net · 2024-09-18 09:57:18

基于Hadoop的手机销售数据分析系统（爬虫 + 可视化大屏）

💛博主介绍：作为资深全栈程序员🎉，我专注于为大学生提供毕业设计支持。凭借丰富的开发经验和深入的技术解析，我在此分享实用的编程资源、源代码，并提供定制化技术咨询💡。致力于协助学生在毕业设计中取得成功我的目标是让技术学习变得更高效、更有趣。欢迎关注👋，一起在计算机科学的海洋中乘风破浪⛵️，共创辉煌🏆。👇🏻精选专栏，推荐订阅👇🏻计算机毕业设计最强指南✅计算机最全毕设项目推荐✅✨文末附上

#hadoop #爬虫 #大数据 +2

1474 

24 
IT学长编程来自魔乐社区

modelers.csdn.net · 2024-10-09 15:24:44

计算机毕业设计基于Hadoop的租房数据分析系统的设计与实现 Python毕业设计 Python毕业设计选题数据分析【附源码+安装调试】

基于Hadoop的租房数据分析系统是一个集数据存储、处理、分析和展示于一体的平台。系统利用Hadoop技术处理海量租房数据，提供市场趋势分析、信息透明化服务，并支持用户决策。后台管理模块提高了管理效率，推动了租房市场的透明度和健康发展。

#大数据 #hadoop #python +1

3180 

15 
在森林中麋了鹿来自魔乐社区

modelers.csdn.net · 2022-10-20 22:43:48

离线数仓 (四) --------- 用户行为数据采集模块

离线数仓用户行为数据采集模块

#hadoop #linux #hdfs

1994 
Future_yzx 来自魔乐社区

modelers.csdn.net · 2025-02-02 12:46:05

深入理解SpringMVC：数据处理、文件上传与异常处理等常见技术应用及解决方案

SpringMVC 是一种非常流行的 Web 应用框架，广泛用于构建基于 Java 的 Web 应用程序。在这篇博客中，我们将详细讲解 SpringMVC 中的几种常见技术应用及解决方案，包括页面跳转、响应 JSON 数据、文件上传、异常处理等。@Override@Override@Override(SysException) ex : new SysException("系统正在维护，请联系管理

#hive #大数据 #hadoop

1081 

17 
侬本多情。来自魔乐社区

modelers.csdn.net · 2021-08-15 14:52:49

spark数据分析

spark案例1、sparkpihadoop@ddai-master:/opt/spark-2.1.0-bin-hadoop2.7$ vim SparkPihadoop@ddai-master:/opt/spark-2.1.0-bin-hadoop2.7$ run-example SparkPi 10 > SparkPi.txtobject SparkPi {def main(args: A

#spark #大数据 #hadoop +2

1266 
禅与计算机程序设计艺术来自魔乐社区

modelers.csdn.net · 2024-01-28 14:32:41

HBase与Hadoop集成：HBase与Hadoop集成与数据处理

1.背景介绍HBase与Hadoop集成：HBase与Hadoop集成与数据处理1. 背景介绍HBase是一个分布式、可扩展、高性能的列式存储系统，基于Google的Bigtable设计。HBase提供了一种高效的数据存储和查询方法，适用于大规模数据处理场景。Hadoop是一个分布式文件系统，用于存储和处理大规模数据。HBase与Hadoop的集成可以实现高效的数据存储和处理，提高数据...

#hbase #hadoop #数据库 +2

648 

6 
百木从森来自魔乐社区

modelers.csdn.net · 2021-07-21 14:43:41

【MapReduce】分析每个部门工资总额的数据处理流程并开发程序

分析每个部门总额的数据处理流程并开发程序1 分析每个部门工资总额的数据处理流程2 每个部门工资总额程序开发2.1 创建框架2.2 开发Mapper程序2.3 开发Reduce程序2.4 执行主程序手动反爬虫，禁止转载：原博地址 https://blog.csdn.net/lys_828/article/details/118964468（CSDN博主：Be_melting）知识梳理不易，请尊重劳动

#java #大数据 #hadoop +1

1474 

2 
计算机毕业编程指导师来自魔乐社区

modelers.csdn.net · 2025-08-06 22:30:42

【2026大数据毕设选题】基于Hadoop的中国常见传染病数据分析与可视化系统 Hadoop Spark Hive 毕业设计|选题推荐|爬虫|大数据|大屏|预测|深度学习|数据分析|数据挖掘

基于Hadoop的中国常见传染病数据分析与可视化系统 Hadoop Spark Hive 毕业设计|选题推荐|爬虫|大数据|大屏|预测|深度学习|数据分析|数据挖掘如何用Hadoop处理海量传染病数据？中国常见传染病数据分析与可视化系统揭秘

#大数据 #hadoop #数据挖掘 +1

810 

16 
VX_bysjlw985 来自魔乐社区

modelers.csdn.net · 2024-06-22 07:30:00

java&SSM&mysql仓储商品库存管理系统69284-计算机毕业设计项目选题推荐（附源码）

SSM仓储商品库存管理系统的主要使用者分为管理员、和用户，实现功能包括：首页、人员管理（管理员、系统用户）、模块管理（库存信息、商品分类、质检记录、良品记录、不良品记录、入库信息、入库异常、入库记录、出库信息、出库记录、出库异常、库存盘点）、个人管理（个人信息、修改密码）；用户：首页、模块管理（库存信息、商品分类、质检记录、良品记录、不良品记录、入库信息、入库异常、入库记录、出库信息、出库记录、出

#java #mysql #spring boot +4

1112 

11 
微bishe58 来自魔乐社区

modelers.csdn.net · 2024-09-04 13:57:52

计算机毕业设计之基于Hadoop的城市租房需求的数据分析系统

从数据挖掘的角度出发，了解信息管理系统的作用，对数据分析的过程以及用处进行更深一步的研究，数据的处理效率，以及具体的应用方向。近年来，科技飞速发展，在经济全球化的背景之下，大数据将进一步提高社会综合发展的效率和速度，大数据技术也会涉及到各个领域，而。系统功能结构图是系统设计阶段，系统功能结构图只是这个阶段一个基础，整个系统的架构决定了系统的整体模式，是系统的根据。做出一些无论是加强相关政策的立法工

#hadoop #大数据

438 

2 
2401_85505850 来自魔乐社区

modelers.csdn.net · 2024-06-13 12:55:23

计算机毕业设计之django基于Hadoop的网络舆情数据分析与可视化

网络舆情数据分析与可视化是一项重要的研究和实践领域，其意义在于通过深入分析和直观呈现网络舆情数据，帮助政府、企业等组织更好地了解公众需求和舆论动态，从而制定更为科学、合理的决策。数据可视化则是将分析结果以直观、易懂的方式呈现出来的关键步骤。通过选择合适的可视化工具和设计合理的可视化方案，可以将舆情数据以图表、报告、大屏等形式展示，便于用户快速理解和分析数据，发现其中的规律和趋势。通过深入分析和直观

#hadoop #数据分析 #信息可视化

419 

5 
加贝力口贝来自魔乐社区

modelers.csdn.net · 2022-01-14 08:58:27

06.离线数据分析

文章目录Hive离线分析回顾业务流程准备搭建环境1.启动Hadoop2.修改flume配置文件3.启动flume4.启动jt-logserver5.测试准备数据离线数据处理Hive管理数据数据清洗数据处理PV：访问量UV：独立访客数SV：独立会话数BR：跳出率NewIP：新增IP数NewCust：新增访客数AvgTime：平均访问时长AvgDeep：平均访问深度分析结果表通过sqoop将数据导入m

#数据分析 #hdfs #hadoop

929 

1 
apple_50595445 来自魔乐社区

modelers.csdn.net · 2021-12-16 22:55:07

数据采集框架 Flume

一、常用的数据采集工具（1）Chukwa：一个针对大型分布式系统的数据采集系统，构建在Hadoop之上，使用HDFS作为存储。（2）Flume：一个功能完备的分布式日志采集、聚合、传输系统，支持在日志系统中定制各类数据发送方，用于收集数据。（3）Scribe：facebook开发的日志收集系统，能够从各种日志源收集日志，存储到一个中央存储系统，以便于进行集中统计分析处理。（4）Kafka：一种高吞

#flume #big data #hadoop

1136 
csdnGuoYuying 来自魔乐社区

modelers.csdn.net · 2023-02-03 08:45:00

【HBase高级】6. HBase数据结构（下）——LSM树数据结构、布隆过滤器、StoreFiles（HFile）结构

相比于以前学习过的List、Set、Map这些数据结构，它更加高效、占用的空间也越少，但是它返回的结果是概率性的，是不确切的。传统关系型数据库，一般都选择使用B+树作为索引结构，而在大数据场景下，HBase、Kudu这些存储引擎选择的是LSM树。HBase中存储着非常海量数据，要判断某个ROWKEYS、或者某个列是否存在，使用布隆过滤器，可以快速获取某个数据是否存在。但如果某个key不存在，一定是

#hbase #数据结构 #数据库 +2

864 

加载更多

标签介绍

hadoop

——hadoop

热门标签

开发语言

21篇文章
java

17篇文章
c++

11篇文章
算法

11篇文章
动态规划

11篇文章
django

7篇文章
python

7篇文章
大数据

5篇文章
hadoop

5篇文章
spring boot

3篇文章

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 kefu@csdn.net

京ICP备19004658号
©1999-2023北京创新乐知网络技术有限公司
网络110报警服务
中国互联网举报中心
家长监护

回到
顶部