放学-别走个人主页

@lhyandlwl

放学-别走

2022-09-16 17:33:37 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

基于spark的大数据分析预测地震受灾情况的系统设计

在本篇博客中，我们将介绍如何使用Apache Spark框架进行地震受灾情况的预测。我们将结合数据分析、特征工程、模型训练和评估等步骤，最终建立一个预测模型来预测地震造成的破坏程度，同时使用可视化大屏的方式展示数据的分布。我们使用了合并后的地震数据作为我们的数据集。

#spark #数据分析 #大数据 +1

基于Hive的招聘网站的大数据分析系统

基于Hive的招聘网站的大数据分析系统，预处理包括数据清洗、去重、缺失值处理、数据格式转换等环节，以确保数据的质量和一致性。在这一阶段，还可以利用自然语言处理技术对文本数据进行分词、词性标注等操作，为后续的分析提供更多维度的信息。通过对招聘数据的分析，我们可以发现人才市场的热点行业、热门职位、薪资水平等信息，为企业招聘决策提供参考。在可视化界面上，我们可以展示招聘数据的各种统计图表、热点地图、词云

#hive #hadoop #数据仓库 +1

基于Hive的天气情况大数据分析系统（通过hive进行大数据分析将分析的数据通过sqoop导入到mysql，通过Django基于mysql的数据做可视化）

基于Hive的天气情况大数据分析系统,通过hive进行大数据分析将分析的数据通过sqoop导入到mysql，通过Django基于mysql的数据做可视化

#大数据 #hive #django +1

用Python一键爬取艺龙酒店各个城市数据存入mysql

在这篇文章中，我将分享如何利用Python轻松爬取易龙API中的酒店数据。易龙是一家知名的中国酒店预订平台，他们的API提供了丰富的酒店信息，包括价格、评论等。我们将使用Python以及Requests库进行HTTP请求，BeautifulSoup库用于解析HTML。在本文中，我们学习了如何使用Python从易龙API中抓取酒店数据。我们创建了一个抓取器类，从API获取数据并提取相关信息。现在，让

#python #爬虫

Python爬虫实战：从猎聘网获取职位信息并存入数据库

通过使用python从猎聘网获取职位信息并存入mysql数据库中。接下来，我们将解析得到的职位信息存入MySQL数据库中。获取到的数据通常是JSON格式的，我们需要解析JSON数据，提取出我们需要的职位信息，例如职位名称、公司名称、工作地点、薪资待遇等。这个函数用于读取JavaScript代码，并执行JavaScript来生成一个参数（ckId），用于后续的HTTP请求。这个函数用于解析HTTP响

#python #爬虫 #数据库

基于机器学习预测未来的二氧化碳排放量（随机森林和XGBoost）

本文将使用Python对OWID提供的CO2排放数据集进行分析，并尝试构建机器学习模型来预测未来的CO2排放趋势。我们将探索数据集中的CO2排放情况，分析各国/地区的排放趋势，并利用机器学习算法来预测未来的CO2排放量。

#机器学习 #随机森林 #人工智能 +1

Spark on k8s 源码解析执行流程

这就是spark on k8s模式源码分析的整个流程。

#spark #kubernetes #大数据

spark on k8s两种方式的原理与对比

Spark on k8s Operator 更适合大规模、需要自动化和集中管理的场景。它利用 Kubernetes 的原生功能，实现自动化管理和配置集中化，虽然增加了一些复杂性，但在动态和多租户环境中表现出色。Spark on k8s 适合简单、直接的 Spark 作业提交和管理场景，特别是对于那些已有 Spark 使用经验的用户。它操作简便，无需额外组件，灵活性较高。但在大规模和自动化需求较高的

#spark #kubernetes #大数据 +1

Flink CDC 最佳实践（以 MySQL 为例）

可以看到，当有数据变更时，Flink CDC Job 会输出变更的表名、记录的主键以及变更的数据。例如，在这个示例中，有一行记录的年龄字段从25变成了27。在 MySQL 中，首先需要创建需要进行 CDC 的表和 CDC 表。CDC 表是一个系统表，它存储了需要捕获的更改数据。接下来，需要编写一个 Flink CDC 应用程序，以将 MySQL 表更改推送到 Kafka 主题中。首先，需要在本地或

#mysql #flink #数据库 +1

使用Flink实现Kafka到MySQL的数据流转换：一个基于Flink的实践指南

在现代数据处理架构中，Kafka和MySQL是两种非常流行的技术。定义Kafka数据源表：我们使用一个SQL语句创建了一个Kafka表re_stock_code_price_kafka，这个表代表了我们要从Kafka读取的数据结构和连接信息。定义MySQL目标表：然后，我们定义了一个MySQL表re_stock_code_price，指定了与MySQL的连接参数和表结构。数据转换和写入：最后，我们

#flink #kafka #mysql +1

共 13 条

请选择