
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Python之数据处理案例1 准备数据2 要求(1)将数据表添加两列:每位同学的各科成绩总分(score)和每位同学的整体情况(类别),类别按照[df.score.min()-1,400,450,df.score.max()+1]分为“一般” “较好”“优秀”三种情况。(2)由于“军训 ”这门课的成绩与其他科目成绩差异较大,并且给分较为随意,为了避免给同学评定奖学金带来不公平,请将每...
大数据常见英文词汇(二)(续)以下单词是本人在学习大数据过程中遇到的生疏单词词汇。单词均在百度翻译中得到的释义,可能有失偏颇,望读者指正!原文译文ACK确认、命令正确应答Advanced Message Queuing Protocol高级消息队列协议Agility敏捷性AutoCommit自动提交Avro数据序列化系统Azkaban...
大数据常见英文词汇(待更新)words(单词)resilient有弹性的parallelize并行化procedure 过程process 进程、处理program 程序schedule日程安排scheduler调度程序schema架构segment段operation算子convergence汇聚visualize可视化plugin...
大数据中遇到的问题简述(待续)1、数据量大怎么分析?分析后怎么做传输?怎么做到实时?数据量大可在hadoop平台分析。分析的结果数据可用sqoop迁移数据工具导出。常用实时处理框架有sparkStreaming、storm、flink等。2、数据来源?python爬虫爬取网页。单机多线程、分布式多线程。定期导入到离线系统。3、如何分析数据?数据量小,一个复杂的sql即可搞定,web服务...
大数据中遇到的问题简述(待续)1、数据量大怎么分析?分析后怎么做传输?怎么做到实时?数据量大可在hadoop平台分析。分析的结果数据可用sqoop迁移数据工具导出。常用实时处理框架有sparkStreaming、storm、flink等。2、数据来源?python爬虫爬取网页。单机多线程、分布式多线程。定期导入到离线系统。3、如何分析数据?数据量小,一个复杂的sql即可搞定,web服务...
大数据常见英文词汇(待更新)words(单词)resilient有弹性的parallelize并行化procedure 过程process 进程、处理program 程序schedule日程安排scheduler调度程序schema架构segment段operation算子convergence汇聚visualize可视化plugin...
Java常用应用20230725更新1 常用方法List常用方法List<Map<String, String>>根据某个key排序List<BusinessProjectVO> records = Optional.ofNullable(businessProjectPage).orElse(new Page<>()).getRecords().s

Tableau简介及Tableau安装一、什么是Tableau?Tableau是一款数据可视化工具,致力于帮助人们查看并理解自己的数据。不同于传统BI软件,Tableau是一款“轻”BI工具;可以使用Tableau的拖放界面可视化任何数据,探索不同的视图,甚至可以轻松的将多个数据库组合在一起。它不需要任何复杂的脚本。二、有哪些产品?Tableau Desktop:桌面分析软件,连...
Oozie之Web Console Is Disabled问题解决方法1、启动Oozie,登录Oozie Web Console1.1 Oozie Web UI入口1.2 登录后出现如下图提示2、进入XShell连接虚拟机安装库2.1 进入虚拟机中下载一个库(也可手动下载)wget http://public-repo-1.hortonworks.com/HDP-UTILS-GPL...