logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

2. python安装第三方库报错 - UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x9a in position 3594 illegal

python安装第三方库报错 - UnicodeDecodeError: 'gbk' codec can't decode byte 0x9a in position 3594 illegal multibyte sequence

#python#开发语言
3. 大数据存储与管理

北理工大数据技术导论学习笔记

文章图片
#大数据
8. An Efficient Framework for Clustered Federated Learning

An Efficient Framework for Clustered Federated Learning;迭代式聚类;簇间共享;

文章图片
#聚类#机器学习#算法
3. 卷积神经网络和深度神经网络的区别

卷积神经网络和深度神经网络的区别

文章图片
1. Presto基础

注:时间戳格式化 format_datetime(timestamp,‘yyyy-MM-dd HH:mm:ss’)满足条件则计数:count_if()【hive中没有,同hive中 sum(if(condition,1,0))】返回string中符合pattern的元素: regexp_extract_all、regexp_extract。注2:max(x, n)、min(x, n) 与rank相

#数据库#sql#大数据
4.2 数据可视化

北理工大数据技术导论学习笔记

#信息可视化
5. Hive的三种去重方法

distinct 不能单独用于指定某一列,必须放在 select 中所有字段的最前面,否则会报错。会先按照指定的列进行分组,然后在每个分组内进行聚合操作,这样可以减少比较的数据量。,并不是只对紧跟其后的 column1 去重。实现去重时,它们的效率会受到多个因素的影响,包括数据规模、数据分布、查询条件等。distinct 对 NULL 是不进行过滤的,即返回的结果中包含NULL值。通常用于复杂的去

#hive
6. 大数据安全与隐私保护

北理工大数据技术导论学习笔记

#大数据
2. 大数据感知与获取

北理工大数据技术导论学习笔记

文章图片
#大数据
    共 11 条
  • 1
  • 2
  • 请选择