
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
2. python安装第三方库报错 - UnicodeDecodeError: ‘gbk‘ codec can‘t decode byte 0x9a in position 3594 illegal
python安装第三方库报错 - UnicodeDecodeError: 'gbk' codec can't decode byte 0x9a in position 3594 illegal multibyte sequence
3. 大数据存储与管理
北理工大数据技术导论学习笔记

6. 数据异构 vs. 数据非独立同分布
数据异构 vs. 数据非独立同分布
8. An Efficient Framework for Clustered Federated Learning
An Efficient Framework for Clustered Federated Learning;迭代式聚类;簇间共享;

3. 卷积神经网络和深度神经网络的区别
卷积神经网络和深度神经网络的区别

1. Presto基础
注:时间戳格式化 format_datetime(timestamp,‘yyyy-MM-dd HH:mm:ss’)满足条件则计数:count_if()【hive中没有,同hive中 sum(if(condition,1,0))】返回string中符合pattern的元素: regexp_extract_all、regexp_extract。注2:max(x, n)、min(x, n) 与rank相
5. Hive的三种去重方法
distinct 不能单独用于指定某一列,必须放在 select 中所有字段的最前面,否则会报错。会先按照指定的列进行分组,然后在每个分组内进行聚合操作,这样可以减少比较的数据量。,并不是只对紧跟其后的 column1 去重。实现去重时,它们的效率会受到多个因素的影响,包括数据规模、数据分布、查询条件等。distinct 对 NULL 是不进行过滤的,即返回的结果中包含NULL值。通常用于复杂的去
6. 大数据安全与隐私保护
北理工大数据技术导论学习笔记
2. 大数据感知与获取
北理工大数据技术导论学习笔记








