斑马！个人主页

@yezonghui

斑马！

2022-09-29 18:12:25 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

数据集-20个免费的数据源/网站

20个免费的数据源/网站注意：大部分网站需要科学上网，才能访问。1. datasetsearchhttps://datasetsearch.research.google.com它可以让你搜索到已经根据 schema.org 标准进行正确标记的可用数据集。你可以看到所有搜索结果，每个结果包括数据集名称、最近更新时间、数据集简介等。2.Google Trendshttps://trends.goog

数据挖掘-序列模式挖掘--GSP算法

一：基本概念介绍序列模式挖掘：指挖掘相对时间或其他模式出现频率高的模式序列模式挖掘的动机：大型连锁超市的交易数据有一系列的用户事物数据库。每一条记录包括用户的ID，事物发生的时间和事物涉及的项目。如果能够在其中挖掘涉及事物间关联关系的模式，即用户几次购买行为间的联系，可以采用更有针对性的营销措施。序列：(sequence) 以SID表示，一个序列即是一个完整的信息流序列符号化表示：...

大数据--面经2--2021年阿里巴巴大数据复盘以及面经总结

一：在a表，不在b表1. 有2张表t1和t2，每张表都只有一列(列名：id)，现在想抽取仅存在于t1的id，请写出sql语句【注意】：1）注意格式,最外层的id，我们需要指定其对应的表是a还是b，我们需要明确2）不要使用无谓的临时表select a.idfrom(select id from t1)aleft outer join(selec...

Mac中磁盘没有正常推出的解决方案

问题：由于mac电脑关机或者没有实现正常推出硬盘导致的磁盘没有正常推出。问题排查：打开Mac自带的磁盘工具，其外置没有发现我们的磁盘名称。解决办法：1）打开终端，输入如下命令查看一下硬盘的信息，确定一下自己的磁盘是否可以显示：diskutil list显示在终端的最后一行显示了我硬盘的名字，因此/dev/disk2所在目录就是我的移动硬盘。2）杀死对应进程sudofsck_hfs -fy /dev

#macos

数据预处理-Excel表中如何在数据中批量添加(括号)/「尖括号」等

1.问题：Excel表中如何在数据中批量添加(括号)/<尖括号>等2.解决办法：假设数据在A列，在B1输入="<"&A1&">"，然后通过右下角往下填充就可以了。3.样例：...

python-- numpy学习总结

https://mp.weixin.qq.com/s/Lj7vqjW0iw7I5AabMTtYtA

数据挖掘-项集挖掘-apriori算法和fp-growth算法（论文核心思想）

如何寻找频繁模式呢？1.最原始的方法：各个项进行排列组合，即找出所有的候选集，然后再一一判断这些候选集是否是频繁项集。2.apriori算法：1）核心思想就是集合的超集的支持度一定小于或者集合本身的支持度。2）候选集的产生过程中的一个技巧：例如两个频繁k-项集（按字典顺序排好的）去组合产生一个（k...

数据预处理-Excel 两列合并为一列中间加空格

目录一：leetcode二：算法三：经典题目一：leetcode数组：https://blog.csdn.net/yezonghui/article/details/100932562字符串：https://blog.csdn.net/yezonghui/article/details/111990036二分查找：https://blog.csdn.net/yezonghui/article/de

大数据--数据仓库--维度退化

2.3 维度退化不可能将所有与业务相关的维度分类到一个紧凑的表集合中。类似这样的情况，将一个或者多个维度存储到事实表中是合适的选择。采用这种方法，存储事实表中的维度列被称为退化维度，退化维度的过程称为维度退化。更为规范的定义是：当一个维度没有数据仓库需要的任何数据的时候就可以退化此维度，需要把退化的相关数据迁移到事实表中，然后删除退化的维度。与其他存储在维度表中的维度一样，退化维度也可以进行事实表

#database

数据预处理-Excel 两列合并为一列中间加空格

共 20 条

请选择