
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
机器学习 | 降维:LDA
给定带有标签的训练样本集,设法将样本投影到一条直线上,使得同类样本的投影点尽可能近,异类样本的投影点尽可能远。

信息检索与数据挖掘 | 【实验】检索评价指标MAP、MRR、NDCG
MAP、MRR、NDCG

信息检索与数据挖掘 | 【实验】倒排索引与布尔查询
在tweets数据集上构建inverted index。Boolean Retrieval Model:分别实现and,or,not,and not四种查询对应的函数,不需要做查询优化。对于tweets与queries使用相同的预处理。

大数据分析实践 | pandas数据过滤和抽样
pandas实现过滤和抽样

数据统计:词频统计、词表生成、排序及计数、词云图生成
词频统计、词表生成、排序及计数、词云图生成

大数据安全 | 【实验】ElGamal公钥密码
编程实现ElGamal公钥密码算法。

大数据分析实践 | pandas数据过滤和抽样
pandas实现过滤和抽样

信息检索与数据挖掘 | 【实验】倒排索引与布尔查询
在tweets数据集上构建inverted index。Boolean Retrieval Model:分别实现and,or,not,and not四种查询对应的函数,不需要做查询优化。对于tweets与queries使用相同的预处理。

大数据安全 | (一)介绍
大数据安全内涵:① 保障大数据安全:指保障大数据采集过程、计算过程、数据形态、应用价值的处理技术;② 大数据用于安全:利用大数据技术提升信息系统安全效能和能力的方法,涉及如何解决信息系统安全问题。

大数据 | 实验四:并行化数据挖掘算法设计
k近邻法(k-nearest neighbor,k-NN)是一种基本的分类和回归方法,是监督学习方法里的一种常用方法。








