logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【Spark大数据分析】Spark大数据分析复习资料

算法:对数据做归一化处理,计算当前样本和所有训练样本的距离,对距离排序,选择最近的K个样本,统计样本出现的频率,出现频率最多的样本作为预测类别。Spark GraphX基于pregel计算“5万结点、250万条边”图的单源最短路径,大概用时8分钟(8核心16线程,4.0G主频 CPU)1GB文件单词计数,大概用时1分钟-2分钟(8核心16线程,4.0G主频 CPU,分区数为16,集群中无其他作业调

文章图片
#spark#大数据#分布式 +3
【人工智能】基于分类算法的学生学业预警系统应用

党的二十大报告指出:“我们要坚持教育优先发展、科技自立自强、人才引领驱动,加快建设教育强国、科技强国、人才强国,坚持为党育人、为国育才,全面提高人才自主培养质量,着力造就拔尖创新人才,聚天下英才而用之”。学生是祖国的未来,如何培养出优秀的接班人是学校管理部门常思的一个问题,即如何激发每一个学生的学习潜能,为中华民族的伟大复兴贡献一份力量。

文章图片
#python#人工智能#大数据 +2
到底了