
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
PCA主成分分析:最广泛无监督算法 + 基础的降维算法。通过线性变换将原始数据变换为一组各维度线性无关的表示,用于提取数据的主要特征分量 → 高维数据的降维PCA主成分分析:二维数据降维 / 多维数据降维 /主成分筛选二维数据降维# 加载主成分分析模块PCAfrom sklearn.decomposition import PCA# 数据创建rng = np.random.RandomState(

数据预处理之数据标准化

截至20250621,南方地区(特别是广东、广西、湖南等地)遭遇的极端暴雨和洪水灾害,斑点鱼将使用Python进行数据分析和可视化,展示洪水影响区域、雨势强度以及经济损失等情况。

千问"动嘴不动手":过去6天,用户说了41亿次"千问帮我",AI完成下单超1.2亿笔。这不仅仅是数据,更是用户习惯的分水岭——从PC时代的"主动搜索"、移动时代的"猜你喜欢",到AI时代的"帮我买",交互方式正在被重塑。斑点鱼将用python可视化展示从PC时代到AI时代用户交互方式的演变趋势,展示"千问帮我"带来的变革。整理了下千问从2025年底到2026年2月的关键发展节点:图7:千问近期大事

注:流入数据包含铁路、公路、民航等综合客运量。

中国代表团在2025年成都世界运动会取得历史性突破,以36金17银11铜位居奖牌榜首位,并创造18项世界纪录。本文通过Python可视化技术(pandas、matplotlib、pyecharts)分析赛事数据,重点展示中国队的优异表现及传统项目国际化进程。可视化内容包括:中国奖牌分布柱状图、前五名国家奖牌对比、世界纪录国家分布饼图,以及龙舟、武术等传统项目的全球参与度地图。特别关注武术纳入202

连续属性变换成分类属性,即连续数据离散化。在数值的取值范围内设定若干个离散划分点,将取值范围划分为一些离散化的区间,最后用不同的符号或整数值代表每个子区间中的数据值。连续数据离散化:等宽法 / 等频法等宽法 :cut方法→ 将数据均匀划分成n等份,每份的间距相等举例:有一组人员年龄数据,希望将这些数据划分为“18到25”,“26到35”,“36到60”,“60以上”几个面元。ages=[20,22

数据处理之缺失值处理

截至20250621,南方地区(特别是广东、广西、湖南等地)遭遇的极端暴雨和洪水灾害,斑点鱼将使用Python进行数据分析和可视化,展示洪水影响区域、雨势强度以及经济损失等情况。








