
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
数据处理步骤1.数据清洗1)处理缺失值 ①查看 df.info():查看数据基本信息 ②查找 df.isna():查找DataFrame对象缺失值,缺失数据用True表示,False表示不缺失 df[‘列索引’].isna():指定列查找缺失值 Series.isna():查找Series对象缺失值 ③删除 df.dropna():删除两大对象中含有缺失的数据(行) df.dropna
1.数据分析:&emsp为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。2.数据分析的作用:&emsp现状分析,原因分析,预测分析。3.数据分析六部曲:&emsp明确分析目的和思路——>数据收集——>数据处理——>数据分析——>数据展现——>报告撰写。4.数据分析师的职业要求:&emsp懂业务、懂管理、懂分析、懂工具、懂
计算机网络历史 1).50—60年代:单计算机:内部通信,数据处理 2).60—70年代,计算机互联:数据处理,通信。不同网络体系模型 3).70—80年代,计算机网络标准化:ARPANET协议 4).90年代至今,国际化互联网的诞生和发展。MILNET(军网);ARPANET(民网)OSI/RM模型 ISO国际标准化组织提出。 OSI/PM:开放系统互连参考模型物理层:只负责传输二进制比特流 为
1.数据驱动业务流程: 数据需求 数据收集 数据处理 两个分支:数据分析/机器学习 评估:数据能否对项目真正产生积极影响,取决于数据结论是否能击中业务痛点以及报告对数据的重视程度。2.用户生命周期可分为六个阶段: 潜在用户阶段 新手阶段 有效活跃阶段 活跃下降阶段 即将流失阶段 流失阶段3.数据驱动决策的10种思维方式: 1)分类思维:如RFM模型。 2)矩阵思维:波士顿矩阵。(适用于商品描述不是
数据展现工具使用matplotlib绘图流程:1)导入模块 from matplotlib import pyplot as plt2)创建画布 plt.figure(figsize=(7,7)):参数figsize可以控制长和宽3)设置x,y坐标值信息 x=df.index(索引),y=df.values(数据值)4)绘制折线图/柱状图/饼图,并调整格式 折线图:plt.plot(x,y,col
分组聚合操作1.单层分组聚合 df=df.groupby(‘列索引’)[‘列名’].mean():聚合求平均值2.多层分组聚合 df=df.groupby([‘列1’,‘列2’],……,as_index=False包含自带行索引)[‘列名’].mean() s.unstack()可以将多层聚合后的Series对象转变成DataFrame对象,将索引的最后一行转变成DataFrame对象的列索引,剩
什么是数据库技术 科学的组织和存储数据; 高效的获取和处理数据;SQL 结构化查询语言 专为数据库建立的操作命令集,数据库专用 使用时,只需要发出”做什么“的命令DB,DBS,DBMS之间的关系数据(Data): 客观事物的符号表示。图形符号、数字、字母、数据 数据是数据库存储的基本对象数据库(DB) 长期储存在计算机内,有组织、可共享的数据集合 较小的冗余度(重复)、较高的数据独立性和易扩展性(
同比、环比、数据分析
软件测试的实习认识总结