
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
数据分析
《AI大模型助你轻松搞定数据分析》摘要 本书系统介绍了AI大模型在数据分析领域的应用方法与实践技巧。内容涵盖Prompt编写技巧、大模型构建方式(提示工程/RAG/精调/预训练)、数据分析思维培养等核心知识。通过费曼学习法、商业模式分析、统计方法等实用案例,帮助读者掌握AI时代的数据分析能力。

目录一、数据清理1 处理缺失值2 噪声数据二、数据集成1 实体识别2 冗余和相关分析3 数值冲突的检测与处理三、数据变换1 数据规范化2 数据离散化3 概念分层数据预处理包括多种方法,诸如数据清理、数据集成、数据变换等。一、数据清理数据清理主要是处理缺失数据、噪声数据等。1 处理缺失值处理缺失值常用方法:删除数据:根据缺失情况,按行删除或者按列删除度量填补缺失值:可以根据数据属性,采用均值、中位数
方法一:python-docx模块使用python-docx模块,通过其中的Document函数可以读取word文档,然后可以借助document对象的相关属性、方法来获取文档中想要的信息或者编辑文档。‘add_heading’,‘add_page_break’,‘add_paragraph’,‘add_picture’,‘add_section’,‘add_table’,‘core_proper
目录一、问题需求二、python实现三、几个重要参数备份一、问题需求现在手头有一部分北京坐标需要转换,处理完后用 to_json进行了json化处理,但是最后的数据需要放在aicgis里边进行展示,从而确认参数是否需要继续校正,一直是手头进行替换操作,比较麻烦,因此脚本化处理,转换为geojson格式。二、python实现json转换为geojson格式数据,从实际的操作过程发现,其实主要是对字符
File Browser是一个开源的文件共享软件,它可以帮助用户轻松地管理他们的文件资源,并通过Web界面进行共享。

简述什么是商业分析,怎么定义和描述一个完整的数据指标。

对于机器学习模型,评价模型的好坏是十分重要的一环,不同的任务对应的评估指标也有所差异,以更好的评价和比较模型的优劣。诸如分类(classification)、回归(regression)、排序(ranking)、聚类(clustering)、主题模型(topic modeling)等。本文则对不同场景的评估指标进行总结梳理

可能这类工具书自己看的有点多了,里边的内容对自己都差不太多了,想再进一步从这类书籍获取特别突破性的知识点已经不太符合自己的预期了。不过这本书感觉作为一本入门书籍,确实是一个不错的选择,语言简单朴实,尤其是其提到了的 最少必要知识(MAKE) 理念,在现在信息轰炸的时代,确实十分必要可行。如何合理规划出最少必要知识,并进而快速掌握,从而触类旁通,进一步扩展知识圈,是一个非常不错的想法。反思,一方面自
最近deepseek十分火爆,但使用过程中,你是不是和我一样常常碰到如下图所示的问题,并且响应还十分缓慢。基于上述描述的问题,为了体验满血版的deepseek,因此将使用满血版的deepseek的方法总结如下。解决deepseek卡顿的问题,只需要三步。记得填写邀请码:g3ic2DNa)

传统机器学习算法优缺点总结算法优点缺点K-最近邻算法实现简单,预测的精度一般也较高对预测集的每个样本都需要计算它和每个训练样本的相似度,计算量较大,尤其是训练集很大的时候,计算量会严重影响算法的性能决策树准确率较高,可解释性强,对缺失值、异常值和数据分布不敏感等对于连续型的变量需要离散化处理,容易出现过拟合现象等朴素贝叶斯分类算法计算简单,在数据量较少的情况下依然有效,也适用于多分类的问题属性的相







