logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

python,sql

可提供的服务

数据分析

机器学习中过拟合和欠拟合问题处理方法总结

实际操作中,可能受制于业务场景、数据质量等多方面限制,具体采用何种方式防止过拟合、欠拟合问题,可以根据模型评估的结果来进一步分析。

文章图片
#机器学习#人工智能#深度学习
《MySQL数据库应用从入门到精通(第二版)》学习笔记

《MySQL数据库应用从入门到精通(第二版)》学习笔记颜色解释:绿色标注的字体,即为sql语句的语法格式MySQL数据库基本操作创建数据库:CREATE DATABASE database_name;查看数据库:SHOW DATABASES;选择数据库:USE database_name;删除数据库:DROP DATABASE database_name;My...

Windows环境本地配置pyspark环境详细教程

如何在windows环境本地配置pyspark环境,本文将过程进行了详细梳理和记录。

文章图片
#windows#python
12-pyspark的RDD算子注意事项总结

pyspark入门学习笔记第三篇:RDD算子注意事项总结

文章图片
#大数据
【商分篇】01 我开始了解商业数据分析了

简述什么是商业分析,怎么定义和描述一个完整的数据指标。

文章图片
055 《Python极简讲义:一本书入门数据分析与机器学习》读后感

可能这类工具书自己看的有点多了,里边的内容对自己都差不太多了,想再进一步从这类书籍获取特别突破性的知识点已经不太符合自己的预期了。不过这本书感觉作为一本入门书籍,确实是一个不错的选择,语言简单朴实,尤其是其提到了的 最少必要知识(MAKE) 理念,在现在信息轰炸的时代,确实十分必要可行。如何合理规划出最少必要知识,并进而快速掌握,从而触类旁通,进一步扩展知识圈,是一个非常不错的想法。反思,一方面自

2026年2月读书笔记|AI大模型助你轻松搞定数据分析

《AI大模型助你轻松搞定数据分析》摘要 本书系统介绍了AI大模型在数据分析领域的应用方法与实践技巧。内容涵盖Prompt编写技巧、大模型构建方式(提示工程/RAG/精调/预训练)、数据分析思维培养等核心知识。通过费曼学习法、商业模式分析、统计方法等实用案例,帮助读者掌握AI时代的数据分析能力。

文章图片
#语言模型
数据预处理常用方法总结

目录一、数据清理1 处理缺失值2 噪声数据二、数据集成1 实体识别2 冗余和相关分析3 数值冲突的检测与处理三、数据变换1 数据规范化2 数据离散化3 概念分层数据预处理包括多种方法,诸如数据清理、数据集成、数据变换等。一、数据清理数据清理主要是处理缺失数据、噪声数据等。1 处理缺失值处理缺失值常用方法:删除数据:根据缺失情况,按行删除或者按列删除度量填补缺失值:可以根据数据属性,采用均值、中位数

python 读取word文档报错:There is no item named ‘word/NULL‘ in the archive的处理办法

方法一:python-docx模块使用python-docx模块,通过其中的Document函数可以读取word文档,然后可以借助document对象的相关属性、方法来获取文档中想要的信息或者编辑文档。‘add_heading’,‘add_page_break’,‘add_paragraph’,‘add_picture’,‘add_section’,‘add_table’,‘core_proper

python 将 json数据转换为geojson格式

目录一、问题需求二、python实现三、几个重要参数备份一、问题需求现在手头有一部分北京坐标需要转换,处理完后用 to_json进行了json化处理,但是最后的数据需要放在aicgis里边进行展示,从而确认参数是否需要继续校正,一直是手头进行替换操作,比较麻烦,因此脚本化处理,转换为geojson格式。二、python实现json转换为geojson格式数据,从实际的操作过程发现,其实主要是对字符

    共 31 条
  • 1
  • 2
  • 3
  • 4
  • 请选择