风逝老大个人主页

@fengshi_fengshi

风逝老大

2023-06-14 19:30:06 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

时间序列预测模型之一文讲透 ARIMA 模型

本文的目标将是进入到时间序列模型系列的终极目标，上手深度学习掌握 ARIMA 模型。本人将从ARIMA 模型基本概念、差分过程、ARIMA 模型应用三个章节来详细讲述 ARIMA 模型。希望你通过阅读此文，能够获得对 ARIMA 模型的深入理解，并能够在实际问题中正确使用这些模型。

#python #数据分析

数据分析必备：DataFrame多层级索引与数据操作技巧

在数据分析中，Pandas 的多层级索引（MultiIndex）功能允许用户创建复杂的数据结构，以便更好地组织和分析数据。多层级的 DataFrame 使得在多个维度上进行数据访问和操作变得更加灵活和高效。通过使用类似于 groupby 和 agg 的方法，用户可以轻松地对数据进行分组统计和描述性分析。掌握多层级的 DataFrame 是进行高级数据分析的重要技能，能够帮助分析师深入挖掘数据中的潜

#数据分析 #pandas #python

代码编辑与数据分析的完美结合：VSCode 携手 Jupyter Notebook

如果 VSCode 结合 Jupyter Notebook，实现强强联合，那会碰撞出怎样的火花？本文将为大家从零开始入门，介绍如何在 VSCode 中使用 Jupyter Notebook。

#数据分析 #vscode #jupyter

快快收藏！10个 Python 自动探索性数据分析神库！

在本文中，我们介绍了10个自动探索性数据分析Python软件包，这些软件包可以在几行 Python 代码中生成数据摘要并进行可视化。通过自动化的工作可以节省我们的很多时间。

#python #数据分析 #开发语言

保姆级教程！手把手教你从零开始基于 Langchain-Chatchat 搭建本地大模型知识库

LangChain-Chatchat基于 ChatGLM 等大语言模型与 Langchain 等应用框架实现，开源、可离线部署的 RAG 与 Agent 应用项目，目标期望建立一套对中文场景与开源模型支持友好、可离线运行的知识库问答解决方案。本文我们通过先简单介绍LangChain-Chatchat 的原理，让大家有个大概认知，然后通过手把手一步一步教大家搭建自己的本地大模型知识库，如下所示就是我

赶紧收藏！Github 上 star 数 Top30 的 Python 开源项目

继推出2017年机器学习开源项目Top 30榜单后，Mybridge AI又推出了一个Python开源项目Top 30榜单，包括开源Python库、工具等。该榜单基于项目质量、用户参与度以及其他几个方面进行了评估，从大约15000个开源项目中挑选了Top 30，差不多都是在2017年1-12月发布。这些项目在Github上的平均star为3707。

#github #python #开发语言

数据清洗第1篇章 - 处理缺失值和重复值

数据清洗是数据分析过程中至关重要的一步，它确保数据的准确性、一致性和完整性。这不仅有助于提高分析结果的可靠性和有效性，还能为算法建模决策提供高质量的数据基础。在进行数据分析和建模的过程中，大量的时间花在数据准备上：加载、清理、转换和重新排列，这样的工作占用了工程师80%以上的时间。所以掌握常用的数据清洗方法，将帮助我们能更高效、更高质量完成数据清洗工作。我们将从易到难来讲述数据清洗系列三篇章，本文

#python #数据挖掘 #数据分析

数据清洗第2篇章 - 数据转换处理

本文，我们详细介绍了在数据清洗中我们可以如何进行数据转换，包括数据映射、数据替换、数据离散化、数据标准化、数据归一化，希望对阅读本文的读者有一定的学习提升和借鉴启发，不足之处也欢迎留言指出。

#python #数据挖掘 #数据分析

如何正确拆分数据集？常见方法最全汇总

将数据集划分为训练集（Training）和测试集（Testing）是机器学习和统计建模中的重要步骤：训练集（Training）：一般来说Train 训练集会进一步再分为 Train 训练集与 Validation 验证集两部分，以评价不同参数组合的效果，以确定最终的模型测试集（Testing）：Test 测试集自始至终没有参与到模型的训练过程；它的目的只有一个：在确定一个最终模型后，评价其泛化能力

#数据分析 #数据挖掘

保姆级教程！手把手教你从零开始基于 Langchain-Chatchat 搭建本地大模型知识库

共 57 条

请选择