logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

kaggle m5时间序列预测比赛代码梳理

定义函数用来读取price数据、calendar数据以及最关键的包含销量的train数据,读取数据时候直接指定好数据类型(尤其是category类型),三个for循环,分别将三个表中的category类型编码为从0开始的数值。导入数据的create_train_data函数已经完成label_encoding,把category类型转换成从0编码的数值。对于未来的28天,每次预测一天的值,记录到t

#人工智能#机器学习
kaggle 帕金森multi-class预测 baseline代码梳理

读取sample_submission文件,再逐个读取test文件,跟train文件用相同方式做处理,保证有同样的特征用于做预测。用五折交叉验证得到的五个模型,分别对测试集进行预测,结果拼接在一起再做平均,得到每个test文件的预测值dataframe。此篇代码可以跑通,但是缺少特征工程以及模型调参,因此结果不算理想,可以作为baseline代码,在此基础上进行迭代,补充以下的特征工程和提交思路,

#python#开发语言
kaggle 帕金森multi-class预测 baseline代码梳理

读取sample_submission文件,再逐个读取test文件,跟train文件用相同方式做处理,保证有同样的特征用于做预测。用五折交叉验证得到的五个模型,分别对测试集进行预测,结果拼接在一起再做平均,得到每个test文件的预测值dataframe。此篇代码可以跑通,但是缺少特征工程以及模型调参,因此结果不算理想,可以作为baseline代码,在此基础上进行迭代,补充以下的特征工程和提交思路,

#python#开发语言
kaggle enefit能源大赛时序预测之特征工程及神经网络实战

注(1):此函数既可以作用于train(train = create_features(df_train,df_client,df_weather_f)),又可以改变参数作用于test(df_test = create_features(test,client_test,forecast_weather_test,False, previous_revealed_targets=previous_

#能源#神经网络#人工智能
到底了