
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
从 Pandas 到 Polars 二十九:在Polars中进行机器学习预处理(一)
例如,我们可以创建一个类来用scikit-learn的API包装Polars代码。然后,在转换为numpy以用于机器学习模型之前,我们可以尽可能长时间地保持在快速且内存高效的Polars和ApacheArrow组合中。让我们看看在Polars中进行一些这样的预处理是否值得。简单示例:我们有一个包含100,000行和100列的数据框,并希望对每个列进行最小-最大缩放。在最近的时间里,我将探索在Pol

从 Pandas 到 Polars 一:常用命令的比较
例如,如果在一个可以提前完成的查询后期进行过滤(从而减少处理的数据量),那么Polars查询优化器将在查询中前移过滤器。更好的是,如果对存储在云中的Parquet数据应用过滤器,Polars就会尝试在数据通过网络传输之前在云存储层中应用这些过滤器。在Pandas中,聚合的输出可以是一个Series,而在Polars中,它总是一个DataFrame。如果输出是Pandas中的一个Series,则会存

到底了







