为 Kaggle 比赛设置本地环境 (PyCharm)
为您提供一个理由和快速步骤,让您拥有本地开发环境来协助您的竞争 概述 动机 设置 PyCharm 替代方案(完全免费) 插件 调试 权衡:本地 vs 云 vs Kaggle 总结 动机 Kaggle 为我们提供了一个很棒的在线平台 / Jupyter Notebook 来交互式地测试我们的代码,同时可能利用免费的 GPU 资源。那么我们为什么要有这个“麻烦”的选项呢? 一个词的答案——“效率”。
为您提供一个理由和快速步骤,让您拥有本地开发环境来协助您的竞争
概述
-
动机
-
设置 PyCharm
-
替代方案(完全免费)
-
插件
-
调试
-
权衡:本地 vs 云 vs Kaggle
-
总结
动机
Kaggle 为我们提供了一个很棒的在线平台 / Jupyter Notebook 来交互式地测试我们的代码,同时可能利用免费的 GPU 资源。那么我们为什么要有这个“麻烦”的选项呢?
一个词的答案——“效率”。因此,在 IDE 的帮助下,您可以更快地实现您的解决方案(例如使用 Vim 模式),立即发现一些静态代码错误,调试和挖掘您的工作,函数参数提示......
Jupyter notebook 是将您的整个解决方案安排成交互式“纸”的最佳选择,而像 Pycharm 这样的 IDE 绝对是帮助您加快解决方案编码阶段的选择。
Vim 模式、错误提示、自动完成、调试!! ... IDE 的原因
设置 PyCharm
获取试用版或许可专业版
PyCharm 为我们提供 2 个版本 - 专业版 vs 社区版
您可能需要将 Pro 视为与我们的数据科学工作相关的“科学工具”仅包含在此版本中。专业版肯定是付费版。这是选项
-
一般有30~90天的试用期,所以利用这个空闲时间窗口
-
查看学校或工作的任何优惠/折扣/补偿
-
使用学生邮箱获取[Github 学生开发包](!%5Bimage.png%5D(https://education.github.com/pack)
-
从订阅页面查看特别优惠
如果,可悲的是......所有这些都不适合你的情况,猜猜你找到了一个很好的工作理由(所以努力使用它!)很难为你的数据科学工作找回价值,对吧? 😃
替代(完全免费) 但你知道吗......我们有 B 计划 - 开源 IDE Spyder
基本功能非常相似,例如调试器、数据集查看器等。
官方文档和教程组织良好,让您在 1 或 2 小时内就可以在本地运行。
插件
Kite - AI 驱动的自动完成 IDE 为我们提供的最佳功能之一是自动完成和调用函数和参数的提示。
我们经常使用的库中有太多的函数,甚至更多的参数,比如 pd、np、sklearn ......不可能全部记住它们!
风筝是在打字时弹出这些提示的最佳选择,这些提示进一步由人工智能驱动,并尝试为您提供适合上下文的结果。
IdeaVim - 快速打字 Vim 是一个非常棒的工具,可以加快你的输入性能。很多人从老家伙那里听说👴,并认为它已经过时了......
不! Vim 是一个非常经典的“快捷方式”你的打字工具,以至于在这个方向上没有太多空间来进一步改进输入 - 自从大多数计算机的终端界面以来,它已经使用了很长时间。
Material UI + Atom Icons - 现代和舒适的界面 好吧,一个漂亮的 UI 可能不会以“技术”的方式帮助您,但肯定会在浏览您的项目和无数 IDE 设置时为您提供舒适的体验。
我在不同的 IDE 中使用的 UI 和图标主题的组合,并推荐在这里尝试😃
调试
我选择使用本地环境的最重要原因是我可以逐行调试。
情况就是这样——您可以通过在 Jupyter 笔记本中添加一个单元格轻松地打印出某些中间结果,例如 DataFrame。但是你想检查你的函数中的一些步骤怎么样?比如,确保每个步骤都按照您的预期进行,尤其是当您的数据集的暗淡和形状有点混乱时。
如果您不是编程新手,您应该更喜欢 IDE 中的调试模式,而不是编写逐行打印输出代码。 ++ IDE 还为我们调试的行提供了更有条理的细节。
权衡:本地 vs 云 vs Kaggle
实际上,我们的 Kaggle 比赛有 3 个选项,本地 - 云 - Kaggle 站点。
虽然我们知道 Kaggle 站点是我们发布最终作品的地方,但使用 IDE 本地化是开发解决方案的最佳选择。为什么我们还要费心再拥有一个云?
我们在 Kaggle 上工作的一个重要问题是调整我们的模型以获得最佳性能。无论是 Kaggle 的默认内核还是我们的本地计算机都将在很大程度上受到内存和计算能力的限制,这意味着我们将花费更长的时间并尝试更少的想法——更慢的模型构建迭代......
正如 Andrew Ng 在 Structuring Machine Learning Projects 课程中所提到的
云计算服务为我们提供了在我们想要的时间范围内以我们配置的可承受的价格升级内存和计算能力的选项。
我个人使用的是 GCP 的 Cloud AI Notebook,它集成了 Kaggle,可以一键跳转
总结
因此,我们提供了一个简短的理由,为什么我们应该使用带有 IDE 的本地环境来完成 Kaggle。此外,尝试使用您喜欢的 IDE 和插件设置您的本地,同时探索一点云方式🚀
更多推荐
所有评论(0)