logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

被百度大模型算法岗狠狠的毒打了

摘要:近期互联网大厂秋招如火如荼,某算法岗面试经历引发关注。面试内容涵盖自我介绍、项目深挖、技术八股(包括DeepSeek、注意力机制、DeepSpeed等)、微调技术细节(LoRA显存计算)、大模型推理参数(温度/topk/topp执行顺序)以及业务场景题。面试采用压力面形式,面试官未开摄像头但质疑候选人简历内容,最终候选人反馈体验较差。该案例反映出算法岗面试的高专业要求和高压特点,建议求职者扎

文章图片
#人工智能#算法
6.6K Star,比 Pandas 快很多的数据处理库

Polars是一个使用ApacheArrow列格式作为内存模型,用Rust实现的,在Rust,Python以及Node.js中均可使用的速度极快的数据帧库。它有以下几个特点懒|立即执行多线程SIMD查询优化强大的表达式API支持多种语言Rust、Python等了解更多内容可以点击这个用户指南[1]。...

文章图片
#pandas#python#开发语言
只需三五行代码即可产出完美数据分析报告,这四大 AutoEDA 工具包真的太棒了

在三年前,我们做数据竞赛或者数据建模类的项目时,前期我们会耗费较多的时间去分析数据,但现在非常多擅长数据分析的大师们已经将我们平时常看的数据方式进行了集成,开发了很多AutoEDA的工具包。可以帮助我们节省大量时间,对于刚刚学习数据分析的小伙伴可以带来非常大的帮助。本篇文章我们介绍目前最流行的四大AutoEDA工具包。D-talePandas-ProfilingSweetvizAutoViz这几个

#数据分析#python#数据挖掘
经常进行数据处理?这6个 Python 代码块值得收藏

大家好,今天和大家分享自己总结的6个常用的 Python 数据处理代码,对于经常处理数据的coder最好熟练掌握。选取有空值的行在观察数据结构时,该方法可以快速定位存在缺失值的行。df = pd.DataFrame({'A': [0, 1, 2],'B': [0, 1, None],'C': [0, None, 2]})df[df.isnull().T.any()]输出:ABC

文章图片
#python#数据分析#pandas
进阶版的Pandas数据分析神器:Polars

相信对于不少的数据分析从业者来说呢,用的比较多的是Pandas以及SQL这两种工具,Pandas不但能够对数据集进行清理与分析,并且还能够绘制各种各样的炫酷的图表,但是遇到数据集很大的时候要是还使用Pandas来处理显然有点力不从心。今天我就来介绍另外一个数据处理与分析工具,叫做Polars,它在数据处理的速度上更快,当然里面还包括两种API,一种是Eager API,另一种则是Lazy API,

文章图片
#python#数据分析#pandas +1
有了这个机器学习画图神器,论文、博客都可以事半功倍了!

推荐一个深度学习的绘图工具,对于初学者没有比可视化更有帮助的了,下面可以看下效果:绘图很灵活,可以自定义图形,根据已经提供的基本元素,按照自己的需求去调整使用。项目地址:https://github.com/dair-ai/ml-visuals这个绘图模板需要用到谷歌平台才能访问。为了方便大家,已经下载下来做成了ppt文件,分享给大家。获取方式1. 关注下方公众号(非本号):机器学习专栏2. 在

#python#深度学习
Github最受欢迎的10大深度学习时间序列项目

本文我们列举了Github上最受欢迎的十大相关的时间序列项目。

文章图片
#python
基于双向 GRU 的文本分类 Python 算法实战

去年就已经写的差不多了,现在整理好慢慢更新,本系列主要介绍了风控场景下文本分类的基本方法,对抗文本变异,包括传统的词袋模型、循环神经网络,也有常用于计算机视觉任务的卷积神经网络,以及 RNN + CNN,试验完一遍,基本能搞定大部分的文本分类以及文本变异对抗问题。先写到这里了,大家可以看到,深度学习,对于解决语言问题,还是很有优势的,就这么简简单单的一段代码,准确率有了非常大的提升,后面的文章,我

文章图片
#gru#分类#深度学习 +1
TransBigData:一款基于 Python 的超酷炫交通时空大数据工具包

TransBigData是一个为交通时空大数据处理、分析和可视化而开发的Python包。TransBigData为处理常见的交通时空大数据(如出租车GPS数据、共享单车数据和公交车GPS数据等)提供了快速而简洁的方法。TransBigData为交通时空大数据分析的各个阶段提供了多种处理方法,代码简洁、高效、灵活、易用,可以用简洁的代码实现复杂的数据任务。

文章图片
#python#大数据#开发语言
Auto-Sklearn:使用 AutoML 加速你的机器学习模型

AutoML 是机器学习中一个相对较新的领域,它主要将机器学习中所有耗时过程自动化,如数据预处理、最佳算法选择、超参数调整等,这样可节约大量时间在建立机器学习模型过程中。今天我将用一个简单的示例来全面讲解 AutoML 工具:Auto-Sklearn,相信你会爱上这个这么省心的工具。文中涉及的数据、代码文末将给出,方便实战练习。Auto-Sklearn 简介熟悉机器学习的人都知道 scikit-l

文章图片
#sklearn#机器学习#python
    共 160 条
  • 1
  • 2
  • 3
  • 16
  • 请选择