logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文讲透大模型强化学习基础:PPO、DPO、GRPO

优点:稳定可控,适合复杂任务(如机器人学走路、游戏AI打Boss)。缺点:需依赖“体能评估师”(Critic网络)和大量训练数据,计算成本高。

文章图片
#机器学习#算法#面试
Excel 遇见 Python,可轻松实现数据自动化处理

大家好,这次我会介绍如何使用xlwings将Python和Excel两大数据工具进行集成,更便捷地处理日常工作。说起Excel,那绝对是数据处理领域王者般的存在,尽管已经诞生三十多年了,现在全球仍有7.5亿忠实用户,而作为网红语言的Python,也仅仅只有700万的开发人员。这就是本文要讲到的主题,Python的第三方库-xlwings,它作为Python和Excel的交互工具,让你可以轻松地通过

文章图片
#python#数据分析#数据挖掘 +1
阿里大模型2面:损失函数没答上来...

举个例子,看这张图。看这张图,向前传播时,由于 s 是多个 z 共同决定的,所以需要求出 s 对所有 z 的导数,以 s1 为例,前向传播求梯度的时候,需要求出 s1 对 z1,z2,z3…这是阿里的一份大模型算法面经,可以看到,面试官避开了 rag,agent 这些热门考点,转而对大模型训练中的损失函数进行了深挖,很好的考察到了候选人的基本功。所以我们最后求偏导的时候,需要计算 i=j 和 i≠

文章图片
#算法
一文讲透大模型强化学习基础:PPO、DPO、GRPO

优点:稳定可控,适合复杂任务(如机器人学走路、游戏AI打Boss)。缺点:需依赖“体能评估师”(Critic网络)和大量训练数据,计算成本高。

文章图片
#机器学习#算法#面试
真香啊,5个小而美的 Pandas 实战案例

大家好,之前分享过很多关于 Pandas 的文章,今天我给大家分享5个小而美的 Pandas 实战案例,喜欢的小伙伴,记得收藏、分享、点赞。内容主要分为:如何自行模拟数据多种数据处理方式数据统计与可视化用户RFM模型用户复购周期推荐文章终于盼到了,Python 数据科学速查表中文版来了上瘾了,最近又给公司撸了一个可视化大屏(附源码)梳理半月有余,精心准备了17张知识思维导图,这次要讲清统计学年终汇

#机器学习#数据挖掘#数据分析
一文讲透大模型强化学习基础:PPO、DPO、GRPO

优点:稳定可控,适合复杂任务(如机器人学走路、游戏AI打Boss)。缺点:需依赖“体能评估师”(Critic网络)和大量训练数据,计算成本高。

文章图片
#机器学习#算法#面试
一文讲透大模型强化学习基础:PPO、DPO、GRPO

优点:稳定可控,适合复杂任务(如机器人学走路、游戏AI打Boss)。缺点:需依赖“体能评估师”(Critic网络)和大量训练数据,计算成本高。

文章图片
#机器学习#算法#面试
腾讯二面真题:DeepSeek对MoE架构做了哪些改进?

最近春招和实习已开启了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。。金三银四春招季,又有两位同学斩获大模型offer!一个是40k某军实验室offer,另一个是第四范式~恭喜两位同学成功上岸!随着DeepSeek爆火,面试中也越来越高频出现,因此训练

文章图片
#架构#机器学习#算法 +1
真香啊,5个小而美的 Pandas 实战案例

大家好,之前分享过很多关于 Pandas 的文章,今天我给大家分享5个小而美的 Pandas 实战案例,喜欢的小伙伴,记得收藏、分享、点赞。内容主要分为:如何自行模拟数据多种数据处理方式数据统计与可视化用户RFM模型用户复购周期推荐文章终于盼到了,Python 数据科学速查表中文版来了上瘾了,最近又给公司撸了一个可视化大屏(附源码)梳理半月有余,精心准备了17张知识思维导图,这次要讲清统计学年终汇

#机器学习#数据挖掘#数据分析
3个最频繁考的 SQL 数据分析题(推荐收藏)

在数据类岗位招聘过程中,经常会考察求职者的SQL能力,这里整理了3个常考的SQL数据分析题,按照由简单到复杂排序,一起来测试一下你掌握了么?喜欢记得收藏、关注、点赞。更多资料、技术交流,文末获取题目1:找出每个部门工资第二高的员工现有一张公司员工信息表employee,表中包含如下4个字段。employee_id(员工ID):VARCHAR。employee_name(员工姓名):VARCHAR。

文章图片
#数据分析#sql#big data
    共 13 条
  • 1
  • 2
  • 请选择