logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

图解混合专家(MoE)模型

在探索最新的大语言模型(LLM)时,“MoE”这一术语频繁出现在各种标题之中。DeepSeek-V3便是一个实力强劲的混合专家(MoE)模型,其总参数量高达6710亿,且在处理每个标记(token)时,能够智能地激活约370亿的参数,实现高效计算。同样引人注目的还有Qwen2.5-Max,这一大规模MoE模型通过精心设计的监督微调(SFT)流程以及基于人类反馈的强化学习(RLHF)方法进行了后训练

文章图片
#机器学习#深度学习#面试 +1
小白学大模型:从零实现 LLM语言模型

在当今人工智能领域,大型语言模型(LLM)的开发已经成为一个热门话题。这些模型通过学习大量的文本数据,能够生成自然语言文本,完成各种复杂的任务,如写作、翻译、问答等。

文章图片
#语言模型#人工智能#自然语言处理 +2
小白学大模型:多模态 Qwen2.5-VL

Qwen-VL 是阿里云研发的大规模视觉语言模型(Large Vision Language Model, LVLM)。Qwen-VL 可以以图像、文本、检测框作为输入,并以文本和检测框作为输出。Qwen-VL 系列模型性能强大,具备多语言对话、多图交错对话等能力,并支持中文开放域定位和细粒度图像识别与理解。

文章图片
#算法#面试#职场和发展 +1
Label Studio:一个优秀的开源大模型数据标注平台

在LLM(大型语言模型)时代,数据标注质量直接决定了模型的智能上限。作为开源数据标注领域的标杆工具,Label Studio 凭借其多模态支持能力与高度可定制化的特性,正成为大模型训练中数据工程的基石。从文本三元组关系抽提到视频对象追踪,从低资源语言的语音标注到医学影像的像素级分割,Label Studio 通过统一的交互界面打破了传统标注工具的场景局限。

文章图片
#算法#人工智能
小米秋招算法二面:GSPO和GRPO的区别?

一个长度为 500 的序列,其未经归一化的 importance ratio 几乎必然会比一个长度为 50 的序列的 ratio 数量级不同,这意味着,长序列和短序列的 importance ratio 根本不具有可比性。大家熟知的是 GRPO 结果监督中对奖励的硬估计(数学题对就是 1,错就是 0),但 GRPO 保持了对过程监督的兼容,逐 token 的奖励并没有被抛弃,毕竟在当时过程监督就是

文章图片
#算法#面试#职场和发展 +1
【面试常考】手撕大模型Attention:MLA、MHA、MQA与GQA

是时候准备面试和实习了不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。。

文章图片
#面试#职场和发展#机器学习 +2
只需几十行代码就可绘制酷炫的数据大屏,这个可视化框架真的绝了

今天我来为大家安利另外一个用于绘制可视化图表的Python框架,名叫Dash,建立在Flask、Plotly.js以及React.js的基础之上。为了帮助前端知识匮乏的数据分析人员,Dash以纯Python编程的方式快速制作出交互特性强的数据可视化大屏,在经过多年的迭代发展,如今不仅仅可以用来开发在线数据可视化作品,即便是轻量级的数据仪表盘、BI应用甚至是博客或者是常规的网站都随处可见Dash框架

文章图片
#python#开发语言#数据可视化
Python数据可视化的3大步骤,你知道吗?

Python实现可视化的三个步骤:确定问题,选择图形转换数据,应用函数参数设置,一目了然matplotlibPython中最基本的作图库就是matplotlib,是一个最基础的Python可视化库,一般都是从matplotlib上手Python数据可视化,然后开始做纵向与横向拓展。Seaborn是一个基于matplotlib的高级可视化效果库,针对的点主要是数据挖掘和机器学习中的变量特征选取,se

文章图片
#python#开发语言#机器学习 +2
其实特简单,手把手教你用 Python 绘制精美交互式可视化图表

作为一名数据工作者,我特别喜欢用Python创建美观且易懂的可视化图表,而且技术难度小,不会花费大量时间。交互式可视化也是如此,因此我花了很长时间寻找Python中好用的库。能创建交互式可视化图表的库有很多,但当使用Pandas时,很容易遇到各种各样的问题。今天,我就来手把手教你如何直接使用Pandas创建出交互式可视化效果。01 安装库为了轻松创建交互式可视化,我们需要安装Cuff

#python#开发语言#后端 +2
    共 107 条
  • 1
  • 2
  • 3
  • 11
  • 请选择