logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文讲透 Transformer 注意力机制:缩放、批量、多头、掩码、交叉、跨头

Transformer 属于算法必考题。今天这篇文章讲透Transformer :缩放、批量、多头、掩码、交叉、跨头,对刚想了解算法或面试的朋友非常友好。文章安排如下:基础缩放Attention批量Attention多头Attention掩码Attention交叉Attention跨头维度向量化最近春招和实习已开启了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少

文章图片
#transformer#深度学习#人工智能 +2
【内推】vivo影像算法研究部招聘图像/视频算法研究员/预研型实习生

最近春招和实习已开启了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。。主要负责研发和优化vivo手机的影像算法及芯片化,聚焦于对照片的画质、影调、色彩、光照和虚化等关键属性的全方位提升,该部门的工作重点包括图像/视频处理、图像感知、图像/视频增强、图像

文章图片
#算法#人工智能#深度学习 +1
大模型面试必问知识:Transformer、BERT、GPT

是时候准备面试和实习了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。。今天来聊一聊BERT和GPT的架构,从而了解大模型的第三步:Transformer。Transformer作为现代大语言模型的基石,其编码器-解码器架构为BERT和GPT提供了截然不

文章图片
#面试#transformer#bert +3
字节大模型算法岗被狠狠拷打,LoRA的数学原理被问倒了

经验总结T5微调:首选Prompt TuningGPT类生成:首选Prefix TuningBERT类理解:首选P-tuning传统训练:所有操作都用FP32(32位浮点数)混合精度训练前向传播:大部分用FP16,数值敏感操作用FP32反向传播:梯度计算用FP16,累积用FP32参数更新:用FP32保证精度显存充足(>40GB)任务简单:Prompt Tuning任务复杂:LoRA (rank=3

文章图片
#算法#人工智能#深度学习 +1
DeepSeek 本地部署指南(基于 vLLM)

通过以上步骤,你已成功在本地部署了 DeepSeek 模型,并能够通过 vLLM 进行推理。如果在部署过程中遇到问题,请参考 vLLM 官方文档或在相关社区寻求帮助。祝你使用愉快!

文章图片
#人工智能#深度学习#面试
50张图,直观理解混合专家(MoE)大模型

混合专家(MoE)是一种利用多个不同的子模型(或称为“专家”)来提升LLM质量的技术。MoE的两个主要组成部分是:专家:每个前馈神经网络(FFNN)层现在都有一组“专家”,可以选择其中的一部分。这些“专家”通常也是FFNN。路由或门控网络:决定哪些词元发送到哪些专家。在每个具有MoE的模型层中,我们会找到(相对专业化的)专家:需要注意的是,“专家”并不专注于特定领域,如“心理学”或“生物学”。专家

文章图片
#算法#面试#人工智能
DeepSeek等大模型 WebUI 究竟该如何抉择?Cherry Studio、Chatbox、AnythingLLM。。。

在2025年的AI工具市场中,Chatbox和各有千秋。选择工具的本质是“需求先行”。无论您是技术极客、企业决策者,还是效率追求者,总有一款工具能成为您的“数字外挂”。立即行动,用对工具,让AI真正为您赋能!

文章图片
#面试#人工智能#算法 +1
百度文心一言团队大模型Agent面经分享

整体下来感觉面试官都是非常专业的,面试深度和广度都很可以,三场面试层层递进。面试官人也不错,如果比较满意的话也愿意多花时间来聊,而不是严格的卡一个小时这种完任务式的面试。

文章图片
#AIGC#算法
【大模型面经】Diffusion及AIGC面试高频问题总结

最近春招和实习已开启了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。最近,我们又陆续整理了很多大厂的面试题,帮助一些球友解惑答疑,分享技术面试中的那些弯弯绕绕。。

文章图片
#AIGC#面试#深度学习 +1
大模型训练实战经验总结

通过解析训练流程、微调策略选择、资源需求评估,以及中文模型训练的独到见解,本文为读者勾勒出一幅清晰的大模型训练全景图。进一步也揭示了如何有效评测模型性能,确保其在知识广度、逻辑推理、情感理解等多维度达到高标准,为推动AI技术在各行各业的创新应用提供了宝贵的实操指南。

文章图片
#面试#算法#职场和发展 +1
    共 74 条
  • 1
  • 2
  • 3
  • 8
  • 请选择