logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

面了智谱大模型算法岗,效率贼高!

总体上智谱AI效率比较高,问的内容偏向于实践,节奏和互联网大厂这边一致,拿到机会,比较开心。这份《AI产品经理学习资料包》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以在文末CSDN官方认证二维码免费领取【保证100%免费】资料包:CSDN大礼包:《对标阿里黑客&网络安全入门&进阶学习资源包》免费分享AI产品经理,0基础小白入门指南作为一个零基础小白,如何做到真正的入局A

文章图片
#算法#人工智能#面试 +2
美团开源首发INT8无损满血版DeepSeek R1

根据DeepSeek最新发布的技术报告,V3/R1突破性的训练成本控制主要依托FP8精度训练方案。FP8是一种典型的模型量化技术,相较于业界常用的BF16精度,FP8精度通过将数据位宽减半显著降低了单次计算开销,但也会带来一定的精度损失。在实践中,DeepSeek R1采用了混合精度训练机制有效缓解了精度损失问题。由于DeepSeek R1采用FP8精度训练,所以开源的原生权重就是FP8精度。

文章图片
#开源#百度#人工智能 +3
大模型面试题:如何让大模型生产合法的json呢?

要让大模型(如GPT、LLaMA、Claude等)稳定输出合法的JSON格式,需要结合和等多方面技术。

文章图片
#json#算法#目标检测 +3
一文彻底搞懂如何评估大模型 - 基准测试(Benchmark)

最近这一两周不少互联网公司都已经开始提前批面试了。不同以往的是,当前职场环境已不再是那个双向奔赴时代了。求职者在变多,HC 在变少,岗位要求还更高了。(Large Language Model,大型语言模型)中的Benchmark(基准测试)是用于衡量和比较不同LLM性能的一组经过精心设计的测试任务、问题和数据集。这些基准测试遵循标准化的流程,以评估LLM在核心语言处理任务上的表现。图片Bench

文章图片
#百度#人工智能#神经网络 +2
大模型算法工程师经典面试题—:为什么在softmax之前要对attention进行scaled(为什么除以 d_k的平方根)?”

因此, 的平方根被用于缩放(而非其他数值),因为,Q和K的矩阵乘积的均值本应该为0,方差本应该为1,这样会获得一个更平缓的softmax。从论文中可以看出,随着 的值变大,点积的大小会增大,从而推动softmax函数往仅有很小的梯度的方向靠拢(分布集中在绝对值大的区域),导致softmax 函数容易导致梯度消失问题。方差越大也就说明,点积的数量级越大(以越大的概率取大值)。网上虽然也有很多的学习资

文章图片
#算法#神经网络#人工智能 +3
deepseek为什么现在感觉不火了?

deepseek就像那种只会写"Hello World"的实习生,表面贼快,实际上细节全崩了,幻觉一堆,问它:“请给我生成一个线程池的最佳配置方案”,它啪一下就给你拷一段阿猫阿狗的ExecutorService代码,不管你是CPU密集还是IO密集型任务。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以

文章图片
#windows#百度#人工智能 +3
零代码教你写出自己的扩展小插件

我们只需要把对应的代码框住,让AI给我们生成详细仔细的解释,遇到不清不楚的问题,再不断不断的询问AI,让它不断的教会我们。• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。要看懂AI写的代码,想必会有点困难。网上虽然也有很多的学习资源,

文章图片
#人工智能#rpc#网络协议 +3
小米大模型岗面试,被问爆了......

由 1 节~5 节可知,获取当前 token 对应的 logit,仅Attention计算过程中,K 和 V 需要用到之前 token 的信息,其余计算各个 token 对应的向量都是独立的。在推理过程中,当前序列中,除最后一个 token 外,前面所有 token 的 KV Cache 在历史迭代中已经计算过。因此,我们可以预先分配一块显存,将这些已计算的 KV Cache 缓存起来,供下一个

文章图片
#面试#职场和发展#机器学习 +4
打工人逆袭!AI面试模拟器通过率90%,大厂HR集体破防

AI面试模拟器是一种基于大语言模型(LLM)+多模态分析系统的模拟面试系统。智能提问系统:模仿企业HR常见行为,按职位/行业智能出题;回答打分机制:根据语言逻辑、情绪、关键词匹配等维度评分;面部表情分析:结合摄像头分析表情、眼神接触、微笑频率等;个性化反馈报告:自动生成回答建议、逻辑优化提示、表达用语推荐。相比传统的“面经刷题”,AI模拟器更像一个真实的“虚拟面试官”。

文章图片
#人工智能#面试#职场和发展 +3
别再为插件付费!5分钟自建Coze图像识别插件(付源码)

当你为Coze平台插件调用付费时,是否想过:那些看似神秘的插件开发,实则只需一杯咖啡的时间就能自主实现?本文将颠覆您对AI插件开发的认知——无需机器学习背景,不必研究复杂算法,以阿里云百炼大模型为基座,带你用5分钟完成一个专业级图像识别插件的开发全流程。在接下来的实战中,你将亲历从模型选型、代码编写到服务部署的完整闭环。即使你是首次接触大模型开发的工程师,也能轻松完成Coze插件开发。文末更附赠提

文章图片
#xcode#macos#ide +3
    共 60 条
  • 1
  • 2
  • 3
  • 6
  • 请选择