logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

一文搞懂混合专家(MoE)模型

在探索最新的大语言模型(LLM)时,“MoE”这一术语频繁出现在各种标题之中。DeepSeek-V3便是一个实力强劲的混合专家(MoE)模型,其总参数量高达6710亿,且在处理每个标记(token)时,能够智能地激活约370亿的参数,实现高效计算。同样引人注目的还有Qwen2.5-Max,这一大规模MoE模型通过精心设计的监督微调(SFT)流程以及基于人类反馈的强化学习(RLHF)方法进行了后训练

文章图片
#面试#职场和发展#机器学习 +1
被百度大模型算法岗狠狠的毒打了

摘要:近期互联网大厂秋招如火如荼,某算法岗面试经历引发关注。面试内容涵盖自我介绍、项目深挖、技术八股(包括DeepSeek、注意力机制、DeepSpeed等)、微调技术细节(LoRA显存计算)、大模型推理参数(温度/topk/topp执行顺序)以及业务场景题。面试采用压力面形式,面试官未开摄像头但质疑候选人简历内容,最终候选人反馈体验较差。该案例反映出算法岗面试的高专业要求和高压特点,建议求职者扎

文章图片
#人工智能#算法
一文搞懂大模型部署框架Ollama和vLLM

Ollama是一款专注于简化大型语言模型本地部署和运行的开源框架,基于Go语言实现,支持跨平台运行,并以“开箱即用”为核心理念,适合个人开发者和轻量化场景。而vLLM是一个高效的大模型推理与服务引擎,基于PyTorch构建,创新性地引入了PagedAttention技术,旨在解决大模型服务中的显存效率与吞吐量瓶颈,支持张量并行和流水线并行,可横向扩展至多机多卡集群。节前,我们邀请了一些互联网大厂朋

文章图片
#算法#面试#职场和发展 +1
一文搞懂大模型提示工程(Text2SQL、Text2API)

大模型的提示工程(Prompt Engineering) 是通过精心设计输入文本(Prompt),引导大语言模型(LLM)生成符合预期输出的技术。在Text2SQL(自然语言转SQL)和Text2API(自然语言调接口)场景中,提示工程的核心目标是将自然语言问题转化为准确的 SQL 查询和具体的 API 调用参数。

文章图片
#oracle#数据库#人工智能 +1
字节算法岗 offer 到手,有点小激动。。。

摘要:本文分享了26届秋招字节大模型算法岗的三轮面试经历,涵盖算法岗面试的核心要点。一面考察基础知识和代码能力,涉及Transformer结构、BERT预训练、LLM Agent设计等;二面深入项目细节,聚焦Qwen模型、MoE结构、RLHF流程等技术难点;三面侧重工程实践,讨论硬件优化、训练监控、数据配比等实际问题。文章为算法岗求职者提供了全面的面试准备参考,特别强调对大模型技术细节和工程落地的

文章图片
#算法
图解AI核心技术:RAG、大模型、智能体

维度传统RAG检索方式单次、静态多轮、动态优化推理能力单跳,依赖人工设计多跳,自主分解任务上下文管理固定拼接动态筛选与精炼错误处理无自检机制结果验证与修正适用场景简单问答、文档摘要复杂推理、实时交互、工具调用演进本质:Agentic RAG将RAG从“管道流程”升级为“自主决策系统”,更贴近人类问题解决模式。策略核心逻辑优势局限性Fixed-size固定长度切割高效、通用语义断裂风险Semanti

文章图片
#人工智能#算法#面试 +2
从携程到虾皮:两个月十余家大厂算法岗面试复盘

自我介绍是对背景和工作经历的概述,所以尽可能突出你自己做的比较好且有把握的项目,这样面试官在提问的时候也会因为你自己提到的内容而往这方面走。不过有一些面试官就是会找简历上和自己业务相关或者感兴趣的项目来进行提问,所以你在简历上提到的项目都需要非常熟悉。

文章图片
#算法#面试#职场和发展
一文带你彻底理解AIGC、Agent、MCP的概念和关系

Function Calling(函数调用)是大型语言模型的关键技术。前面有提到过RAG技术是为了解决模型无法和外接数据交互的问题,但是RAG的局限在于只赋予了模型检索数据的能力,而允许模型理解用户请求中的潜在意图,并自动生成结构化参数来调用外部任何函数/工具,从而突破纯文本生成的限制,实现与真实世界的交互,比如可以调用查天气、发邮件、数学计算等工具。

文章图片
#AIGC#算法#面试 +2
深度盘点:Python 7种提效增速的技巧

在工作中,我们常常面临着代码提速优化问题,本文就为大家介绍几种Python常用的提速技巧。优化原则:1.先保证代码可以正确运行,再进行性能优化2.优化的选择通常是牺牲空间换取时间,所有我们需要权衡代价3.着重优化代码耗时的部分,通篇优化通常会降低代码的可读性0 定义耗时装饰器# 可监控程序运行时间import timedef clock(func): &nb

#python#开发语言#后端
拿来即用,这5个 Python 自动化脚本好用到起飞

大家好,相比大家都听过自动化生产线、自动化办公等词汇,在没有人工干预的情况下,机器可以自己完成各项任务,这大大提升了工作效率。编程世界里有各种各样的自动化脚本,来完成不同的任务。尤其Python非常适合编写自动化脚本,因为它语法简洁易懂,而且有丰富的第三方工具库。这次我们使用Python来实现几个自动化场景,或许可以用到你的工作中。喜欢本文记得收藏、点赞、关注。【注】文末提供完整版代码、数据、技术

文章图片
#python#开发语言#数据分析
    共 179 条
  • 1
  • 2
  • 3
  • 18
  • 请选择