logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

算法工程师面试题——深度学习面试题实例必背汇总(二)

YOLOv5(You Only Look Once version 5)是一个流行的实时目标检测系统,它在速度和准确性之间提供了一个很好的平衡。YOLOv5并不是YOLO系列官方版本的迭代,而是由一个名为Ultralytics的团队开发的YOLO架构的一个变体。YOLOv5在其设计中使用了CSPNet(Cross Stage Partial Network)结构。CSPNet最初在2019年的一篇

文章图片
#人工智能#算法
深度学习中端到端(end-to-end)简要理解

端到端指的是输入是原始数据,输出是最后的结果。而原来的输入端不是直接的原始数据(raw data),而是在原始数据中提取的特征(features)。这一点在图像问题上尤为突出,因为图像像素数太多,数据维度高,会产生维度灾难,所以原来一个思路是手工提取(hand-crafted functions)图像的一些关键特征,这实际就是就一个降维的过程。经典机器学习方式是以人类的先验知识将raw数据预处理成

#深度学习#计算机视觉#人工智能
从AI算法工程师到“AI Engineering”(AI应用工程/全栈AI工程师)的改变思路

既然你是做 AI 应用的,自己写代码一定要用 Cursor 或 Github Copilot。对于你不熟悉的前端 CSS 或 SQL 语句,直接让 AI 帮你写,你负责 Code Review。在新岗位上,如果模型效果不好,第一反应应该是“优化 Prompt”或“优化检索数据”,而不是“我要重新训练一个模型”。当业务深入到一定程度,市面上的 API 无法满足需求时(比如需要极高的垂直领域专业度),

#人工智能#算法
从AI算法工程师到“AI Engineering”(AI应用工程/全栈AI工程师)的改变思路

既然你是做 AI 应用的,自己写代码一定要用 Cursor 或 Github Copilot。对于你不熟悉的前端 CSS 或 SQL 语句,直接让 AI 帮你写,你负责 Code Review。在新岗位上,如果模型效果不好,第一反应应该是“优化 Prompt”或“优化检索数据”,而不是“我要重新训练一个模型”。当业务深入到一定程度,市面上的 API 无法满足需求时(比如需要极高的垂直领域专业度),

#人工智能#算法
CUDA C++ 高频面试题精讲与实战优化指南(2025 全面升级版)—— 第一部分

CUDA 编程核心摘要(150字): CUDA采用线程(Thread)→块(Block)→网格(Grid)的三层结构,通过__global__定义GPU内核。内存优化需区分寄存器/共享/全局内存,建议使用共享内存减少全局访问。统一内存(cudaMallocManaged)简化管理但性能略低。错误检查需cudaGetLastError()。关键优化技术包括:流(Stream)异步计算实现H2D拷贝与

#c++#java#开发语言
1000道算法工程师面试题(大模型)—— 第34部分

本文聚焦RAG(检索增强生成)系统在业务落地中的性能优化问题。针对千万级数据检索延迟高的问题,提出按业务分片的优化策略;针对Embedding模型耗时,建议采用动态批处理和ONNX加速;针对短Query改写、Chunking平衡、Rerank耗时等典型问题,给出实用优化方案。同时讨论了向量数据库部署选择、并发优化、长文档处理等实战经验,涵盖从检索到生成的全链路性能瓶颈与解决方案,为大规模RAG系统

#算法#开发语言#面试 +1
1000道算法工程师面试题(大模型)—— 第30部分

本文聚焦Transformer底层原理与算法细节,深入解析Attention/Transformer相关核心问题。首先探讨RoPE位置编码的外推机制及其相对于绝对位置编码的优势;其次对比GQA与MQA的区别及Llama 3的选择;分析RMSNorm取代LayerNorm的趋势原因。在计算层面,详细推导7B模型的显存占用与KV Cache计算方式。此外,还涵盖SwiGLU激活函数、AdamW优化器、

#算法#面试#人工智能
1000道算法工程师面试题(大模型)—— 第30部分

本文聚焦Transformer底层原理与算法细节,深入解析Attention/Transformer相关核心问题。首先探讨RoPE位置编码的外推机制及其相对于绝对位置编码的优势;其次对比GQA与MQA的区别及Llama 3的选择;分析RMSNorm取代LayerNorm的趋势原因。在计算层面,详细推导7B模型的显存占用与KV Cache计算方式。此外,还涵盖SwiGLU激活函数、AdamW优化器、

#算法#面试#人工智能
1000道算法工程师面试题(大模型)—— 第29部分

本文聚焦容器化、K8s与MLOps的进阶实践,针对GPU资源管理、容器编排和模型部署等核心问题提供解决方案。主要内容包括:K8s中GPU独占配置、Docker运行时设置、节点亲和性应用、Dockerfile构建优化、显存监控与泄漏识别、Pod驱逐处理、共享存储加速、共享内存配置、Operator应用以及健康检查等生产环境关键问题。特别强调了大模型训练场景下的性能优化和稳定性保障措施,如Gang调度

#算法#开发语言#面试 +2
1000道算法工程师面试题(大模型)—— 第29部分

本文聚焦容器化、K8s与MLOps的进阶实践,针对GPU资源管理、容器编排和模型部署等核心问题提供解决方案。主要内容包括:K8s中GPU独占配置、Docker运行时设置、节点亲和性应用、Dockerfile构建优化、显存监控与泄漏识别、Pod驱逐处理、共享存储加速、共享内存配置、Operator应用以及健康检查等生产环境关键问题。特别强调了大模型训练场景下的性能优化和稳定性保障措施,如Gang调度

#算法#开发语言#面试 +2
    共 162 条
  • 1
  • 2
  • 3
  • 17
  • 请选择