
简介
该用户还未填写简介
擅长的技术栈
未填写擅长的技术栈
可提供的服务
暂无可提供的服务
第五篇:总结陈词——在 Vibe Coding 时代,做个清醒的“指挥官”
有了这个工具 对于文字工作者和软件工作者来说都是很大的助力,希望大家都能好好用上我用的是cursor+web网页端一起分析,现在感觉效果很好

开发者实战:基于本地 Chroma 与云端通义千问搭建 RAG 系统
自己搭建一个RAG系统呀

AI不是一个好的员工:它只会是一个提效的工具
不要在有AI焦虑了,AI替代不了员工。从底层的分析逻辑上就可以得出这个结论AI永远只会是一个工具,而我们要的就是用好它而已可以看看逻辑对不对哈

工业级推理双子星:拆解 vLLM 分页内存与 SGLang 树状复用机制
管理kvcache的两种工具,以及他们的原理

解剖 GPU 显存:多轮对话中大模型为什么会遭遇 OOM 噩梦?
我们已经知道了,大语言模型在推理过程中会产生很多的kvcache,那么如何处理这些kvcache?

《从 Transformer 矩阵乘法说起:KV Cache 到底是在缓存什么?》
讲下kvcache是什么?它就是大语言模型在推理过程中产生的可以重复利用的中间变量

动态大模型 Prompt 生成技术解析
我们这个文章来讲下动态prompt生成,它是怎么做的?

linux 服务器网络问题排查
网络问题排查,会用工具和能够抓日志,能定位问题。问题基本就解决了!(那么具体是哪些工具要熟悉的?汇总一下大概就这些)

手把手教你分析深度学习目标检测模型——以YOLOv5为例
面试题,最直接的方式是给你一个模型让你来对这个模型进行分析,那么你至少要能够说出来它是什么吧,说出来它的内部做了什么吧

AI 芯片推理适配踩坑记:从 GPU 到国产算力的迁移思路
从 GPU 到国产算力的 AI 推理迁移,核心并非“硬件替换”,而是“生态适配+细节优化”——GPU 的优势在于成熟的生态与工具链,而国产芯片的优势在于安全自主、场景化优化潜力,迁移过程中无需追求“完全等效”,而是要结合国产芯片的硬件特性,针对性优化 API、内存、通信逻辑,在保障业务指标的前提下,充分发挥国产芯片的优势。结合多个项目的踩坑经验,总结两点核心认知:一是“迁移前预判,迁移中细致,迁移







