初_xue_者个人主页

@xuelin1036

初_xue_者

2022-11-24 11:39:41 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

第五篇：总结陈词——在 Vibe Coding 时代，做个清醒的“指挥官”

有了这个工具对于文字工作者和软件工作者来说都是很大的助力，希望大家都能好好用上我用的是cursor+web网页端一起分析，现在感觉效果很好

#人工智能

开发者实战：基于本地 Chroma 与云端通义千问搭建 RAG 系统

自己搭建一个RAG系统呀

#AIGC

AI不是一个好的员工：它只会是一个提效的工具

不要在有AI焦虑了，AI替代不了员工。从底层的分析逻辑上就可以得出这个结论AI永远只会是一个工具，而我们要的就是用好它而已可以看看逻辑对不对哈

#人工智能

工业级推理双子星：拆解 vLLM 分页内存与 SGLang 树状复用机制

管理kvcache的两种工具，以及他们的原理

#sglang #算法

解剖 GPU 显存：多轮对话中大模型为什么会遭遇 OOM 噩梦？

我们已经知道了，大语言模型在推理过程中会产生很多的kvcache，那么如何处理这些kvcache？

《从 Transformer 矩阵乘法说起：KV Cache 到底是在缓存什么？》

讲下kvcache是什么？它就是大语言模型在推理过程中产生的可以重复利用的中间变量

#transformer #矩阵 #缓存

动态大模型 Prompt 生成技术解析

我们这个文章来讲下动态prompt生成，它是怎么做的？

#服务器

linux 服务器网络问题排查

网络问题排查，会用工具和能够抓日志，能定位问题。问题基本就解决了！（那么具体是哪些工具要熟悉的？汇总一下大概就这些）

#服务器 #linux #网络

手把手教你分析深度学习目标检测模型——以YOLOv5为例

面试题，最直接的方式是给你一个模型让你来对这个模型进行分析，那么你至少要能够说出来它是什么吧，说出来它的内部做了什么吧

#深度学习 #目标检测

AI 芯片推理适配踩坑记：从 GPU 到国产算力的迁移思路

从 GPU 到国产算力的 AI 推理迁移，核心并非“硬件替换”，而是“生态适配+细节优化”——GPU 的优势在于成熟的生态与工具链，而国产芯片的优势在于安全自主、场景化优化潜力，迁移过程中无需追求“完全等效”，而是要结合国产芯片的硬件特性，针对性优化 API、内存、通信逻辑，在保障业务指标的前提下，充分发挥国产芯片的优势。结合多个项目的踩坑经验，总结两点核心认知：一是“迁移前预判，迁移中细致，迁移

#人工智能

共 17 条

请选择