logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

<PostgreSQL数据库内核分析>之第二章:PostgreSQL的体系结构

文章目录一、PostgreSQL安装和数据库命令1.安装2.PG的数据库命令3.PG源代码的组织结构二、PG体系结构1.系统表一、PostgreSQL安装和数据库命令1.安装初始化数据库集簇cd postgres-master在拥有configure目录下执行:chmod +x ./configuremake;make installcd /usr/local/pgsqlmkdir data/--

#搜索引擎#算法#数据库
LightOP高阶算子库深度解读

能融合的都融合了:Reduce类算子3合1、大模型算子9合1——减少的是kernel launch开销和中间结果的显存读写,这些都是"看不见的耗时"该分开的都分开了:Prefill和Decoding走不同的实现路径,访存密集型和计算密集型各用各的优化策略——没有"一刀切"量化不只是精度换速度:SmoothQuant、W4A8重排压缩、多级流水掩盖——这是一套完整的量化部署方案,不只是把FP16换成

#人工智能#算法#机器学习
Claude Code快速入门

📋 基于原文整理,涵盖 Claude Code 的所有核心操作、命令与扩展功能。

LightOP高阶算子库深度解读

能融合的都融合了:Reduce类算子3合1、大模型算子9合1——减少的是kernel launch开销和中间结果的显存读写,这些都是"看不见的耗时"该分开的都分开了:Prefill和Decoding走不同的实现路径,访存密集型和计算密集型各用各的优化策略——没有"一刀切"量化不只是精度换速度:SmoothQuant、W4A8重排压缩、多级流水掩盖——这是一套完整的量化部署方案,不只是把FP16换成

#人工智能#算法#机器学习
基于DCU的大模型推理优化深度解读

框架层:选对基座(vLLM)、做好适配(layout/调度/算子),让模型先"跑起来且跑得顺"算子层:瞄准热点(MLA/Attention/MoE),逐算子压榨,MLA优化是DeepSeek系模型的重中之重量化层:混合精度是王道——MoE用低比特(W4A8)、Attention保精度(W8A8),KVCache用FP8工具链:AutoTuning解决"每个模型每个硬件都要调"的工程化问题一句话概括

#人工智能
大模型推理加速200%+?这套国产融合算子库把CUDA/Triton全替换了

能融合的都融合了:Reduce类算子3合1、大模型算子9合1——减少的是kernel launch开销和中间结果的显存读写,这些都是"看不见的耗时"该分开的都分开了:Prefill和Decoding走不同的实现路径,访存密集型和计算密集型各用各的优化策略——没有"一刀切"量化不只是精度换速度:SmoothQuant、W4A8重排压缩、多级流水掩盖——这是一套完整的量化部署方案,不只是把FP16换成

#人工智能#算法#机器学习
大模型推理加速200%+?这套国产融合算子库把CUDA/Triton全替换了

能融合的都融合了:Reduce类算子3合1、大模型算子9合1——减少的是kernel launch开销和中间结果的显存读写,这些都是"看不见的耗时"该分开的都分开了:Prefill和Decoding走不同的实现路径,访存密集型和计算密集型各用各的优化策略——没有"一刀切"量化不只是精度换速度:SmoothQuant、W4A8重排压缩、多级流水掩盖——这是一套完整的量化部署方案,不只是把FP16换成

#人工智能#算法#机器学习
Claude Code快速入门

📋 基于原文整理,涵盖 Claude Code 的所有核心操作、命令与扩展功能。

LLVM 后端流程与关键数据结构:从 IR 到机器码的入门笔记

写一个 C 程序,最后能跑起来,中间不是只有一个“编译器”在工作,而是一整套工具在接力。工具作用编译器前端读取 C/C++/Objective-C 等源代码,做词法、语法、语义分析,生成中间表示编译器后端把中间表示翻译成目标机器能理解的汇编或机器码汇编器把.s汇编文本转成.o目标文件链接器把多个.o和库链接成可执行文件或动态库反汇编器把机器码还原成汇编文本,便于分析调试器运行、断点、查看寄存器和内

#数据结构#java
claude-code-large-codebase-harness-csdn

CLAUDE.md是基础,不是垃圾桶,只放每次会话都需要的上下文;子目录可以维护自己的CLAUDE.md,让上下文随路径自动叠加;负责业务模块导航,解决“问题该去哪一层找”的问题;Hooks 做自动化,不负责提示词指挥;Skills 做按需专业知识加载,避免污染主上下文;LSP 让搜索从文本关键字升级到符号级导航;MCP、Plugins、Subagents 很有用,但应该建立在基础harness之

    共 61 条
  • 1
  • 2
  • 3
  • 7
  • 请选择