Zyzyzyzyzzzz 个人主页

@Zyzyzyzyzzzz

Zyzyzyzyzzzz

2023-08-31 13:16:02 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

技术拆解（十三）：从GPT到智能体，人工智能的八年狂飙

本文系统复盘GPT预训练、RLHF、ChatGPT、多模态与智能体的八年演进，并延伸至算力、权限和治理边界。

#人工智能

技术拆解（十三）：从GPT到智能体，人工智能的八年狂飙

本文系统复盘GPT预训练、RLHF、ChatGPT、多模态与智能体的八年演进，并延伸至算力、权限和治理边界。

#人工智能

技术拆解（十三）：从GPT到智能体，人工智能的八年狂飙

本文系统复盘GPT预训练、RLHF、ChatGPT、多模态与智能体的八年演进，并延伸至算力、权限和治理边界。

#人工智能

技术拆解（十三）：从GPT到智能体，人工智能的八年狂飙

本文系统复盘GPT预训练、RLHF、ChatGPT、多模态与智能体的八年演进，并延伸至算力、权限和治理边界。

#人工智能

技术拆解（十一）：为什么你连7B模型都微调不动？从 SFT 到 QLoRA，再到 AWQ/GPTQ 部署，算清这笔显存账

这篇文章系统复盘了大模型全量SFT、LoRA、QLoRA微调与AWQ/GPTQ量化技术的底层原理、显存精算及工程落地决策。

#人工智能

技术拆解（十）：为什么你的大模型又慢又贵？搞懂量化原理、精度损失和 GPTQ/AWQ，推理成本直接砍半

本文概述大模型中的精度类型（浮点与整数）及四种主流量化方法（NF4、GPTQ、AWQ、GGUF），对比其原理、优缺点与适用场景。

#人工智能

效率神器（一）：Claude Code快捷键终极指南：这20个键让你永远不用碰鼠标

主要介绍claude code常用的快捷键。

#人工智能 #学习 #深度学习 +1

AI技术拆解（三）：Claude Code不上向量数据库，怎么做到低成本高召回？记忆机制拆解

Claude Code三层记忆架构：长期记忆层（CLAUDE.md与MEMORY.md）实现跨会话持久化；当前轮召回层通过语义匹配加载记忆，并采用Session Memory动态压缩上下文；会话持久层完整保存对话日志。该设计兼顾智能检索与成本控制。

#人工智能 #学习

技术拆解（四）：DeepSeek V4核心揭秘-CSA和HCA混合注意力机制是如何工作的？

DeepSeek V3以MLA低秩压缩KV缓存，结合DSA闪电索引器动态筛选Top-k Token做稀疏注意力，将复杂度从O(L²)降至O(Lk)。DeepSeek V4进一步提出HCA+CSA混合架构：HCA以128:1激进压缩并采用FP4精度存储，CSA以4:1保守压缩后索引筛选再做MLA，两者交替堆叠，在百万Token长上下文下实现FLOPs降至27%、KVCache降至10%

#人工智能 #自然语言处理 #深度学习 +1

趣玩（一）：我用GPT-image2给自己看手相，AI让我注意睡眠......（附提示词和使用指南）

手相测试小游戏

#学习

共 27 条

请选择