
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
主成分分析(PCA, Principal Component Analysis) 在机器学习中,主要用于提升向量表示的质量或效率。PCA 可以对一个向量在进行降维的同时,还最大限度的保留向量的主要特征。现代嵌入模型(如 BERT、OpenAI Embeddings)生成的向量维度很高(如 768、1536 维),导致:● 存储成本高● 近似最近邻搜索速度慢解决方案:用 PCA 将高维向量投影到低维
基于 Karpathy 的开源项目 nanoGPT,在本地离线训练数据和推理,体验 LLM 是如何工作的。输出:安装依赖包准备测试数据(莎士比亚集)输出:准备完会在 data/shakespeare_char 看到莎士比亚集 input.txt(原始数据),以及 train.bin(训练数据)和 val.bin(验证数据),下一步训练数据。如果是 Apple M4 Pro 上进行训练,需要将 cu
基于 Karpathy 的开源项目 nanoGPT,在本地离线训练数据和推理,体验 LLM 是如何工作的。输出:安装依赖包准备测试数据(莎士比亚集)输出:准备完会在 data/shakespeare_char 看到莎士比亚集 input.txt(原始数据),以及 train.bin(训练数据)和 val.bin(验证数据),下一步训练数据。如果是 Apple M4 Pro 上进行训练,需要将 cu
主成分分析(PCA, Principal Component Analysis) 在机器学习中,主要用于提升向量表示的质量或效率。PCA 可以对一个向量在进行降维的同时,还最大限度的保留向量的主要特征。现代嵌入模型(如 BERT、OpenAI Embeddings)生成的向量维度很高(如 768、1536 维),导致:● 存储成本高● 近似最近邻搜索速度慢解决方案:用 PCA 将高维向量投影到低维
关系型数据库最核心的功能是支持事务,这一特性使得其故障后的恢复处理过程会比较复杂。这其中的 failure recovery 机制,在不同的数据库中有不同的叫法,比如 Informix 称之为 fast recovery,而 Db2 称之为 crash recovery,但不管怎么叫,指的都是数据库重启后,如何根据事务 ACID 属性(主要是原子性 A 和持久性 D)给用户的承诺,将事务数据恢复到
本文是对论文“LCL: A Lock Chain Length-based Distributed Algorithm for Deadlock Detection and Resolution”的解读。







