
简介
(⊙o⊙)?
擅长的技术栈
可提供的服务
impossible is nothing
大语言模型处理用户输入的核心流程包含预处理、子词算法分词、词汇表映射ID、嵌入层向量转换及Transformer编码生成响应。常见误解包括:1)误将分词视为简单按字分割,实际采用BPE等动态子词算法;2)误认为向量化需外部查询,实为模型内置嵌入矩阵运算;3)混淆token化与向量化为同一阶段,实为离散符号到连续空间的分步映射。理解这些机制对优化模型应用、规避幻觉风险具有关键作用。

本博客详细介绍了Notepad++插件的扩展设计,重点实现多平台、多模型及认证体系三大核心能力。通过配置文件动态切换平台,采用分层架构抽象出多种认证方式(Basic/Bearer/ApiKey等),通过策略模式统一处理授权头生成,确保安全性与扩展性。模型管理模块支持手动配置与自动发现双模式,预留models_endpoint接口为动态模型同步奠定基础。

本文系统阐述了SM4国密算法的技术体系与工程实践。通过分组密码基础理论建立算法框架,明确其128位分组/密钥长度及32轮迭代结构。在原理层面,重点解析轮函数中复合域S盒的非线性变换机制,并对比ECB/CBC工作模式的适用场景。安全性分析从差分攻击概率到侧信道防御方法,论证算法合规性,并通过性能数据揭示与AES的差异。最终以CBC模式源码实现收尾,提供Header-Only库设计与单元测试验证方案,

本文围绕SM2算法展开,系统介绍了其技术原理与实现方法。首先,从算法基础入手,概述了SM2的核心数学原理、关键参数及组件构成。接着,深入解析了数字签名、加密解密流程以及密钥交换协议,并探讨了椭圆曲线数学优化技术,展示了SM2在性能与安全性上的优势。安全性分析部分则从算法设计、抗攻击能力及与RSA/AES的对比入手,全面评估了SM2的安全性。最后,通过C++跨平台自实现(Header-Only)展示

文章深度解析了大模型监督微调(SFT)技术,阐述了其作为连接预训练模型与具体应用的关键技术层的重要性。文章详细介绍了SFT的核心理论框架,包括语义空间重构、训练动力学特性等,并探讨了其优势与局限。通过具体的应用场景和前沿发展方向,文章展示了SFT在垂直领域适配、交互模式塑形和安全边界控制等方面的应用。同时,文章还提供了实践启示,强调了训练数据质量、学习率调度策略和模型评估的重要性。最后,文章展望了

本文系统解析了Transformer架构的核心原理、技术演进及应用实践,Transformer凭借自注意力机制、位置编码和多头注意力等创新,解决了传统RNN的长程依赖问题,支持并行计算,成为NLP和CV领域的基石。详述了DeepSeek等模型的优化策略,包括混合专家系统(MoE)、分层注意力和Flash Attention 2等技术,显著提升长序列处理效率。通过代码示例,演示了简化版Transfo

本文系统介绍了Python数据处理库Pandas的核心功能与实践应用。Pandas以Series和DataFrame为数据结构,提供数据清洗、时间序列处理等高效功能,支持向量化运算和内存优化。文章详细讲解了安装方法、核心数据结构、数据处理能力、工程实践技巧及性能优化策略,旨在帮助读者快速掌握Pandas,为深度学习模型训练打下基础。

C++20四大核心特性解析:提升开发效率与安全性 C++20作为重要里程碑,引入了多项革命性特性。本文重点剖析了四个关键改进: std::span:提供安全连续的序列视图,解决传统指针传递的边界安全问题,支持零拷贝操作原生数组和容器,具备子视图功能。 结构化绑定:简化复合数据访问,支持直接解构pair、tuple和结构体成员,提升代码可读性,特别适用于map遍历等场景。 控制流初始化:允许在if/

NumPy是Python科学计算的核心库,以高效多维数组(ndarray)为核心,支持向量化运算和广播机制,性能远超原生Python。其核心功能包括灵活数组创建、智能索引切片、丰富数学函数库及内存优化机制,适用于数据处理、算法实现和跨库协同。文档详解了数组创建、类型控制、文件交互、重塑转置等基础操作,强调视图与拷贝的内存特性及向量化运算优势。NumPy在AI领域支撑数据预处理、特征工程和模型开发,

前馈神经网络(Feedforward Neural Network)是最基础的神经网络类型,其核心特征是信息单向流动,即数据从输入层经隐藏层传递至输出层,无循环或反馈连接。典型结构包括输入层隐藏层和输出层。输入层接收原始数据,如像素值;隐藏层通过加权求和和非线性变换提取特征;输出层生成最终预测结果,如分类概率。FNN结构图:单层前馈网络仅含输入层和输出层,适用于简单线性分类。例如感知机(Perce
