
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
Mysql的高性能优化和架构设计. 索引设计,查询方式,mysql底层结构

本文章内容适合 SpringBoot多模块单系统采用H2内存测试库. 这种情况颇为复杂.因为单元测试必须要依靠主启动类程序. 多模块我试过,每个模块单独设置测试启动类.但是发现一个问题.每个模块都需要mapper扫描.需要关联依赖,还需要在那个模块中引入配置文件.否则读取不到. 也就是说单元测试的性质变了.每个模块的单元测试启动类都需要.像主启动类一样.需要完整的环境加载.这严重偏离了单元测试的目
默认情况下,hbbs 监听 21114(TCP,用于 Web 控制台,仅在 Pro 版本中可用)、21115 (TCP)、21116 (TCP/UDP) 和 21118 (TCP),hbbr 监听 21117 (TCP) 和 21119 (TCP)。21115 用于 NAT 类型测试,21116/UDP 用于 ID 注册和心跳服务,21116/TCP 用于 TCP 打孔和连接服务,21117 用于

本文介绍了基于FunASR框架的音频通话质量分析系统开发实践。作者针对单一语种(中文/英文)的离线音频转写需求,对比了两种语种识别方案,最终选择使用cam++模型进行语种识别。文章详细阐述了FunASR框架的核心功能(包括语音活动检测、自动语音识别等)及其存在的5个主要问题,并分享了开发思路和Python测试流程,包括模型选择、风险分析和部署方案。通过实际案例展示了语种识别和英文音频识别的具体实现

本文通过研习 B 站及知乎,论文等相关技术内容,旨在系统梳理并总结主流大模型架构 Transformer 的核心理论概念,深度解析其技术体系中涵盖的预训练(Pre-training)、监督微调(SFT, Supervised Fine-Tuning)、基于人类反馈的强化学习(RHLF, Reinforcement Learning from Human Feedback)等关键训练阶段,同时对各阶

本文提出了一种基于LLM强制对齐与CTC声学分析的二合一吞音检测系统,适用于有/无参考文本两种场景。系统创新性地结合Qwen3-ForcedAligner大模型和Wav2Vec2声学特征,通过多维特征归一化与线性加权算法进行发音质量评估。在无参考文本模式下,系统利用CTC音素分割和9种声学特征计算吞音风险;在有参考文本模式下,优先采用Qwen3进行精确对齐,并结合声学分析。该系统显著提升了复杂场景
以下适用于无法通过在线命令拉取的尝试过Stable Diffusion集成ollama,但是sd在ollama上无法良好运行。故此作罢。ollama自定义模型导入文档创建一个名为 Modelfile 的文件,并在其中包含一个 FROM 指令,该指令指向你想要导入的模型的本地文件路径。

本文介绍了大模型微调的技术要点和参数优化方法。首先说明了项目环境配置,包括镜像设置和关键依赖安装(transformers、peft等)。重点分析了全量微调的计算成本,详细拆解了模型权重、梯度、优化器状态和中间激活值的内存需求。通过数学公式推导了梯度下降原理,解释了优化器(如AdamW)如何通过动量矩和方差矩解决训练中的方向不稳定和参数尺度差异问题。文章为高效微调大模型提供了理论基础和实践指导,特
本文介绍了nasm汇编编译器和FFmpeg的离线安装方法。首先下载nasm源码包,解压后通过configure配置安装路径,编译安装并设置环境变量。接着下载FFmpeg源码,配置编译选项(启用GPL协议、静态编译等),执行编译安装并验证关键功能(如anlm降噪、loudnorm响度标准化等)。两种工具安装完成后都需添加路径到系统环境变量以便全局使用。该指南提供了完整的命令行操作流程,适用于需要在无
本文通过研习 B 站及知乎,论文等相关技术内容,旨在系统梳理并总结主流大模型架构 Transformer 的核心理论概念,深度解析其技术体系中涵盖的预训练(Pre-training)、监督微调(SFT, Supervised Fine-Tuning)、基于人类反馈的强化学习(RHLF, Reinforcement Learning from Human Feedback)等关键训练阶段,同时对各阶








