
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文介绍了大模型微调的技术要点和参数优化方法。首先说明了项目环境配置,包括镜像设置和关键依赖安装(transformers、peft等)。重点分析了全量微调的计算成本,详细拆解了模型权重、梯度、优化器状态和中间激活值的内存需求。通过数学公式推导了梯度下降原理,解释了优化器(如AdamW)如何通过动量矩和方差矩解决训练中的方向不稳定和参数尺度差异问题。文章为高效微调大模型提供了理论基础和实践指导,特
本文介绍了nasm汇编编译器和FFmpeg的离线安装方法。首先下载nasm源码包,解压后通过configure配置安装路径,编译安装并设置环境变量。接着下载FFmpeg源码,配置编译选项(启用GPL协议、静态编译等),执行编译安装并验证关键功能(如anlm降噪、loudnorm响度标准化等)。两种工具安装完成后都需添加路径到系统环境变量以便全局使用。该指南提供了完整的命令行操作流程,适用于需要在无
本文通过研习 B 站及知乎,论文等相关技术内容,旨在系统梳理并总结主流大模型架构 Transformer 的核心理论概念,深度解析其技术体系中涵盖的预训练(Pre-training)、监督微调(SFT, Supervised Fine-Tuning)、基于人类反馈的强化学习(RHLF, Reinforcement Learning from Human Feedback)等关键训练阶段,同时对各阶

本文介绍了一个基于深度学习的声纹识别系统,主要包含三大功能:声纹识别、说话人日志和声纹对比。系统采用两阶段处理流程:业务侧预处理阶段统一音频格式(16kHz单声道)并进行降噪、归一化等处理;模型侧使用FBank特征提取和CAM++等多说话人分离模型,结合VAD分片和谱聚类算法实现说话人分离。项目提供了完整的Web接口实现,可应用于门禁验证、会议记录等场景,具有较高的实用价值。文中详细说明了音频预处

本文介绍了基于FunASR框架的音频通话质量分析系统开发实践。作者针对单一语种(中文/英文)的离线音频转写需求,对比了两种语种识别方案,最终选择使用cam++模型进行语种识别。文章详细阐述了FunASR框架的核心功能(包括语音活动检测、自动语音识别等)及其存在的5个主要问题,并分享了开发思路和Python测试流程,包括模型选择、风险分析和部署方案。通过实际案例展示了语种识别和英文音频识别的具体实现

本文介绍了基于FunASR框架的音频通话质量分析系统开发实践。作者针对单一语种(中文/英文)的离线音频转写需求,对比了两种语种识别方案,最终选择使用cam++模型进行语种识别。文章详细阐述了FunASR框架的核心功能(包括语音活动检测、自动语音识别等)及其存在的5个主要问题,并分享了开发思路和Python测试流程,包括模型选择、风险分析和部署方案。通过实际案例展示了语种识别和英文音频识别的具体实现

baomidou提供的@DS自定义AOP自动换源实现AbstractRoutingDataSource手动换源。

一次镜像,处处运行.达成Docker容器在任何操作系统上都是一致的,实现应用跨平台、跨服务器.解决运行环境和配置问题的软件容器,方便做持续集成并有助于整体发布的容器虚拟化技术.

dubbo和openfeign的区别是dubbo是真正的rpc框架.支持多种通信协议.能面对更多的调用场景,而且跨语言. 它的思路是–>服务暴露自己的方法,注册到注册中心.消费端则从注册中心调用服务暴露的方法.openfeign目的是让开发者调用更简约,因此它是http通信框架.它的思路是–>服务指定url接口.直接调用目标模块的接口.我的dubbo提供端和消费端配置dubbo : applica

There was an unexpected error (type=Service Unavailable, status=503).No servers available for service








