logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

Linux离线环境安装ffmpeg

本文介绍了nasm汇编编译器和FFmpeg的离线安装方法。首先下载nasm源码包,解压后通过configure配置安装路径,编译安装并设置环境变量。接着下载FFmpeg源码,配置编译选项(启用GPL协议、静态编译等),执行编译安装并验证关键功能(如anlm降噪、loudnorm响度标准化等)。两种工具安装完成后都需添加路径到系统环境变量以便全局使用。该指南提供了完整的命令行操作流程,适用于需要在无

#linux#php
大型语言模型中 Transformer、MoE 与强化学习(GRPO/PPO/DPO)的整合研究

本文通过研习 B 站及知乎,论文等相关技术内容,旨在系统梳理并总结主流大模型架构 Transformer 的核心理论概念,深度解析其技术体系中涵盖的预训练(Pre-training)、监督微调(SFT, Supervised Fine-Tuning)、基于人类反馈的强化学习(RHLF, Reinforcement Learning from Human Feedback)等关键训练阶段,同时对各阶

文章图片
#transformer#深度学习#人工智能
声纹模型全流程实践-开发(训练 - 微调 - 部署 - 调用)

本文介绍了一个基于深度学习的声纹识别系统,主要包含三大功能:声纹识别、说话人日志和声纹对比。系统采用两阶段处理流程:业务侧预处理阶段统一音频格式(16kHz单声道)并进行降噪、归一化等处理;模型侧使用FBank特征提取和CAM++等多说话人分离模型,结合VAD分片和谱聚类算法实现说话人分离。项目提供了完整的Web接口实现,可应用于门禁验证、会议记录等场景,具有较高的实用价值。文中详细说明了音频预处

文章图片
#语音识别#linux#python +1
FunASR本地Offline全流程实践:语种识别与语音识别模型开发(训练 - 微调 - 部署 - 调用)

本文介绍了基于FunASR框架的音频通话质量分析系统开发实践。作者针对单一语种(中文/英文)的离线音频转写需求,对比了两种语种识别方案,最终选择使用cam++模型进行语种识别。文章详细阐述了FunASR框架的核心功能(包括语音活动检测、自动语音识别等)及其存在的5个主要问题,并分享了开发思路和Python测试流程,包括模型选择、风险分析和部署方案。通过实际案例展示了语种识别和英文音频识别的具体实现

文章图片
#语音识别#人工智能
FunASR本地Offline全流程实践:语种识别与语音识别模型开发(训练 - 微调 - 部署 - 调用)

本文介绍了基于FunASR框架的音频通话质量分析系统开发实践。作者针对单一语种(中文/英文)的离线音频转写需求,对比了两种语种识别方案,最终选择使用cam++模型进行语种识别。文章详细阐述了FunASR框架的核心功能(包括语音活动检测、自动语音识别等)及其存在的5个主要问题,并分享了开发思路和Python测试流程,包括模型选择、风险分析和部署方案。通过实际案例展示了语种识别和英文音频识别的具体实现

文章图片
#语音识别#人工智能
SpringBoot数据库换源(多数据源)

baomidou提供的@DS自定义AOP自动换源实现AbstractRoutingDataSource手动换源。

文章图片
#spring boot#数据库#java
Docker 基础技术:中间件部署与分布式云原生实践指南(一)

一次镜像,处处运行.达成Docker容器在任何操作系统上都是一致的,实现应用跨平台、跨服务器.解决运行环境和配置问题的软件容器,方便做持续集成并有助于整体发布的容器虚拟化技术.

文章图片
#学习#docker
No provider available for the service.dubbo服务互调启动异常 java.util.HashMap is in module java.base of load

dubbo和openfeign的区别是dubbo是真正的rpc框架.支持多种通信协议.能面对更多的调用场景,而且跨语言. 它的思路是–>服务暴露自己的方法,注册到注册中心.消费端则从注册中心调用服务暴露的方法.openfeign目的是让开发者调用更简约,因此它是http通信框架.它的思路是–>服务指定url接口.直接调用目标模块的接口.我的dubbo提供端和消费端配置dubbo : applica

文章图片
#dubbo#java#java-zookeeper
No servers available for service: xxxx

There was an unexpected error (type=Service Unavailable, status=503).No servers available for service

文章图片
#java#开发语言
PDF多表格结构识别与跨表语义对齐:基于对抗迁移的健壮性相似度度量模型

对于pdf文本类型这种pdfbox,aspose-pdf,spire直接提取文本的精准性更高。基于此我们可能需要提取pdf中所有表格数据,完成数据录入。但是表格数据不同,还存在跨页表格问题。但是按照以下方案即可解决。本文的表格处理思想来源于mybatis的底层设计。表示我们可以把字符ascii映射到特征向量上,并通过单位向量归一化结果。获取第一块内容字串的标准化特征向量。表格解析器每检测一页的所有

文章图片
    共 35 条
  • 1
  • 2
  • 3
  • 4
  • 请选择