logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

语音识别技术之FUNASR工具包

FUNASR是完整的语音识别解决方案,而paraformer-zh-streaming是其核心的中文流式识别模型,两者结合为中文语音识别提供了高效、准确的端到端解决方案。

#xcode#macos#ide
语音识别技术之FireRedASR

凭借的CER指标、及,FireRedASR-LLM-L确立了2025年中文ASR领域的新标杆。未来将进一步拓展多语种支持、优化长序列处理,并探索语音-视觉多模态交互应用。采用Encoder-Adapter-LLM架构,参数量8.3B,在多源、多场景(视频、直播、智能助手)均实现24%–40%相对CER下降,兼顾高精度与通用性。适用于对准确率要求极高且可投入计算资源的本地部署场景。​基于Attent

#语音识别#人工智能
Qt接入deepseekv3 API 提供openssl 1.1.1g安装包

记得复制api,避免丢失频繁创建。

文章图片
#qt#开发语言
WebRTC 服务器之Janus架构分析

适合刚学习 WebRTC 的场景,简单易实现,但实际应用中因上行带宽占用大、线性资源占用等问题,超过 4 人时问题明显,几乎无人在真实场景中使用。,可以根据终端下行网络状况进行流控,如根据带宽、网络延时情况选择性地丢弃一些媒体数据,以保证通信的连续性,更好地适应不同的网络状况和终端设备。,作为音视频网关,通过解码、再编码可以屏蔽不同编解码设备之间的差异化,满足更多客户的集成需求,提升用户体验和产品

文章图片
#webrtc#服务器#架构
播放器开发之ffmpeg 硬件解码方案

把解码当成解压缩文件,压缩算法越高级,得到的文件内存占用量就少。但是cpu使用率就高,硬件解码也是同一道理。硬件编解码器与软件编解码器的对比:硬件编解码器的输出质量通常低于优质的软件编解码器(如x264)。为了达到相同的感知质量,硬件编解码器需要更高的码率。在相同码率下,软件编解码器的输出质量通常更好。性能和效率:硬件编解码器的编解码速度更快,同时也更节省CPU资源。这使其更适合实时视频编解码的应

文章图片
Qt 基础组件速学 图像处理篇Graphics

图元 场景 视图三者之间的关系20-QGraphics · jbjnb/Qt demo - 码云 - 开源中国 (gitee.com)

文章图片
#qt#开发语言
ffmpeg常用命令

【代码】ffmpeg常用命令。

文章图片
ubuntu编译ffmpeg

运行环境:vmware ubuntu 20.04时间:2024年10月24日权限问题:由于ubuntu权限问题 建议使用root权限编译,且~是根据用户组来进行定位的。

文章图片
#ubuntu#linux#运维
ffmpeg filter 滤镜命令

FFmpeg filter滤镜是一种强大的功能,可以用于处理和操作视频和音频数据。视频处理调整视频分辨率、宽高比、帧率等属性执行视频剪辑和裁剪操作应用各种视觉特效,如模糊、锐化、色彩校正等合成多个视频源,如画中画、叠加文字等音频处理调整音量、均衡、混合多个音频轨道添加回声、噪音抑制等音频特效执行音频剪辑和拼接格式转换在不同的编解码器和容器格式之间进行转换,实现视频和音频的解复用操作。分析和调试测量

文章图片
    共 32 条
  • 1
  • 2
  • 3
  • 4
  • 请选择