
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
FireRedASR-AED是一款高性能开源中文语音识别模型,采用Conformer编码器和Transformer解码器的混合架构。其编码器通过下采样模块和16个Conformer块处理语音特征,结合多头自注意力与相对位置编码;解码器使用标准Transformer结构实现序列转换。该模型在普通话ASR基准测试中达到SOTA水平,同时支持方言和英语识别,兼具计算效率与识别性能优势,适合工业级应用。相

FireRedASR是一个开源工业级自动语音识别模型家族,支持多种语言和方言。其中FireRedASR-AED模型采用注意力编码器-解码器架构,在中文ASR基准测试中达到SOTA水平。项目对原始模型进行了ONNX转换和优化,通过实现完整的Beam Search缓存机制,显著提升了CPU推理速度(提升38.7%),同时保持识别准确率。优化后的模型在AISHELL-1测试集上CER为0.5527%,推
FireRedASR2S是一款先进的工业级一体化语音识别系统,整合了语音识别(ASR)、语音活动检测(VAD)、语种识别(LID)和标点预测(Punc)功能。该系统在多项测试中表现优异:ASR模块支持中文(含20+方言)、英语及混语识别,普通话平均错误率2.89%;VAD模块支持100+语言检测,F1分数达97.57%;LID模块准确率97.18%;Punc模块平均F1分数78.90%。提供LLM

本文介绍 vLLM v0.10.2 版本通过 Docker 运行 OpenAI 服务及 GGUF 量化的使用方式,明确该量化不支持多模态模型,且仅节约显存、不提升速度。GGUF 量化需要 llama.cpp 环境,接着将 Hugging Face 模型转为 FP16 格式 GGUF,再量化为 Q4_0 等类型(文中列多种支持的量化类型),最后通过 Docker 启动量化后的模型,同样提供了测试请求

centos7安装docker和docker compose,docker可以使用GPU

KeSpeech数据集覆盖普通话及北京、西南、中原、东北、兰银、江淮、冀鲁、胶辽宫8 种方言。在开源 ASR 模型测试中,中文以字错误率(CER)为指标,FireRedASR 表现最优,总 CER 仅 4.7511,显著优于其他模型;Qwen2-Audio、Paraformer、Dolphin 性能相近,总 WER 在 11-13 区间;Whisper 与 PaddleSpeech 表现较弱,总

本文对比评测了两种语音标点恢复模型FireRedPunc和FunASR-Punc。FireRedPunc基于BERT架构,支持中英文标点预测;FunASR-Punc采用Controllable Time-delay Transformer框架,专攻中文标点预测。文章详细介绍了两种模型的使用方法,并在IWSLT2012-zh和CDCPP测试集上进行了评测。评测指标采用F1分数,包含精确率和召回率的计
本文介绍了使用Docker部署OpenClaw的详细步骤:首先拉取镜像并启动容器,配置网关端口和网络绑定;然后建立浏览器连接,通过SSH隧道访问控制界面;接着完成设备配对授权;最后配置大模型API参数并设置为默认模型。部署过程强调安全性,使用最小权限原则,并提供了完整的命令行操作指南和参数说明。

本文提供了在火山引擎和飞书平台上部署OpenClaw机器人的详细教程。主要内容包括: 在火山引擎创建ECS服务器,选择按量计费或包年包月方式,配置安全防护和登录密码。 开通方舟大模型服务,获取Model ID和API Key等必要配置信息。 在飞书平台创建应用并添加机器人能力,配置所需权限,包括消息读写、卡片操作等基础权限。 教程提供了详细的截图指引,帮助用户快速完成OpenClaw机器人的部署配

本文提供了在火山引擎和飞书平台上部署OpenClaw机器人的详细教程。主要内容包括: 在火山引擎创建ECS服务器,选择按量计费或包年包月方式,配置安全防护和登录密码。 开通方舟大模型服务,获取Model ID和API Key等必要配置信息。 在飞书平台创建应用并添加机器人能力,配置所需权限,包括消息读写、卡片操作等基础权限。 教程提供了详细的截图指引,帮助用户快速完成OpenClaw机器人的部署配








