logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

sherpa-ncnn:构建Android APK -- 语音转文本大模型

(1)github访问失败问题:修改为镜像(kkgithub.com)(1)安装你的Android Studio,请参阅。(1)安装你的Android NDK,请参阅:。声明:资源可能存在第三方来源,若有侵权请联系删除!下载预训练模型模型并将其放入。了解所有可用的预训练模型。

文章图片
#android#语音识别
CMSIS-NN:2.神经网络到CMSIS-NN的转换

该网络的输入是一个32x32像素的彩色图像,它将被分类到10个输出类之一。当输入张量维度是4的倍数时,使用arm_convolve_HWC_q7_fast(),因为这可以很好地利用8位操作上的SIMD 32读取和交换行为。最大池的输出的Q格式与其输入格式相同,因为该算法在CMSIS-NN中是如此实现的。CMSIS-NN只支持几个层,不支持的层,应尝试CMSIS-NN和CMSIS-DSP功能的等效组

#神经网络#人工智能#深度学习
sherpa-ncnn:Endpointing(断句规则)

如果激活了其中任何一个,我们假设检测到终端节点。在以下示例中,解码内容后,当尾随静默的持续时间大于用户指定的值。中,我们要求它必须先解码一些内容,然后才能计算尾随的静默。当尾随静默的持续时间达到 2.4 秒时,没有解码任何内容。在尾随静默的持续时间达到 2.4 秒之前,解码了一些内容。Python API中,您可以在构造。Python API中,您可以在构造。Python API中,您可以在构造。

文章图片
基于 LangChain 搭建简单 RAG 系统

最后我们需要整合检索与生成,这里可以使用LangChain表达式语言(LangChain Execution Language,LCEL)来方便快捷地构建一个链,将检索到的文档、构建的输入 Prompt 以及模型的输出组合起来。随后是输入 Prompt 的设置,LangChain 的 Prompt Hub 中提供了多种预设的 Prompt 模板,适用于不同的任务和场景。构建好知识源后,接下来开始构

文章图片
#数据库#服务器
sherpa-ncnn:音频处理跟不上采集速度 -- 语音转文本大模型

具体是,调用sherpa-ncnn-alsa_Test时,音频是实时采集的,在采集到音频后会对音频数据进行额外处理。音频处理速度跟不上音频采集速度时。在音频额外处理期间,停止音频识别采集,在运行结束时恢复音频识别采集。在其他API处理这个句子时,语音还在实时采集,这是就会导致处理速度跟不上音频采集速度。在音频额外处理期间,停止音频识别采集,在运行结束时恢复音频识别采集,以避免数据溢出。这个错误表明

#音视频
LLM 推理优化

由于块不需要在内存中是连续的,因此我们可以像在操作系统的虚拟内存中一样以更灵活的方式管理键和值:可以将块视为页面,将 token 视为字节,将序列视为进程。量化除了降低模型需要的显存外,最直接的收益就是降低了带宽使用率,所以从理论上来说,量化后的模型性能应该是成比例提升的,这个提升不仅体现在吞吐量上,也会体现在 Latency 上。从而在保证延迟的情况下,提高吞吐量。1.量化感知训练(QAT):在

文章图片
#性能优化
HTTP Client/Server 实践:cpp-httplib服务器发送事件(SSE)

服务器发送事件提供了一种方法,使服务器能够通过 HTTP 向客户端推送实时更新,而无需客户端反复轮询服务器。与 WebSockets 不同,SSE 是单向的(仅从服务器到客户端),但为许多实时用例提供了更简单的实现。服务器发送事件(SSE)是一种服务器推送技术,允许 Web 服务器通过单个 HTTP 连接持续向客户端推送数据。类来管理事件分发到连接的客户端,使用互斥锁和条件变量进行线程同步。:SS

#http
llama.cpp:Android端测试Qwen2.5-Omni

将你想推理的img.png和audio.wav放到./Data目录。以下是经实验验证可行的环境参考,也可尝试其他版本。声明:资源可能存在第三方来源,若有侵权请联系删除!(2)硬件设备:Android 手机。(3)软件环境:如下表所示。

#android
sherpa:介绍

sherpa是项目的部署框架。sherpa支持在各种平台上部署与语音相关的预训练模型,并提供多种语言绑定。目前,sherpa拥有以下子项目:项目安装难度困难容易神经网络库PyTorchncnnCPU支持arm32arm64arm32arm64**RISC-V**GPU支持是(使用CUDA支持 NVIDIA GPU)是是(使用Vulkan支持 ARM GPU)操作系统支持macOSmacOS,iOS

llama.cpp:Linux_x86端测试Qwen2.5-Omni

将你想推理的img.png和audio.wav放到./Data目录。以下是经实验验证可行的环境参考,也可尝试其他版本。声明:资源可能存在第三方来源,若有侵权请联系删除!(2)软件环境:如下表所示。

    共 18 条
  • 1
  • 2
  • 请选择