logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

动态规划与语音识别:音频片段匹配的 DP 相似度判断

使用动态规划计算累积代价矩阵$D$,递推公式为: $$ D(i,j) = c(i,j) + \min \begin{cases} D(i-1,j) \ D(i,j-1) \ D(i-1,j-1) \end{cases} $$ 最终相似度得分由$D(m,n)$归一化得到。每个时间帧对应一个d维特征向量,形成序列$X = (x_1, ..., x_m)$和$Y = (y_1, ..., y_n)$。通

#动态规划#语音识别#音视频
克服方言难题:语音识别在地域语言适配中的挑战与突破

例如,在隐马尔可夫模型(HMM)中,转移概率矩阵$A$和观测概率矩阵$B$需要大量方言数据来估计参数: $$P(O| \lambda) = \sum_{q} P(O,q| \lambda)$$ 这里$\lambda$表示模型参数,$O$是观测序列,$q$是隐藏状态序列。例如,一个端到端模型输出方言识别概率$P(d|x)$: $$P(d|x) = \text{softmax}(W \cdot h +

#语音识别#人工智能
省内存神器:Whisper 量化模型版本测评与国内下载链接

Whisper 量化版本是“省内存神器”的理想选择,尤其适合国内开发者和用户。通过上述链接和代码,您可以快速上手。建议从 Whisper-small INT8 开始测试,并根据需求调整模型。如果您有更多问题(如自定义量化),欢迎提供细节,我会进一步解答!

《Flutter 网络请求证书校验:HTTPS 安全通信的配置指南》

对于自签名证书或私有服务器,需手动添加证书。使用。

#网络#flutter#https
《AIGC 技术落地:BicycleGAN 的模型部署与实战效果评估》

通过蒸馏训练将2048维潜在空间压缩至512维,在保持生成多样性前提下实现推理耗时与显存占用的Pareto最优解,满足工业场景$\frac{\text{RT}}{\text{VRAM}} < 0.15$ ms/MB的严苛要求。

《SpringAI 实战:大模型应用中的 prompt 工程最佳实践》

Prompt工程是设计输入提示(prompt)以引导大型语言模型生成精确输出的过程。它涉及结构化语言、上下文嵌入和输出约束,确保模型响应符合预期。在SpringAI应用中,prompt工程是连接业务逻辑与AI能力的桥梁。核心目标:最小化模型偏差,提高响应相关性。关键元素:包括指令清晰度、示例嵌入和输出格式控制。在SpringAI中,prompt工程通过Java API实现,让开发者能无缝集成LLM

到底了