logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

噪声场景下的语音识别新突破:用环境视觉线索提升性能——论文《Visual-Aware Speech Recognition for Noisy Scenarios》

为解决嘈杂场景下自动语音识别(ASR)性能不佳的问题,研究提出一种视觉感知语音识别模型,该模型不依赖说话者唇部动作,而是利用环境视觉线索关联噪声源以提升转录效果;同时设计了可扩展的数据集创建流程,通过过滤 AudioSet(得到 44 个噪声标签、每类≥750 样本的子集)并与 People’s Speech 清洁语音混合,构建出包含 28K 样本(训练 75 小时、验证 / 测试各 2K 样本

文章图片
#语音识别#人工智能
ollama在安装前和安装后修改模型存储路径

ollama安装修改模型存储路径,解决因为C盘存储不够用的情况

文章图片
#人工智能#深度学习
django连接sqlserver数据库(官网有效)附其他数据库

django使用第三方数据库使用需要安装django-pyodbc-azure第三方模块安装pyodbc和djangopip install django-pyodbc-azure现在,您可以将 Django 应用程序或项目使用的设置文件中的ENGINE设置指向"sql_server.pyodbc"模块路径'ENGINE': 'sql_server.pyodbc'DATABASES = {'def

#django#数据库#sqlserver
django连接sqlserver数据库(官网有效)附其他数据库

django使用第三方数据库使用需要安装django-pyodbc-azure第三方模块安装pyodbc和djangopip install django-pyodbc-azure现在,您可以将 Django 应用程序或项目使用的设置文件中的ENGINE设置指向"sql_server.pyodbc"模块路径'ENGINE': 'sql_server.pyodbc'DATABASES = {'def

#django#数据库#sqlserver
Django 根据已有数据库生成对应 models.py

当你在配置文件中连接好你的数据库之后python manage.py inspectdb > app名字/models.py你就能在对应的models文件中看到内容需要注意的是在每个模型类里面都有Meta类:说明如下class Turl(models.Model):url = models.CharField(max_length=1000)title = models.CharField(

#django#数据库#python
ollama在安装前和安装后修改模型存储路径

ollama安装修改模型存储路径,解决因为C盘存储不够用的情况

文章图片
#人工智能#深度学习
到底了