
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本文将介绍一种低延迟、高精度的纠错模型 FastCorrect,通过利用编辑对齐以及多个候选结果,在取得 10% 的词错误率下降的同时,将模型加速 6-9 倍,相关研究论文已被 NeurIPS 2021 和 EMNLP 2021 收录。...
要了解什么是视频编解码,首先我们需要了解什么是视频。视频归根结底是一系列连续的图像帧,当这些图像以一定速率播放时,人眼就会判断其是连续活动的,这样就构成了视频。那为什么要进行视频编解码呢,因为视频信号数字化后数据量巨大,如果以这样的数据量进行网络传输或者存储时,会占用大量的带宽和存储空间,造成浪费。已当前主流的 1080P 分辨率,一秒 30 帧的视频举例1080P 图像的高和宽分别为 1080
用 ASR 的字准确率虽然已经非常高,但是在面向具体的场景(游戏场景、私聊场景、群聊场景、主播场景)时,还是存在场景不匹配的问题,因为通用的 ASR 在这些领域中的应用相对比较困难
线上会议、在线教育、电商直播等多个场景的兴起,也使得实时互动技术从幕后走到台前,得到了更多人的关注。编解码、网络传输、计算机视觉等 RTE 相关的一系列技术也正焕发出更强的生命力。2021...
本文作者是本届 RTE 2021 创新编程挑战赛获奖者,来自上海交通大学的李新春。他分享了本次参赛作品的构思、系统设计和开发的心得。01 不得忽略的背景从国家层面上讲,十四五期间我国人工智能发展的方向之一是:基于 AI 硬件的新产品设计及平台将成为主流。当前,人工智能解决方案正由“软件”模式转变为“软件+硬件”模式。随着智能计算芯片与系统、新型多元智能传感器件与集成平台等新一代人工智能基础支撑平台
依图是一家做 AI 基础设施和 AI 解决方案的提供商,拥有的 AI 技术能力相对比较广泛,包括图片、视频、语音、自然语言处理等,除具备 AI 算法能力外,也能提供 AI 算力。
围绕 Conversational AI、Visual Agent 与 Edge AI 等核心议题,我们邀请了来自基础芯片与大模型、前沿硬件初创、硬件投资机构,以及记忆数据与实时互动基础设施的先锋代表齐聚一堂。(审核通过后,我们将通过短信告知详细地址与参会指引。📌 在这里,你将亲手完成从硬件配置、编译、运行,到自定义语音 Agent 的完整动手链路。👇 访问链接报名 (审核通过后,我们将通过微

近日,**AI 原生社区捏 Ta 宣布完成超千万美金的 Pre A+ 轮融资,由九坤创投领投,BV 百度风投跟投,源码资本、奇绩创坛等老股东超额跟进。**这一轮融资将主要用于三个方向:招募面向全球拓展的顶尖人才,技术研发投入,以及新产品线拓展。上线于 2024 年 3 月,捏 Ta 最初是一个专注于 AI 角色创作的平台。用户可以用自然语言创建虚拟角色,围绕角色创作图像、漫画、短片和可交互的玩法等
在与开发者长期的沟通中,我们发现,尽管声网为开发者提供了丰富翔实的 SDK 技术文档,但对于初次接触声网 SDK 的开发者来说,在第一眼看到文档的时候,可能会被大量新概念和复杂的 API 接口淹没。







