logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

流式 ASR 从入门到实践:Zipformer2 + ONNX 全链路详解

一篇面向初学者的语音识别教程。以工业界常见的 Zipformer2 Transducer 流式评测流水线为例,从「声音是什么」讲到 FBank 特征、Encoder/Decoder/Joiner 解码、流式推理与模型评测,并附带可运行的实验代码。

#人工智能#深度学习#算法
Google Widevine 及其工作原理

Google Widevine 是一种常用的 DRM 解决方案,支持 Android 操作系统、多种智能电视、浏览器等。Widevine 还支持 MPEG-DASH、HLS、MSS 以及 CENC 和 CMAF,这种广泛的支持使它成为视频传输中非常受欢迎的 DRM 解决方案。在本文中,我们将深入了解谷歌的 Widevine DRM 解决方案 —— 它是一种流行的 DRM 解决方案,在 Web 和移

文章图片
深度学习和神经网络之间有什么区别?

深度学习是一个人工智能(AI)相关领域,用于教计算机以受人脑启发的方式处理数据。深度学习模型可以识别复杂的图片、文本和声音等数据模式,从而生成准确的见解和预测。神经网络是深度学习的底层技术。它由分层结构中的互连节点或神经元组成。节点在协调的自适应系统中处理数据。它们会就生成的输出交换反馈,从错误中学习,然后持续地改进。因此,人工神经网络是深度学习系统的核心。深度学习和神经网络这两个术语可以互换使用

#深度学习#神经网络#人工智能
【3】Transformers快速入门:大语言模型LLM是啥?

(能写作文、编代码、答考题,甚至陪你聊人生),175B = 1750亿个脑细胞!

#语言模型#人工智能#自然语言处理
AI Agent 面试记录

按时间讲比堆关键词顺:multipart 与 Content-Length、断点与校验、落盘与临时目录、异步扫描别堵主链路、解析要流式、下游用 MQ 解耦、背压与限流、进度查询与清理审计。优化从「别一次性读进内存」说到 sendfile、mmap、worker 池,已经足够体面。

#人工智能#面试#职场和发展
RNN(循环神经网络)

RNN 的价值:首次实现序列数据的时序依赖建模,解决了 Word2Vec 忽略语序的问题;RNN 的关键:隐藏层的循环连接 + 权重共享,让模型能“记住”前面的时序信息;RNN 的致命缺陷:梯度消失/爆炸 → 无法处理长序列,这也直接催生了后续的 LSTM/GRU(用门控机制解决该问题)。

#rnn#人工智能#深度学习
最爱加班的岗位之一:AI模型部署转换、优化与量化

如果模型改写不可行,就需要为硬件引擎开发自定义算子。这需要熟悉硬件的指令集和编程模型,门槛较高。

#深度学习#机器人#目标检测 +1
10秒就能懂的「核心本质区别」Anchor-based VS Anchor-free

对你这个已经稳定落地的门禁闸机项目来说,YOLOv5的「有模板」设计,就是最稳妥、最省心、维护成本最低的选择。YOLOv8的「无模板」设计,虽然理论上精度上限更高,但需要你投入大量的时间调参、适配、排查问题,对于已经能稳定运行的生产设备来说,完全没必要。

#算法
1小时吃透YOLOv9核心创新|机器人场景轻量化适配指南

ELANv4骨干网络实现轻量化特征提取,C2fPN特征融合提升小目标检测精度,损失函数优化增强模型训练稳定性。与YOLOv8相比,YOLOv9在参数量减少15.6%的同时,推理速度提升17.9%小目标mAP提升3.4%,非常适合机器人室内小场景的目标检测任务。接下来的实操阶段,我将基于今天的理论学习,搭建Ultralytics8.0+PyTorch2.1环境,筛选COCO机器人场景子集,并进行YO

#机器人#人工智能#机器学习 +1
YOLOv8n机器人场景目标检测实战|第一周工作笔记1

基于Conda搭建Ultralytics8.0+PyTorch2.1专属环境,完成COCO2017机器人场景子集筛选(8000张,7000训+1000验),跑通YOLOv8n基础训练(epoch=50),小障碍物mAP≥65%,模型可正常输出推理结果,满足周验收全部目标。:全程使用Conda进行包管理与环境隔离,无pip命令使用,规避版本兼容问题;模型选用YOLOv8n(轻量化版本,适配机器人端算

#机器人#目标检测#人工智能 +2
    共 114 条
  • 1
  • 2
  • 3
  • 12
  • 请选择