soejjdiwjssundo 个人主页

@soejjdiwjssundo

soejjdiwjssundo

2023-09-29 11:28:49 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

说的神马？基于 Wav2Vec2 的端到端中文语音识别系统

本项目是一个基于深度学习的中文语音识别系统，旨在将中文语音信号准确转换为对应的文本内容

#语音识别 #人工智能 #python

100种动物矩形框和分割数据集

本文介绍了一个包含100种动物的矩形框和分割数据集，填补了现有公开数据集在动物种类覆盖和样本量方面的不足。数据集包含11,354张图片，每类动物100-130张，采用AI辅助+人工修正的半自动标注方式，提供X-AnyLabeling JSON和VOC XML两种标注格式。数据获取严格遵循版权规范，从必应图片搜索下载并经过人工清洗。数据集结构清晰，包含图片文件夹和两种标注格式文件夹，适用于动物目标检

#目标跟踪 #人工智能 #计算机视觉

使用 Bert + ResNet101 混合模型处理多模态酒店评论

本项目基于多模态深度学习的情感分析系统，融合图像与文本双模态输入，通过改进的ResNet101(集成通道注意力机制) 解析酒店环境图片，实现八类主题属性识别和情感倾向检测，同时结合微调的中文Bert模型对评论文本进行六个维度的细粒度情感分析，因为使用的是文本和图像分别训练模型，然后综合计算得到情感倾向，所以项目支持图像、文本独立或联合推理。项目采用多任务学习架构，具备模块化设计、注意力增强、概率融

#bert #人工智能 #深度学习

车牌检测还手动裁？基于 YOLOv8 的车牌位置检测与裁剪

本文介绍了一种基于YOLOv8的车牌检测与识别系统。

#人工智能 #计算机视觉

基于 YOLOv8n 与 AttUNet 的胃息肉检测与分割

本文提出了一种基于YOLOv8n和AttUnet的两阶段胃息肉检测与分割方法。YOLOv8n采用无锚点设计，通过C2f模块和SPPF模块进行特征提取，实现高效息肉检测；AttUnet引入注意力门控机制，在Unet架构基础上提升分割精度。项目使用Kvasir-SEG数据集，包含内镜图像及对应的边界框和分割标注。系统首先通过YOLOv8n定位息肉区域，再利用AttUnet进行精细分割，为临床诊断提供辅

#python

说的神马？基于 Wav2Vec2 的端到端中文语音识别系统

本项目是一个基于深度学习的中文语音识别系统，旨在将中文语音信号准确转换为对应的文本内容

#语音识别 #人工智能 #python

基于 BiLSTM+自注意力机制(改进双塔神经网络) 的短文本语义匹配

本文介绍了一个基于改进双塔神经网络的语义匹配模型，该模型结合了BiLSTM、自注意力机制和卷积神经网络，用于判断两个句子在语义上的相似程度。

#神经网络 #人工智能 #深度学习

基于Transformer架构实现机器翻译

本项目采用深度学习方法，具体使用架构实现英文到中文的机器翻译任务。是一种基于自注意力机制的序列到序列（Seq2Seq）模型，专为高效处理长距离依赖和并行计算设计。其核心思想是通过多头注意力替代传统循环或卷积结构，实现全局上下文建模。主要由编码器(Encoder)和解码器(Decoder)组成，采用完全基于注意力机制的结构，摒弃了传统的循环神经网络。

#transformer #机器翻译 #深度学习

文本分类：基于BERT模型处理新闻分类

使用BERT模型完成基础的NLP新闻分类任务

#分类 #bert #数据挖掘

基于 CNN14 分辨 20 种食物咀嚼音

本项目开发了一个基于CNN14深度学习模型的食物声音分类系统，能够识别20种不同食物的咀嚼声音。系统采用梅尔频谱图作为音频特征表示，通过数据增强技术（时域拉伸和频谱掩蔽）提升模型泛化能力。CNN14模型包含6个卷积块和全局平均池化层，专为音频信号处理优化。

#python #语音识别

共 14 条

请选择