
简介
该用户还未填写简介
擅长的技术栈
可提供的服务
暂无可提供的服务
本项目基于多模态深度学习的情感分析系统,融合图像与文本双模态输入,通过改进的ResNet101(集成通道注意力机制) 解析酒店环境图片,实现八类主题属性识别和情感倾向检测,同时结合微调的中文Bert模型对评论文本进行六个维度的细粒度情感分析,因为使用的是文本和图像分别训练模型,然后综合计算得到情感倾向,所以项目支持图像、文本独立或联合推理。项目采用多任务学习架构,具备模块化设计、注意力增强、概率融

本文介绍了一种基于YOLOv8的车牌检测与识别系统。

本文提出了一种基于YOLOv8n和AttUnet的两阶段胃息肉检测与分割方法。YOLOv8n采用无锚点设计,通过C2f模块和SPPF模块进行特征提取,实现高效息肉检测;AttUnet引入注意力门控机制,在Unet架构基础上提升分割精度。项目使用Kvasir-SEG数据集,包含内镜图像及对应的边界框和分割标注。系统首先通过YOLOv8n定位息肉区域,再利用AttUnet进行精细分割,为临床诊断提供辅

本项目是一个基于深度学习的中文语音识别系统,旨在将中文语音信号准确转换为对应的文本内容

本文介绍了一个基于改进双塔神经网络的语义匹配模型,该模型结合了BiLSTM、自注意力机制和卷积神经网络,用于判断两个句子在语义上的相似程度。

本项目采用深度学习方法,具体使用架构实现英文到中文的机器翻译任务。是一种基于自注意力机制的序列到序列(Seq2Seq)模型,专为高效处理长距离依赖和并行计算设计。其核心思想是通过多头注意力替代传统循环或卷积结构,实现全局上下文建模。主要由编码器(Encoder)和解码器(Decoder)组成,采用完全基于注意力机制的结构,摒弃了传统的循环神经网络。

使用BERT模型完成基础的NLP新闻分类任务

本项目开发了一个基于CNN14深度学习模型的食物声音分类系统,能够识别20种不同食物的咀嚼声音。系统采用梅尔频谱图作为音频特征表示,通过数据增强技术(时域拉伸和频谱掩蔽)提升模型泛化能力。CNN14模型包含6个卷积块和全局平均池化层,专为音频信号处理优化。

使用BERT模型完成基础的NLP新闻分类任务

本项目实现了一个基于Flask和MySQL的期货数据分析系统,主要功能包括期货市场涨跌统计、每日市场观点分析、PDF报告生成与数据筛选。项目采用模块化设计,包含数据格式转换、特征提取、数据库存储和可视化展示全流程。数据集仅供学习使用,强调不可商用盈利。








