logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

机器视觉,算法优化

可提供的服务

计算机技术咨询,毕设指导、论文指导

使用新颖设计的双路径交互式融合模块模型增强图像中的视网膜血管结构分割

视网膜血管 视网膜形态学特征的分割和描绘 血管,例如长度、宽度、迂曲度、分支图案和 ANGLES 用于诊断、筛查、治疗和 评估各种心血管和眼科疾病,例如 糖尿病、高血压、动脉硬化和脉络膜 新生血管。脉管系统的自动检测和分析 可以协助实施糖尿病筛查计划 视网膜病变,可以帮助研究血管之间的关系 迂曲和高血压视网膜病变,血管直径测量 与高血压诊断和计算机辅助激光的关系 手术。自动生成视网膜图谱并提取分支

文章图片
#python#神经网络
人脸识别之数据集中 PI20 和 CFMT 之间关联的模型预测贝叶斯(Python+论文代码实现)

代码文件数据文件本文提供了许多数据文件,但它们作为原始数据的审计跟踪存在,这些数据被合并为用于分析的单个数据。IDAgeGenderPI20CFMT %Datasets 文件夹此文件夹包含来自其他 OSF 页面或通过与作者的个人通信的原始数据,从中获取相关值(年龄、性别、PI20 和 CFMT 分数)。我们这里的目标是测试 CFMT(人脸识别的客观测量)和 PI20(人脸识别的主观测量)之间的关联

文章图片
#python#开发语言#图像处理 +1
PMData:人工智能之运动记录数据集

我们提出了PMData:一个结合了传统的生活记录数据和运动活动数据的数据集。我们的数据集能够开发新的数据分析和机器学习应用程序,例如,额外的运动数据用于预测和分析日常发展,比如一个人的体重和睡眠模式;以及在运动环境中用传统生命数据预测运动员表现的应用程序。PMData结合了来自Fitbit Versa 2智能手表腕带、PMSys运动日志智能手机应用程序和谷歌表单的输入。收集了5个月的记录数据。我们

文章图片
#人工智能#算法
EffRes-DrowsyNet:结合 EfficientNetB0 与 ResNet50 的新型混合深度学习模型用于驾驶员疲劳检测算法实现

EffRes-DrowsyNet混合深度学习模型,结合EfficientNetB0与ResNet50的优势,在驾驶员疲劳检测任务中表现卓越。模型在SUST-DDD数据集上达到97.71%准确率,在YawDD和NTHU-DDD数据集分别取得92.73%和95.14%的准确率。通过融合手工特征(EAR/MAR)与深度特征,模型实现了计算效率与检测精度的平衡。

文章图片
#深度学习#人工智能
利用面部情绪识别和AI技术给中老年人推荐电影,故事,音乐和生成图片

本项目在老年人医疗保健中创新应用面部识别技术,通过分析视频面部表情每5秒提取情绪并分类,利用自有数据集训练的模型处理评估,将情绪存时间序列数据库生成报告可视化,结合后端脚本、外部API及API控制器,形成全面情感关怀方案,提升老年人情感福祉

文章图片
#人工智能#AI
基于MLLMs的3D医学图像分析(Python代码实现+数据可视化分析)

医学图像分析对临床诊断和治疗至关重要,而多模态大语言模型(MLLMs)的应用日益广泛。然而,先前研究主要集中于2D医学图像,尽管3D图像蕴含更丰富的空间信息,但其分析仍处于探索不足的领域。本文旨在推动基于MLLMs的3D医学图像分析。为此,我们构建了大规模3D多模态医学数据集M3D-Data,包含12万图像-文本对和66.2万指令-响应对,覆盖图像-文本检索、报告生成、视觉问答、定位与分割等多种任

文章图片
#python#信息可视化#开发语言
基于提示驱动的潜在领域泛化的医学图像分类方法(Python实现代码和数据分析)

无监督领域发现:基于ViT浅层CLS令牌的风格特征聚类生成伪领域标签;领域提示学习:通过领域提示生成器与混合策略优化模型,提升跨领域泛化能力。

文章图片
#分类#数据挖掘#人工智能
Magic 1-For-1: 在一分钟内生成一分钟视频片段(基于Python实现,视频生成模型)

在本技术报告中,我们介绍了 Magic 1-For-1 (Magic141),这是一种高效的视频生成模型,具有优化的内存消耗和推理延迟。关键思想很简单:将文本到视频生成任务分解为两个单独的更简单的扩散步骤蒸馏任务,即文本到图像生成和图像到视频生成。我们验证了使用相同的优化算法,image-to-video 任务确实比 text-to-video 任务更容易收敛。我们还从三个方面探索了一系列优化技巧

文章图片
#音视频#python#开发语言
基于深度学习的情绪识别检测系统【完整版】

多模态情绪识别融合人脸、语音等多源数据,通过CNN、LSTM等模型提取视觉(表情)与听觉(语音语调)特征,经融合算法综合分析情绪。可实现图片、视频、实时摄像头的静态/动态检测,输出情绪类别及百分比,提升复杂场景识别精度,广泛应用于智能交互、心理分析等领域。

文章图片
#深度学习
基于深度学习的多模态人脸情绪识别研究与实现(视频+图像+语音)

这是一个结合图像和音频的情绪识别系统。确定完整系统的组成部分:数据收集与处理、模型设计与训练、多模态融合、系统集成、部署优化、用户界面等。详细说明,还要给出详细的代码框架和工具。包括如何处理实时数据流,如何同步音频和视频,以及如何解决实际中的噪声和计算资源限制问题。另外,对评估指标和调优方法给出具体实现过程和代码,以确保系统在实际中的效果。构建一个完整的端到端多模态情绪识别系统(图像+音频),需要

文章图片
#深度学习#人工智能
    共 40 条
  • 1
  • 2
  • 3
  • 4
  • 请选择