logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

github 项目上传

github 项目上传。

文章图片
#github
AttributeError: module ‘mediapipe‘ has no attribute ‘solutions‘

MediaPipe 0.10.0 版本起进行了 API 重大重构,主要变化包括: 废弃旧版 solutions 模块,改用 tasks 模块 + vision/text/audio 子模块 需下载本地模型文件(.task 格式)替代原内置模型 初始化方式和输入输出格式完全改变 解决方案: 方案1:降级到 0.9.1 版本(需处理依赖冲突) 方案2:迁移到新版 API,需注意: 必须下载对应模型文件

文章图片
#人工智能#深度学习#计算机视觉
红外-可见光融合的显著目标检测【1】-Multi-Interactive Dual-Decoder for RGB-Thermal Salient Object Detection

文章摘要 本文提出了一种多交互双解码器架构用于RGB-热成像显著目标检测(RGBT SOD)。针对现有方法未能充分利用多模态互补信息的问题,作者设计了双解码器结构,通过多交互模块(MIB)实现模态间特征、多级特征和全局上下文之间的交互。该方法具有三大创新点:(1)在解码阶段进行模态融合,比编码阶段融合更易优化;(2)统一集成多类型交互形成鲁棒特征表示;(3)采用数据增强策略模拟无效模态情况提升模型

#目标检测#人工智能#计算机视觉
【神经网络】 神经网络基础

机器学习、深度学习、神经网络 这几个相似名词,可以浅浅辨析一波。机器学习是一个广泛的概念,它包括了各种让计算机从数据中学习的技术和方法。神经网络是机器学习中的一个特定领域,它使用类似于人脑神经元的节点和连接来模拟学习过程。深度学习则是神经网络的一个子集,它利用多层神经网络结构来学习数据的深层表示,并在许多任务上取得了显著的性能提升。简而言之,机器学习是一个大的领域,神经网络是机器学习的一个子集,而

文章图片
#神经网络#人工智能#深度学习
AI Angent=智能体?

大语言模型大模型多模态大模型AI Agent智能体提示:以下是本篇文章正文内容,下面案例可供参考为什么研究随着模型和数据集的规模不断扩大,传统的MM 模型会产生大量计算成本关键问题不同类别的大模型都被单独训练过了, 那核心挑战是如何有效地将其他模式的LLM 算法模型连接起来,以实现协同工作。研究内容最初的研究主要集中在 MM 内容理解和文本生成方面,例如:图像-文本理解等任务此外还有视频-文本理解

文章图片
#人工智能
到底了