logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

A Survey of Camouflaged Object Detection and Beyond论文阅读笔记

本文旨在对伪装目标检测(COD)领域进行迄今为止最全面的综述。与传统目标检测(GOD)和显著目标检测(SOD)不同,COD专注于检测那些与背景高度融合、难以察觉的目标,极具挑战性。核心贡献:全面性: 涵盖了约180篇前沿研究,包括图像和视频级别的COD,并延伸至相关的伪装场景理解任务。系统性基准测试: 对40个图像模型和8个视频模型在6个数据集和6个评估指标上进行了定量和定性分析。前瞻性指导: 系

文章图片
#目标检测#人工智能#计算机视觉 +1
Win11系统安装Anaconda环境极简教程

《Win11安装Anaconda简明指南》摘要:本文详细介绍了在Win11系统安装Anaconda的完整流程。首先推荐下载Python 3.11版本,强调要选择64位安装包。安装过程中需注意勾选"Register Anaconda3"选项,建议更改默认安装路径。安装后需手动配置环境变量,包含Python、conda脚本等关键路径。最后通过Anaconda Prompt验证安装,

文章图片
#人工智能#conda#python
Coze平台历史人物视频生成项目笔记

这是一个基于Coze平台的智能体开发项目,能够根据用户输入的历史人物名称,自动生成该人物的生平视频。项目通过多步骤的AI处理流程,将文字描述转化为生动的视频内容。(本项目中使用的图像生成和视频生成都是Coze平台的付费功能,需要自行充值资源点才能使用)

文章图片
#AIGC#人工智能#工作流 +1
Stable Diffusion详解

Stable Diffusion是一种基于潜在扩散模型的AI图像生成技术,由Stability AI等团队开发并于2022年开源。它通过扩散过程(加噪/去噪)在潜空间中进行高效运算,大幅降低计算需求。核心组件包括CLIP文本编码器、U-Net去噪网络和VAE解码器,支持文生图、图生图等功能。主要优势包括快速出图(3秒/张)、本地运算保障数据安全、强大的可扩展性(支持110+插件)。该技术在创意设计

文章图片
#人工智能#深度学习
深度学习(鱼书)day04--手写数字识别项目实战

鱼书的相关源代码下载:点击链接:http://www.ituring.com.cn/book/1921点击“随书下载”第三项就是源代码:解压后,在pycharm(或其它IDE)中打开此文件夹查看或运行即可。(红框内是本人自建的文件)

文章图片
#深度学习#人工智能#神经网络 +1
Stable Diffusion详解

Stable Diffusion是一种基于潜在扩散模型的AI图像生成技术,由Stability AI等团队开发并于2022年开源。它通过扩散过程(加噪/去噪)在潜空间中进行高效运算,大幅降低计算需求。核心组件包括CLIP文本编码器、U-Net去噪网络和VAE解码器,支持文生图、图生图等功能。主要优势包括快速出图(3秒/张)、本地运算保障数据安全、强大的可扩展性(支持110+插件)。该技术在创意设计

文章图片
#人工智能#深度学习
Camouflage Anything Learning to Hide using Controlled Out-painting and Representation论文笔记

本文提出了一种创新的伪装图像生成框架Camouflage Anything,通过控制外绘和表示增强技术实现了高质量的伪装图像生成。研究贡献包括:1)开发了集成ControlNet和CLIP表示增强的生成框架;2)设计了基于最优传输的CamOT评估指标,专门量化伪装效果;3)提出BiRefNet+LoRA微调策略,提升了检测模型在未知场景的泛化能力。实验表明,该方法在生成质量和伪装效果上优于现有技术

文章图片
#深度学习#论文阅读#人工智能 +1
深度学习(鱼书)day08--误差反向传播(后三节)

本文介绍了深度学习中的误差反向传播算法,重点讲解了激活函数层和Affine层的实现。在激活函数层部分,详细分析了ReLU层和Sigmoid层的前向传播和反向传播过程,包括数学表达式和Python实现代码。ReLU层通过mask机制实现开关功能,Sigmoid层则通过计算图分解步骤进行求导。在Affine层部分,解释了矩阵乘积运算的仿射变换性质,展示了单个数据和批处理数据的实现方式,并给出了相应的类

文章图片
#深度学习#人工智能#神经网络 +1
深度学习(鱼书)day04--手写数字识别项目实战

鱼书的相关源代码下载:点击链接:http://www.ituring.com.cn/book/1921点击“随书下载”第三项就是源代码:解压后,在pycharm(或其它IDE)中打开此文件夹查看或运行即可。(红框内是本人自建的文件)

文章图片
#深度学习#人工智能#神经网络 +1
深度学习(鱼书)day01--感知机

本文介绍了感知机的基本概念及其在逻辑电路中的应用。感知机是一种接收多个输入信号并输出单一信号的神经网络基础模型,通过权重和阈值控制信号传递。文章详细阐述了与门、与非门和或门的实现方法,展示了如何通过调整参数实现不同逻辑功能。同时指出了单层感知机的局限性——无法表示非线性空间如异或门。最后提出多层感知机的解决方案,通过叠加感知机层实现异或门功能,为神经网络和深度学习奠定基础。

文章图片
#深度学习#人工智能#python
    共 16 条
  • 1
  • 2
  • 请选择