logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

万字解析!一文带你了解卷积神经网络(CNN)各层的基本知识以及作用

在 CNN 结构中,经多个卷积层和池化层后,连接着1个或1个以上的全连接层.与 MLP 类似,全连接层中的每个神经元与其前一层的所有神经元进行全连接,全连接层可以整合卷积层或者池化层中具有类别区分性的局部信息,为了提升 CNN 网络性能,全连接层每个神经元的激活函数(按你的任务目的选择,分类or回归)。边缘填充:在这里还要注意一点,即zero pad项,即为图像加上一个边界,边界元素均为0,这就叫

文章图片
#人工智能#神经网络#计算机视觉 +3
入门深度学习必须掌握的五大算法模型!

在深度学习技术日新月异的今天,掌握具有里程碑意义的五大核心算法架构,是突破技术瓶颈与拓展应用场景的关键。

文章图片
#深度学习#人工智能#机器学习 +3
复活CNN!港大 CVPR 2025 高分论文,助力卷积神经网络效率暴涨还省显存!

在深度学习蓬勃发展的当下,卷积神经网络视觉基础模型正不断拓展着视觉处理领域的边界。这些模型如同精密的视觉感知引擎,深度挖掘图像、视频中的关键信息,在安防监控、自动驾驶、医疗影像分析等诸多领域发挥着不可替代的作用。其中港大研究人员这篇入选CVPR 2025的高分论文,提出新型纯CNN架构OverLoCK借鉴人类视觉系统“先概览后细察”的运作模式,创新性地采用深度阶段分解策略(DDS)与上下文混合动态

文章图片
#cnn#人工智能#神经网络 +4
深度学习最强模型!挑战一篇文章让你理解什么是Transformer模型!从原理到代码的详细讲解!

从最初的机器翻译到如今的多模态大模型,Transformer 凭借注意力机制的革命性创新,重新定义了深度学习的可能性。其核心价值不仅在于技术突破,更在于构建了一个通用的序列建模框架,使得跨领域迁移学习成为可能。未来,随着注意力机制的持续优化(如动态稀疏注意力、因果推理增强)和硬件加速技术的发展,Transformer 有望在自动驾驶、科学发现等更复杂场景中发挥关键作用,推动人工智能向通用化迈进。附

文章图片
#计算机视觉#深度学习#人工智能 +3
一文总结:强化学习算法——强化学习中的 Transformer

该图展示了训练强化学习代理的高级流程。代理从环境中获取状态和奖励,并据此决定采取哪些行动。强化学习与机器学习和深度学习的区别在于训练结构。广义上讲,强化学习是指训练一个代理(或模型)在特定环境中执行特定任务。与监督学习等更常见的深度学习和机器学习方法不同,强化学习使用奖励而非损失。奖励可以有效地理解为代理在整个训练过程中学习最大化的值。如何分配奖励可以有无数种形式,并且是许多领域的一个活跃研究领域

文章图片
#算法#transformer#深度学习 +3
可以说这10本深度学习算法书籍,是大家公认的最好的入门AI算法电子书!

书籍 PDF+人工智能算法籽料包合集,自行或取学习!!学习深度学习知识除了博客文章、视频外,从书本中汲取知识也非常重要。那么今天就给大家推荐下面这几本深度学习领域的极佳书籍!希望对你有帮助!书籍 PDF+人工智能算法籽料包合集,自行或取学习!!

文章图片
#人工智能#机器学习#目标检测 +3
深度揭秘!2025计算机视觉的 “顶流” 研究方向

计算机视觉作为人工智能领域的关键分支,始终处于技术创新的前沿,现已经广泛应用于医疗、自动驾驶、安防、娱乐、工业等多个领域。在 2025 年 CVPR 论文中,出现了众多围绕视觉 - 语言模型融合、多模态学习等方向的创新成果。这些论文正代表了计算机视觉的前沿动态。我整理了100篇【2025CVPR】热门论文,希望能帮助各位寻找创新点!多模态学习的目标是使模型能够同时理解和生成多种类型的模态信息,例如

文章图片
#计算机视觉#人工智能#机器学习 +3
一网打尽!5大深度学习模型!RNN、CNN、Transformer、BERT、GPT

从 RNN 的时序记忆到 GPT 的生成革命,深度学习模型的演进始终围绕 “如何更高效地提取数据特征” 这一核心命题。开发者可根据任务特性(如图像 vs 文本、理解 vs 生成)选择适配模型,同时关注 Transformer 架构的持续创新 —— 这一 “万能基底” 正不断突破模态边界,引领 AI 从 “专项智能” 迈向 “通用智能”。未来,模型的性能提升将更多依赖数据质量、训练策略与工程优化的协

文章图片
#深度学习#自然语言处理#机器学习 +3
强烈推荐18 个最佳计算机视觉图像标注工具(2025版)

Encord 的评分为 4.8/5(基于 60 条评论)。用户更青睐 Encord 强大的本体功能,该功能能够为各种规模的数据定义丰富的分类法。此外,该平台的协作功能和精细的注释工具有助于用户提升注释质量。Amazon SageMaker Ground Truth 的评分为 4.1/5(基于 19 条评论)。用户喜欢它的易用性和高级注释功能。然而,他们认为它价格昂贵,而且追踪标记性能具有挑战性。S

#计算机视觉#人工智能#transformer +4
11种常用的深度学习图像分割模型(介绍 + 代码)

图像分割是计算机视觉领域的一项关键任务,其中图像中的每个像素被分配给特定的类别或对象。近年来,随着深度学习的发展,图像分割技术取得了长足的进步。本文将介绍11种常用的深度学习模型,帮助你理解和掌握这些强大的工具。【戳下面蓝字,即可跳转到学习页面】U-Net 是一个经典的图像分割模型,最初设计用于生物医学图像分割。其架构采用编码器-解码器结构,通过跳跃连接将低级特征传递到更高级别,从而保留更详细的信

文章图片
#深度学习#人工智能#目标检测 +4
    共 94 条
  • 1
  • 2
  • 3
  • 10
  • 请选择