logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

探索文档解析技术,推动大模型训练与应用

探索文档解析技术是推动大模型训练与应用的重要一环。在本节中,我们将回顾来自合合信息的智能创新事业部研发总监常扬在中国图象图形大会 (CCIG 2024) 中关于文档解析技术加速大模型训练与应用的分享,介绍大模型训练和应用过程的关键环节面临的挑战,探索当前高性能的文档解析技术。

文章图片
#人工智能
文心千帆大模型平台,一站式企业级大模型平台

随着人工智能技术的不断发展,尤其是深度学习技术的广泛应用,大模型训练已成为当下研究的热点之一,随着计算能力的不断提升和数据规模的不断增加,大模型展现出了惊人的能力,能够处理更加复杂和庞大的任务。从计算机视觉到自然语言处理,从语音识别到推荐系统,大模型正逐渐为多个领域取得突破性成果的重要基础。在本文中,我们将深入探讨大模型的概念、应用和挑战,并详细介绍百度智能云的大模型平台,通过实际体验来感受大模型

文章图片
#人工智能#深度学习
多模态大模型时代下的文档图像智能分析与处理

随着人工智能技术的不断发展,尤其是深度学习技术的广泛应用,多模态数据处理和大模型训练已成为当下研究的热点之一,这些技术也为文档图像智能处理和分析领域带来了新的发展机遇。在本节中,回顾来自中科院自动化研究所、北京大学、中科大的学术专家与合合信息等知名企业的研究者在中国图形图像大会 (CCIG 2023) 关于文档图像分析与处理的相关分享,介绍在多模态大模型时代下文档图像智能分析与处理技术的最新进展和

文章图片
#人工智能#机器学习#计算机视觉
TensorFlow实现自注意力机制(Self-attention)

自注意力机制 (Self-attention) 随着自然语言处理 (Natural Language Processing, NLP) 模型(称为“Transformer”)的引入而变得流行。可以利用自注意力来观察特征图中的每个像素,并将注意力集中在更加重要的像素上。

#深度学习#神经网络#机器学习 +1
ACGAN(Auxiliary Classifier GAN)详解与实现(tensorflow2.x实现)

ACGAN的原理GAN(CGAN)相似。对于CGAN和ACGAN,生成器输入均为潜在矢量及其标签,输出是属于输入类标签的伪造图像。对于CGAN,判别器的输入是图像(包含假的或真实的图像)及其标签, 输出是图像属于真实图像的概率。对于ACGAN,判别器的输入是一幅图像,而输出是该图像属于真实图像的概率以及其类别概率。

文章图片
#tensorflow#深度学习#python +1
图文详解WGAN及其变体WGAN-GP并利用Tensorflow2实现WGAN与WGAN-GP

自GAN提出以来,许多论文尝试通过使用启发式方法(例如尝试不同的网络体系结构,超参数和优化器)来解决GAN训练的不稳定性。WGAN缓解甚至消除了许多GAN训练过程中存在的问题。相较于原始GAN的其根本的改进是对损失函数的修改。从理论上讲,如果两个分布不相交,则JS散度将不再是连续的,因此将不可微,从而导致梯度为零。 WGAN通过使用一个新的损失函数来解决此问题,该函数在任何地方都是连续且可微的!本

#深度学习#python#人工智能 +1
TensorFlow2 实现神经风格迁移,DIY数字油画定制照片

图像可以分解为内容和风格,内容描述了图像中的构成,例如图像中的花草树木,风格是指图片的细节,例如湖面的纹理和树木的颜色。在一天的不同时间同一建筑的照片具有不同的色调和亮度,可以被视为具有相同的内容但风格不同。神经风格迁移使用CNN将一幅图像的艺术风格转移到另一幅图像。神经风格迁移仅需要两个图像——内容图像和样式图像。可以使用经过训练的CNN模型(例如VGG)将风格从风格图像迁移到内容图像上。

#计算机视觉#神经网络#深度学习 +2
CycleGAN详解与实现(采用tensorflow2.x实现)

源域中的图像通过变换转移到目标域,从而生成新的转换图像。使用跨域转换,可以通过转换现有图像来生成接近真实的新合成图像。与其他跨域转换算法(如pix2pix)不同,CycleGAN不需要成对的训练图像即可工作。在成对的图像中,训练数据应该是由源图像及其对应的目标图像组成的一对图像。

#计算机视觉#深度学习#机器学习 +2
TensorFlow实现去噪自编码器(Denoising Autoencoder)

当我们在夜晚拍照时,或者其他黑暗环境时,我们的照片总是被大量的噪点所充斥,严重影响了图像质量,而去噪自编码器 (Denoising Autoencoder, DAE) 的目的就是用来去除这些图像中的噪声。本文将利用Tensorflow2实现使用 MNIST 数据集的 DAE。

#深度学习#tensorflow#计算机视觉
OpenCV 编译安装与环境配置

OpenCV 是一个开源库,可以用于开发在 Windows、Linux、Android 和 macOS 等平台上运行的计算机视觉应用程序。自 1999 年推出以来,它已成为计算机视觉领域广泛采用的主要开发工具。在开始使用 OpenCV 之前,首先需要安装该库。

文章图片
#opencv
    共 52 条
  • 1
  • 2
  • 3
  • 6
  • 请选择