logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【Keras】AveragePooling1D层和GlobalAveragePooling1D层

- 平均池化用于时序数据。- 下采样输入表示,通过对被定义为pool_size的窗口取平均值。窗口根据步长strides进行切换。- 当使用"valid" (padding)填充选项时,结果的输出的形状为:output_shape = (input_shape - pool_size + 1) / strides)inputs:一个三维的tensor。- mask:二元的tensor,它的shap

#keras#深度学习#python
【Keras】AveragePooling1D层和GlobalAveragePooling1D层

- 平均池化用于时序数据。- 下采样输入表示,通过对被定义为pool_size的窗口取平均值。窗口根据步长strides进行切换。- 当使用"valid" (padding)填充选项时,结果的输出的形状为:output_shape = (input_shape - pool_size + 1) / strides)inputs:一个三维的tensor。- mask:二元的tensor,它的shap

#keras#深度学习#python
【迁移学习】分布差异的度量以及迁移学习的统一表征方法

在文本分类中,由于文本数据有其**领域特殊性**,因此,在一个领域上训练的分类器,不能直接拿来作用到另一个领域上,这就需要用到迁移学习。**结构风险最小化**是统计机器学习中一个非常重要的概念。- SRM准测要求模型在你和训练数据的基础上,也要具有相对简单的复杂性(较低的VC维。领域(Domain)是学习的主体,主要由两部分构成: 数据 和 生成这些数据的概率分布。样本权重迁移法;特征变换迁移法;

#迁移学习#人工智能
【NLP】多语言预训练模型(mBERT和XLM)

融合多语言的预训练模型将不同语言符号统一表示在相同的语义向量空间内,从而达到跨语言处理的目的。它能够将多种语言表示在相同的语义空间中。通过HuggingFace提供的transformers库:使用区分大小写的多语言BERT-base模型(bert-base-multilingual-cased),任务为掩码填充,即将输入的[MASK]填充为具体的标记。语言自身存在混合使用,共享子词等特点:XLM

#自然语言处理#机器学习#人工智能
【PyTorch】生成对抗网络GAN入门

如何训练生成器:如果图像通过了鉴别器的检验,我们奖励生成器;如果伪造的图像被识破,我们惩罚生成器。这种架构叫做生成对抗网络(Generative Adversarial Network, GAN)。它利用竞争来驱动进步,并且,我们不需要定义具体的规则来描述要编码到损失函数中的真实图像,相反,我们让GAN自己来学习什么是真正的图像。生成1010格式规律

#pytorch#生成对抗网络#深度学习
【论文阅读】EssayGAN:基于生成对抗网络的数据增强用于自动作文评分

构建一个基于AES的深度学习系统,需要一个包含人为打分的训练数据集。本文介绍了EssayGAN,一个**基于生成对抗网络的自动文章生成器**。为了生成打分了的文本,EssayGAN有每个分数范围对应的生成器以及一个鉴别器。每个生成器致力于一个特定的分数,并且生成打分为该分数的文本。这样,生成器能够只关注于产生一个看起来实际可行的文章,这个文章能够欺骗鉴别器,使得鉴别器不用考虑目标分数。尽管普通文本

#论文阅读#生成对抗网络#深度学习
【论文阅读】自动作文评分系统:一份系统的文献综述

- 许多研究者在过去的几十年间都在致力于自动作文评分和简答题打分,但是通过像与提示之间的内容的相关性、思想的发展性、文章内聚力、文章连贯性等来评估一篇文章,到目前为止都是一项挑战。- 很少的研究者聚焦于基于内容的评分,他们中的大多数都强调基于风格的评分。- 我们观察到在内容和连贯性(coherence)方面对于文章评分的研究还没有完善。

#论文阅读#机器学习#人工智能
【数学建模】马氏链模型(基本概念+正则链+吸收链)

按照系统的发展,时间离散化为。,系统的状态用随机变量。对于有随机因素影响的动态系统,系统从这个时期到下个时期的状态按照一定的概率进行转移,并且下个时期的状态只取决于这个时期的状态和转移概率。- 无后效性:已知现在,将来与历史无关。- 具有无后效性,时间、状态均为离散的随机转移过程通常用马氏链模型描述。............

#概率论#机器学习#算法 +1
NLP 中文分词-双向匹配算法(理论+Python实现)

一、理论描述1.中文分词的概念:是指把没有明显分界标志的字串切分为词串,包括标点符号、数字、数学符号、各种标记、人名、地名、机构名等未登录词的识别。汉语自动分词主要包括:(1)根据分词规范,建立机器词典;(2)根据分词算法和机器词典,把字串切分为词串;(3)机器学习方法和统计方法。2.中文分词的重要性:汉语中词是最小的独立运用单位,分词是句法分析的基础,是所有应用系统进行的第一步,是其他中文信息处

【数学建模】离散模型(循环比赛的名次)

离散模型,图论,竞赛图,双向连通图,循环比赛的名次排序

#算法#数据结构
    共 15 条
  • 1
  • 2
  • 请选择