㫪243 个人主页

@qq_68079921

㫪243

2023-11-28 16:32:22 加入 DevPress

简介

该用户还未填写简介

擅长的技术栈

未填写擅长的技术栈

可提供的服务

暂无可提供的服务

自然语言处理中的机器翻译

最后，在所有参考翻译结果的分数的最大值并除以机器翻译结果的总长度，作为机器翻译的准确率。这段代码的说明了read_data函数的功能：从一个文本文件中读取输入输出序列对，对每一对序列进行预处理以符合模型处理的要求（如限制序列长度、构建词汇表、转换为索引张量等），最后返回处理后的输入输出词汇表以及一个包含输入输出数据对的TensorDataset对象，为后续的机器翻译或其他序列到序列学习任务做准备。

#自然语言处理 #机器翻译 #人工智能

基于Transformer实现机器翻译（日译中）

函数首先遍历给定的日语和英语句子列表，对每一对句子进行以下处理步骤：去除行尾换行符，使用对应的分词器进行编码，然后将每个token（单词或子词）转换为词汇表中的索引，并将这些索引构建成Long类型的PyTorch张量。这两个类共同作用于NLP模型的输入层，其中TokenEmbedding负责将单词转换为词嵌入，而PositionalEncoding则在此基础上添加位置信息，两者结合使模型能够理解文

#transformer #机器翻译

到底了