Zero-Shot介绍（附代码示例）

该博客主要介绍了 Zero-Shot Learning 和 Zero-Shot Text Classification 的概念和应用，以及使用 Hugging Face 的 Transformers 库进行 Zero-Shot Text Classification 的示例源代码。这些技术的出现极大地扩展了机器学习和自然语言处理的应用场景，未来这些技术将在自然语言处理领域的许多实际应用中发挥重要作

文章共1,127字 · 阅读需要大约4分钟

一键AI生成摘要，助你高效阅读

问答

饕子

2147人浏览 · 2023-04-30 11:50:34

饕子 · 2023-04-30 11:50:34 发布

Zero-Shot

在自然语言处理(NLP)领域，Zero-Shot指的是一个模型在没有接受过特定任务的训练数据的情况下，可以完成该任务。这个概念近年来引起了广泛关注。

Zero-Shot Learning

Zero-Shot Learning (ZSL) 是一种机器学习的方法，能够帮助模型从没有见过的语言环境中、在没有标记的训练数据下学习并完成任务。ZSL 的基本思想是，通过学习对象（例如图像）与语义嵌入之间的映射关系，在新的测试样本上进行推理。

在传统的监督学习中，需要为每个任务提供训练样本和标签，但是在实际应用中，很难进行全面的标注和收集，所以 ZSL 的出现极大地扩展了机器学习的应用场景。

Zero-Shot Text Classification

在NLP领域，Zero-Shot Text Classification (ZSTC) 是一种将文本分类器应用于未见过的类别或主题（例如，对疫情新闻进行情感分析，但是该分类器没有接受过疫情主题的训练），这是一种非常有用的技术。ZSTC 的核心是利用预训练的语言模型，通过建立文本与语义嵌入之间的映射关系来完成任务。

ZSTC 的优点是可以快速建立新的分类器，不需要收集或标注训练数据，并且易于扩展到新的领域和语言。这使它成为处理实际应用中自然语言文本分类任务的一种理想方法。

Zero-Shot Learning和Zero-Shot Text Classification的未来

随着自然语言处理技术和硬件设备的发展，Zero-Shot Learning和Zero-Shot Text Classification作为一种非常有前途的自然语言处理技术将持续受到关注和研究。未来，我们有理由相信他们将在自然语言处理领域的许多实际应用中发挥重要作用。

Zero-Shot 示例

import torch
from transformers import pipeline, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("facebook/bart-large-mnli")
model = pipeline("text-classification", model="facebook/bart-large-mnli")

text = "I love playing basketball."
labels = ["sports", "politics", "entertainment"]
hypothesis_template = "This text is about {}."

# zero-shot classification
result = model(text, labels=labels, hypothesis_template=hypothesis_template)

print(result)

在这段代码中，我们使用了 Hugging Face 的 Transformers 库来完成 Zero-Shot Text Classification。我们首先加载了预训练模型 facebook/bart-large-mnli的 tokenizer：AutoTokenizer.from_pretrained("facebook/bart-large-mnli")，以及分类器：pipeline("text-classification", model="facebook/bart-large-mnli")。其中，encoder_decoder 模型是一个基于 Transformer 的模型，其在自然语言处理领域有出色的表现。

接下来，我们定义需要分类的文本 text，以及我们想要进行分类的类别列表 labels。在这里，我们选择 “sports”、“politics” 和 “entertainment” 三个类别。

然后，我们定义了一个假设模板 hypothesis_template，该模板可以转化成不同的假设模板来完成文本分类。在这里，我们把 “{}” 替换为每个类别名来得到不同的假设模板。将 text、labels 和 hypothesis_template 作为参数传入 model，就可以进行 Zero-Shot Text Classification。

最后，我们打印输出了分类结果。对于每个类别标签，model 输出了该文本属于该类别的概率。