介绍

Python 包只是一个有组织的 Python 模块集合。 python 模块是一个单独的 python 文件。

结构 根据您希望包具有的模块数量,您必须引入导入功能。

在本教程中,我们将构建一个自然语言处理 (spacy) 函数,该函数标记文本并生成一个 CSV 文件作为输出文件。这个包是一个 python 包,因此将与 pip 一起安装。您加载文本数据框、spacy 模型和输出文件的名称。包将处理结果并输出文件。

下面是一个python函数作为包的结构

struscture.png现在您将创建一个文件夹并将其命名为标签,在文件夹内创建一个文件并将其命名为setup.py。然后在标签文件夹中创建另一个文件夹并将其命名为 text_labels,在 text_labels 文件夹中创建 init .py 和label.py文件。然后,您将在以下步骤中向它们添加内容。

创建setup.pysetup.py是 setuptools 的构建脚本。它告诉 setuptools 您的包(例如名称和版本)以及要包含的代码文件。

打开setup.py,输入以下内容。更新包名称以包含您的用户名,这可确保您拥有唯一的包名称,并且您的包不会与其他人按照本教程上传的包冲突。

setup.pngname - 是你的包的发行版名称。这可以是任何名称,只要仅包含字母、数字、_ 和 -。它也不能在pypi.org上使用。请务必使用您的用户名进行更新,因为这样可以确保您不会尝试上传与上传包时已经存在的包同名的包。

version - 是软件包版本,有关版本的更多详细信息,请参阅 PEP 440。 authorauthor_email 用于标识包的作者。 description 是对软件包的简短的一句话总结。

description - 是包的详细描述。这显示在 Python 包索引的包详细信息页面上。在这种情况下,长描述是从README.md加载的,这是一种常见的模式。

url - 是项目主页的 URL。对于许多项目,这只是指向 GitHub、GitLab、Bitbucket 或类似代码托管服务的链接。

packages - 是应包含在分发包中的所有 Python 导入包的列表。我们可以使用 find_packages() 自动发现所有包和子包,而不是手动列出每个包。在这种情况下,包列表将是 example_pkg,因为这是唯一存在的包。

install_requires - 需要(必须安装)包才能工作的 python 包。

创建 init .py

init .py 是作为包导入目录所必需的,可以简单地是一个空文件。在 init .py 文件中,我们从 .label 导入 taxt_labels。这意味着我们从label.py文件中导入函数文件中显示的 text_labels 函数

init.png

功能

label.png创建完成后,打开终端,导航到标签文件夹并运行 pip install . 包应该能够安装。加载时,运行 from text_labels import text_labels

加载后使用包:text\labels("path_to\df",'model','name\of_your_choice')

当模型完全处理您的数据时,将创建 name\of\your\choice.CSV 文件。

玩得开心!

Logo

学AI,认准AI Studio!GPU算力,限时免费领,邀请好友解锁更多惊喜福利 >>>

更多推荐