项目地址 https://github.com/imhuster/Enterprise-Registration-Data-of-Chinese-Mainland

今天逛github看到一个名叫Enterprise-Registration-Data-of-Chinese-Mainland的项目,该项目收集了中国大陆 31 个省份1978 年至 2019 年一千多万工商企业注册信息,包含企业名称、注册地址、统一社会信用代码、地区、注册日期、经营范围、法人代表、注册资金、企业类型等详细资料。

数据以 CSV 、Excel 及 JSON 三种文件类型存储,相应文件分别保存在

  • Enterprise-Registration-Data/csv

  • Enterprise-Registration-Data/xls

  • Enterprise-Registration-Data/json

三个分支中。

其中 CSV 与 Excel 均为utf-8编码,格式为:

企业名称、统一社会信用代码、注册日期、企业类型、法人代表、注册资金、经营范围、所在省份、地区、注册地址

JSON 的编码为 UTF-8,文件格式如下:

{	
    "name":"企业名称",	
    "code":"统一社会信用代码",	
    "registrationDay":"注册日期",	
    "character":"企业类型",	
    "legalRepresentative":"法人代表",	
    "capital":"注册资金",	
    "businessScope":"经营范围",	
    "province":"所在省份",	
    "city":"地区",	
    "address":"注册地址"	
}

引用方式:

如果您需要在论文中引用本数据集,您可以使用下列引用格式进行引用:

刘文. 中国大陆企业工商注册信息数据集[EB/OL].https://github.com/imhuster/Enterprise-Registration-Data-of-Chinese-Mainland, 2019-06-01.

推荐阅读

【视频课】文本数据分析快速入门

2019Stata & Python 实证计量与爬虫分析暑期工作坊

让pandas处理大数据速度变快的三个技巧

datatable:比pandas更快的GB量级的库   

国人开发的数据可视化神库 pyecharts

pandas_profiling:生成动态交互的数据探索报告

cufflinks: 让pandas拥有plotly的炫酷的动态可视化能力

使用Pandas、Jinja和WeasyPrint制作pdf报告

使用Pandas更好的做数据科学

使用Pandas更好的做数据科学(二)

少有人知的python数据科学库

folium:地图数据可视化库

学习编程遇到问题,该如何正确的提问?

如何用Google Colab高效的学习Python

大神kennethreitz写出requests-html号称为人设计的解析库

flashtext:大规模文本数据清洗利器

640?wx_fmt=png


Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐