logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

【上市公司文本分析】python+selenium实现根据股票代码和对应年份获取上市公司年报链接(巨潮资讯网)

本文介绍了一种从巨潮资讯网批量获取A股上市公司年报数据的方法。该方法通过Selenium模拟浏览器操作,自动查询指定股票代码和年份的年报链接,并将结果保存到Excel中。文章详细说明了环境配置、代码结构、关键函数实现及注意事项,包括XPath定位、防反爬机制和文件处理等。适用于需要定向获取特定公司或行业年报数据的场景,建议网络环境良好时运行,并给出了完整Python代码实现。对于批量获取全市场数据

文章图片
【上市公司变量测量】Python+FactSet Revere全球供应链数据库,测度供应链断裂与重构变量——丁浩员等(2024)《经济研究》复现

丁浩员等在《经济研究》2024年第8期发表了一篇题为《贸易政策冲击下的跨国供应链断裂与重构研究》的文章,提出了跨国供应链断裂与重构两个变量的测度方式,但是稍微有点儿说得不够清楚。下文将对其所采用的FastSet Revere全球供应链数据库和其测度方式进行简单解读,并基于Python,结合Excel操作实现。

文章图片
#python
【上市公司文本分析】Python批量提取上市公司年报文本中的“MD&A”和董事会报告部分

一些做文本分析的经管类文章里在介绍时简单得用“MD&A”(即管理层讨论与分析)部分作为文本分析样本,但实际上在很多年报中并无叫该名的章节,可能还会叫董事会报告等一系列名称,所以按照下方文献的思路,重新编制代码,提取相应部分。[1]姚加权,张锟澎,郭李鹏,等.人工智能如何提升企业生产效率?——基于劳动力技能结构调整的视角[J].管理世界,2024,40(02):101-116+133+117-122

文章图片
#python#开发语言
【上市公司文本分析】Python+Selenium获取互动易平台投资者提问与上市公司回应文本数据

需要提前下载好三个库,都可以用pip install轻松下载,稍微麻烦点儿的是需要去下载个对应版本的chromedriver.exe驱动,放到python或者Anaconda的文件夹目录下,然后添加环境变量(这部分报错了自行百度即可,操作起来不麻烦的)注意time.sleep()是必要的,一是为了避免频繁操作被浏览器提醒,二是在网络不好的情况下让网页加载完全,否则都会导致报错,一定不要图快,建议在

文章图片
#python#开发语言
【上市公司文本分析】Python+Pytorch微调BERT预训练模型,使用大语言模型完成文本分类任务——金星晔等(2024)《经济研究》大语言模型方法的复现

金星晔老师等在《经济研究》2024年第3期发表了一篇题为《企业数字化转型的测度难题:基于大语言模型的新方法与新发现》,使用替代了传统的以词频为依据的企业数字化转型、数字技术能力等一系列变量的测量方法。金星晔,左从江,方明月,李涛,聂辉华.企业数字化转型的测度难题:基于大语言模型的新方法与新发现[J].经济研究,2024,59(3):34-53.根据此篇论文第五作者,人大教授聂辉华老师的预测,以及这

文章图片
#python#pytorch#语言模型
【上市公司文本分析】Python训练Word2Vec模型,将语句转化为词向量,计算问答数据间的软余弦相似度(softcosine)——卞世博和阎志鹏(2020)《财经研究》方法的复现

本篇的参考文献主要有以下两篇卞世博,阎志鹏.“答非所问”与IPO市场表现——来自网上路演期间的经验证据[J].财经研究,2020,46(01):49-63.这是文献里对软余弦相似度的描述,说明软余弦相似度在问答数据的相关性表示中优于传统的余弦相似度本篇依据卞世博和阎志鹏(2020)的文献逐步复现。

文章图片
#python#word2vec#开发语言
(2分钟解决)Windows找不到文件报错:‘C:\Program Files(x86)\Adobe\Acrobat DC\Acrobat\AcroTray.exe’。请确定文件名是否正确后,再试一次

Adobe Acrobat有时候莫名其妙找不到转换PDF的文件,无法转换PDF,上方加载项也消失了。这种情况需要重新添加加载项点击文件–>更多–>选项–>加载项–>点击“转到”不出问题时可以看到这个Acrobat的加载项.dll文件的文件路径。出现问题后不会显示,点击右边的添加,找到该路径下的这个dll文件,双击选中添加确定即可每个人情况可能都有不同,如不能解决,可以参考狗

【上市公司文本分析】Python批量提取上市公司年报文本中的“MD&A”和董事会报告部分

一些做文本分析的经管类文章里在介绍时简单得用“MD&A”(即管理层讨论与分析)部分作为文本分析样本,但实际上在很多年报中并无叫该名的章节,可能还会叫董事会报告等一系列名称,所以按照下方文献的思路,重新编制代码,提取相应部分。[1]姚加权,张锟澎,郭李鹏,等.人工智能如何提升企业生产效率?——基于劳动力技能结构调整的视角[J].管理世界,2024,40(02):101-116+133+117-122

文章图片
#python#开发语言
    共 36 条
  • 1
  • 2
  • 3
  • 4
  • 请选择