logo
publist
写文章

简介

该用户还未填写简介

擅长的技术栈

可提供的服务

暂无可提供的服务

经管文本分析 | 金融学文本大数据挖掘方法与研究进展阅读笔记

姚加权张锟澎罗平《经济学动态》2020年第4期沈艳陈赟黄卓《经济学(季刊)》 2019年第4期前言本文是刊载于《经济学(季刊)》2019年第4期《文本大数据分析在经济学和金融学中的应用:一个文献综述》和《经济学动态》2020年第4期《金融学文本大数据挖掘方法与研究进展》的阅读笔记在金融学领域的传统实证研究文献中,研究数据多局限于财务报告数据、股票市场数据等结构化数据(structured data

#大数据#机器学习#人工智能
实证分析 | 中介效应检验原理与Stata代码实现

前言本文是温忠鳞和叶宝娟2014年刊载于《心理科学进展》的论文《中介效应分析:方法和模型发展》的简要笔记与拓展。温忠麟、叶宝娟:《中介效应分析:方法和模型发展》,《心理科学进展》,2014年第5期中介效应检验要了解中介效应,首先要引入中介变量的概念。考虑自变量XXX对YYY的影响,如果XXX通过影响变量MMM而对YYY产生影响,则称MMM为中介变量。在回归模型的体现$$\begin{align}Y

文章图片
#python
文本分析 | 年报转换TXT关键词频统计

前言上篇文章《【爬虫】30行代码轻松爬取全部A股公司年报》介绍了如何爬取2003-2019年A股全部年报,但是爬取的年报都是PDF格式,不能直接用于文本分析,需要先转换为TXT格式。因此,今天也学习了一下如何运用Python将PDF转换为TXT,并在此基础上统计年报相关主题关键词词频基本思路1.获取年报PDF文档2.利用PDFminer3k模块来抽取PDF内容并写入TXT文件3.读取TXT文件,统

#python#爬虫#数据挖掘
实证分析 | 中介效应检验原理与Stata代码实现

前言本文是温忠鳞和叶宝娟2014年刊载于《心理科学进展》的论文《中介效应分析:方法和模型发展》的简要笔记与拓展。温忠麟、叶宝娟:《中介效应分析:方法和模型发展》,《心理科学进展》,2014年第5期中介效应检验要了解中介效应,首先要引入中介变量的概念。考虑自变量XXX对YYY的影响,如果XXX通过影响变量MMM而对YYY产生影响,则称MMM为中介变量。在回归模型的体现$$\begin{align}Y

文章图片
#python
到底了