国内优秀的论文数据服务商
AD: 1、本站招兼职硕博分析师。 2、本站招数据搜集老师。 3、欢迎来本站分享您的数据。 欢迎有意合作者联系Q:8-5-6-1-8-3-9

上市公司内控信息披露指数2018 内部控制信息披露指数2018年数据

yih阅读(5)

上市公司内控信息披露指数2018 内部控制信息披露指数2018年数据

样例:

证券代码 证券简称 证监会行业 内部环境 风险评估 控制活动 信息与沟通 内部监督 内部控制信息披露指数 辖区名称 更新年份 报告期
000014 沙河股份 房地产业 5.74 7.17 6.89 3.28 15.25 38.33 深圳辖区 2019 2018-12-31
000016 深康佳A 计算机、通信和其他电子设备制造业 6.24 5.25 8.44 2.9 13.73 36.57 深圳辖区 2019 2018-12-31
000017 深中华A 铁路、船舶、航空航天和其他运输设备制造业 5.44 4.54 6.83 1.08 14.25 32.14 深圳辖区 2019 2018-12-31
000018 神州长城 建筑装饰和其他建筑业 5.28 6.33 9.08 2.85 14.25 37.79 深圳辖区 2019 2018-12-31
000019 深深宝A 酒、饮料和精制茶制造业 5.34 5.83 10.74 3.53 13 38.43 深圳辖区 2019 2018-12-31
000020 深华发A 计算机、通信和其他电子设备制造业 6.86 5.33 6.94 3.33 14.25 36.71 深圳辖区 2019 2018-12-31
000021 深科技 计算机、通信和其他电子设备制造业 8.42 6.17 9.4 2.8 12 38.79 深圳辖区 2019 2018-12-31
000023 深天地A 非金属矿物制品业 9.6 6.71 9.69 3.78 15.02 44.8 深圳辖区 2019 2018-12-31
000025 特 力A 批发业 8.85 4.38 7.72 4.2 14 39.14 深圳辖区 2019 2018-12-31
000026 飞亚达A 零售业 7.34 5.58 4.29 2.25 13 32.47 深圳辖区 2019 2018-12-31

附送2016-2017年

市场资讯数据 股吧舆情投资者情绪统计数据2010-2019

yih阅读(15)

市场资讯数据 股吧舆情投资者情绪统计数据2010-2019

段说明

序号 字段 数据类型 字段标题 字段说明
1 PostDate Datetime 发帖日期 以YYYY-MM-DD列示。
2 Stockcode Nvarchar 股票代码 以交易所公布的证券代码为准。
3 PostSource decimal 帖子来源 帖子来源:东方财富股吧=1,新浪股吧=2
4 AvgPosterAttention decimal 发帖者平均关注量 发帖者关注的人的数量的平均值
5 AvgPosterFans decimal 发帖者平均粉丝量 发帖者被关注的数量的平均值
6 TotalPosts decimal 帖子总数量 统计时间段内该上市公司贴吧内帖子的总数量
7 BullishPosts decimal 看涨帖子数量
8 NeutralPosts decimal 中立帖子数量
9 BearishPosts decimal 看跌帖子数量
10 AvgWords decimal 帖子平均字数 所有帖子正文字数的平均值
11 AvgReadings decimal 帖子平均阅读量 所有帖子阅读量的平均值
12 AvgComments decimal 帖子平均评论量 所有帖子评论数量的平均值
13 AvgNetComments decimal 帖子平均净评论量 所有帖子去除本人评论后的净评论数量的平均值
14 AvgThumbUps decimal 帖子平均点赞量 所有帖子被点赞数量的平均值
15 AvgBullishReadings decimal 看涨帖子平均阅读量
16 AvgBullishComments decimal 看涨帖子平均评论量
17 AvgBullishNetComments decimal 看涨帖子平均净评论量
18 AvgBullishThumbUps decimal 看涨帖子平均点赞量
19 AvgNeutrReadings decimal 中立帖子平均阅读量
20 AvgNeutrComments decimal 中立帖子平均评论量
21 AvgNeutrNetComments decimal 中立帖子平均净评论量
22 AvgNeutrThumbUps decimal 中立帖子平均点赞量
23 AvgBearishReadings decimal 看跌帖子平均阅读量
24 AvgBearishComments decimal 看跌帖子平均评论量
25 AvgBearishNetComments decimal 看跌帖子平均净评论量
26 AvgBearishThumbUps decimal 看跌帖子平均点赞量
27 AvgUserBarAge decimal 发帖用户平均吧龄
28 AvgUserInfluIndex decimal 发帖用户平均影响力指数 发帖用户的影响力大小的平均值
29 AvgUserPosts decimal 发帖用户平均总发帖数
30 AvgUserComments decimal 发帖用户平均总评论数 发帖用户在其他人发帖下总评论的数量的平均
31 AvgBullUserBarAge decimal 发看涨帖用户平均吧龄
32 AvgBullUserInfluIndex decimal 发看涨帖用户平均影响力指数
33 AvgBullUserPosts decimal 发看涨帖用户平均总发帖数
34 AvgBullUserComments decimal 发看涨帖用户平均总评论数
35 AvgNeutrUserBarAge decimal 发中立帖用户平均平均吧龄
36 AvgNeutrUserInfluIndex decimal 发中立帖用户平均影响力指数
37 AvgNeutrUserPosts decimal 发中立帖用户平均总发帖数
38 AvgNeutrUserComments decimal 发中立帖用户平均总评论数
39 AvgBearUserBarAge decimal 发看跌帖用户平均吧龄
40 AvgBearUserInfluIndex decimal 发看跌帖用户平均影响力指数
41 AvgBearUserPosts decimal 发看跌帖用户平均总发帖数
42 AvgBearUserComments decimal 发看跌帖用户平均总评论数
43 BullishSentIndexA decimal 看涨情绪指数a (看涨帖子数量-看跌帖子数量)/(看涨帖子数量+看跌帖子数量)
44 BullishSentIndexB decimal 看涨情绪指数b ln[(1+看涨帖子数)/(1+看跌帖子数)]
45 SentConformIndex decimal 情绪一致性指数 1-(1-看涨情绪指数a^2)^0.5

归类变更盈余管理:预期核心收益模型Stata代码(附2000-2018年数据和结果)

moming阅读(20)

 

1、计算说明


(1)运用以下模型(预期核心收益模型)进行分年度分行业回归

CodeCogsEqn.gif

 

CodeCogsEqn (1).gif

      (2)回归得到的残差即为未预期的核心利润(UNCE)

   变量说明:

  • CE是核心利润 =(营业收入-营业成本-销售费用-管理费用+固定资产折旧、油气资产折耗、生产性生物资产折旧+无形资产摊销+长期待摊费用本年摊销)/ 营业收入
  • CEt-1是滞后一期的核心利润
  • ATO是净经营资产周转率 = 第 t 期营业收入/第 t 期平均净经营资产,其中净经营资产NOA=期末经营资产-期末经营负债=(资产合计-货币资金-交易性金融资产-应收利息-可供出售金融资产-持有至到期投资)-(负债合计-短期借款-交易性金融负债-应付利息-长期借款-应付债券)
  • ACCRUALS是应计利润 =(营业利润 + 财务费用-公允价值变动净收益-投资收益-经营现金净流量)/ 营业收入
  • ACCRUALSt-1 是滞后一期的应计利润
  • ∆SALE是营业收入增长率
  • Neg_∆SALE是当∆SALE小于0,值与∆SALE相同,当∆SALE大于0是,值为0

 

2、数据说明


 

  • 原始数据格式为:dta格式(1990-2018年)
  • 代码格式:do文件(Stata14/15),用低版本出现乱码,但还是可以用记事本打开,有详细的注释,包含数据处理过程
  • 本文选取2000—2018年沪深两市的A股上市公司为研究对象,使用的数据均来源于国泰安CSMAR数据库。因为是分年度分行业回归,所以需要哪几年的结果可以直接使用
  • 行业包含以2012年的证监会行业标准,制造业使用二级分类,其他行业使用大类,本文剔除金融行业,如果不需要可以把对应代码删掉即可
  • 剔除了行业观察值小于10(具体可以根据需要调整)的样本,以便有效估计。
  • 字段包含是否ST、PT的虚拟变量(以当年是否ST、PT为判断标准),本文剔除ST、PT类股票如果不需要可以把对应代码删掉即可
  • 对连续变量进行缩尾处理

3、附件内容


2.jpg

 

Heckman两阶段模型、PSM+DID模型、固定效应模型和中介效应模型Stata代码

moming阅读(31)

常用模型代码整理

使用示例数据
内容丰富,代码有注释(Stata14或以上版本)
主要做的内容有:
1、OLS模型
2、Heckman两阶段模型(第一步使用Probit回归模型,利用此阶段的回归结果计算逆米尔斯比(IMR),利用第一阶段计算出来的IMR带入第二阶段进行回归)
3、PSM+DID模型(使用逐步回归法得到PSM匹配所用到的匹配变量,匹配方法选择最近邻法1:1 有放回匹配)
4、固定效应模型(xtreg命令的使用)
5、中介效应模型(sgmediation命令的使用,附件中有sgmediation.ado的命令包)

除此之外可以学到
1、如何使用esttab输出命令结果
2、如何输出行业和年份虚拟变量的结果
3、回归结果如何经过公司层面cluster调整
4、如何计算同行业其他公司的均值
5、得到标星的相关系数矩阵(pwcorr_a,附件中有pwcorr_a.ado的命令包)
6、使用winsor2进行缩尾处理

部分结果截图

描述性统计
屏幕快照 2019-09-23 00.53.45.png
相关系数矩阵
屏幕快照 2019-09-23 00.54.02.png

OLS回归结果
屏幕快照 2019-09-23 00.55.02.png

Heckman两步法回归结果
屏幕快照 2019-09-23 00.55.49.png

PSM匹配
屏幕快照 2019-09-23 00.56.23.png

屏幕快照 2019-09-23 00.56.32.png

PSM+DID回归结果
屏幕快照 2019-09-23 00.56.51.png

固定效应模型结果
屏幕快照 2019-09-23 00.57.12.png

中介效应结果
屏幕快照 2019-09-23 00.57.29.png

五因子模型数据和stata代码

moming阅读(24)

样本选取:2008年1月到2017年12月
数据来源:国泰安数据库(整理成dta格式)
代码:Stata14或15
无风险利率采用一年期定期存款利率

数据具体筛选标准

1.png

2.png

25个基准组合构建

3.png
32个基准组合构建

4.png

市场因子Rm-Rf、规模因子SMB、价值因子HML、利润因子RMW和投资因子CMA的构建

6.png

以上只是简要截图说明,详细可以看参考文献,文献有做的实证分析都有(代码也有详细说明)

结果的话整理了表格(共11个),基本上可以直接使用,或者根据自己需要调整
以下为部分表格截图
11.png

12.png

13.png

所有的表格在Excel有设置快速整理的公式,方便快捷
1233.png

附件内容:
2222.png

Mishkin检验 迭代广义非线性最小二乘法案例Stata代码(附示例数据)

moming阅读(15)

Mishkin检验 Stata代码

(迭代广义非线性最小二乘法)

1、计算说明


 

预测方程

CodeCogsEqn (1).gif

价值方程

CodeCogsEqn (2).gif

 

其中:
EARNt+1  表示t+1年的会计盈余,EARN=(净利润+财务费用)/期初总资产
SARt+1表示t+1年股票的超额回报,是对单个股票市场回报进行规模调整计算出来的超额收益
CFOt表示t年的现金流量,CFO=经营性现金流量净额/期初总资产
DAt表示t年的操纵性应计,DA是使用修正琼斯模型估计的应计操纵性利润
NDAt表示t年的非操纵性应计,NDA是修正琼斯模型估计的预测值

2、数据说明


示例数据为2009-2017年数据

3.jpg

3、附件内容


 

结果展示
44.jpg

 

参考文献:媒体关注的治理效应及其治理机制研究(权小锋)

 

32.png

Richardson预期投资模型计算投资效率Stata代码(附原始数据和2000-2018年结果)

moming阅读(17)

Richardson预期投资模型计算投资效率

1、计算说明


gif.gif

      对以上Richardson模型进行OLS得到的残差来衡量投资效率,残差大于0表示过度投资,且值越大,过度投资程度越大,残差小于0表示投资不足,且值越小,过度不足程度越大。通常最后构建三个变量:投资效率INV(残差绝对值),过度投资Over_INV(残差绝对值,残差大于0的样本),投资不足Under_INV(残差绝对值,残差小于0的样本

    变量说明:

  • CodeCogsEqn.gif   表示i公司 t 期的投资支出,具体定义为现金流量表中的构建固定资产、无形资产和其他长期资产所支付的现金加上购买子公司及其他营业单位所支付的现金减去处置子公司及其他营业单位所收到的现金,并用年初总资产进行标准化处理
  • CodeCogsEqn (1).gif 表示公司i在 t-1 期的成长性水平,定义为主营业务收入增长率
  • CodeCogsEqn (2).gif 表示公司i在 t-1 期的规模,定义为公司年末总资产的自然对数
  • CodeCogsEqn (3).gif 表示公司 i 在 t-1 期的资产负债率,定义为公司年末总负债除以年末总资产
  • CodeCogsEqn (4).gif 表示公司 i 在 t-1 期的现金持有水平,定义公司货币资金和短期投资之和除以年末总资产
  • CodeCogsEqn (5).gif 表示公司i在 t-1 期的上市年龄,定义为当前年度减去公司的上市年度加上1的自然对数
  • CodeCogsEqn (6).gif   表示公司i在 t-1 期的年度超额回报率,定义为考虑现金红利再投资年度回报率减去综合A股市场年度回报率(流通市值加权)
  • CodeCogsEqn (7).gif 表示i公司 t -1期的投资支出
  • CodeCogsEqn (8).gif 表示行业虚拟变量,以证监会2012行业标准,除了制造业用二级行业分类,其余行业用一级分类
  • CodeCogsEqn (9).gif 表示年份虚拟变量



2、数据说明


 

  • 原始数据格式为:excel格式/dta格式(1990-2018年),包括从国泰安上下载下来未整理的数据(资产负债表、现金流量表、发展能力)以供验证数据真实性
  • 代码格式:do文件(Stata14/15),用低版本出现乱码,但还是可以用记事本打开,有详细的注释,包含原始数据处理过程的代码供参考
  • 本文选取2000—2018年沪深两市的A股上市公司为研究对象,使用的数据均来源于国泰安CSMAR数据库。
  • 本文剔除金融行业,如果不需要可以把对应代码删掉即可。
  • 字段包含是否ST、PT的虚拟变量(以当年是否ST、P图为判断标准),本文剔除ST、PT类股票如果不需要可以把对应代码删掉即可。
  • 对连续变量进行Winsorize(缩尾)处理小于1%分位数与大于99%分位数的变量,令其分别等于1%分位数和99%分位数

3、结果展示


33.jpg

23.jpg

如果年份不一样的话,修改131行的年份重新运行计算出结果
具体的筛选标准和数据处理方法不一致也会导致计算出结果不一样

4、附件内容


34.jpg

Stata计算企业生命周期(李云鹤文献)

moming阅读(20)

Stata计算企业生命周期

      采用销售收入增长率、留存收益率、资本支出率及企业年龄综合得分划分企业生命周期 ;并根据我国上市企业已经度过初创期的实际情况,在考虑行业之间存在差异的情况下,把企业生命周期划分为三个阶段:成长期、成熟期及衰退期。

具体操作


     
      1、按照销售收入增长率、留存收益率、资本支出率及企业年龄分别进行排名,其中销售收入增长率和资本支出率是按从高到低排序,留存收益率和企业年龄是按照从低到高排名,然后进行赋值,并对每个样本公司的总得分。
2.jpg
      2、把总样本分行业进行由大到小排序,其中每一行业样本都按照总得分大小分成三部分,得分最高的约 1/3 部分为成长期的企业,得分最低的约1/3 部分为衰退期的企业,中间一部分为成熟期企业。 最后把各行业的分类结果汇总,即得到所有上市公司企业生命周期的样本分类结果。

注:为尽量降低企业生命周期不同阶段的划分偏差,在进行企业生命周期不同阶段划分时,采用的样本为剔除指标不健全公
司后的全部上市公司,而后分别按行业进行打分排序,同时等分为成长期、成熟期与衰退期三个阶段。
建议:一般是所有相关数据都找齐之后并剔除缺失值之后再开始划分企业生命周期。


数据说明:数据均来自国泰安数据库,资本支出率使用资本支出除以期初总资产来计算
其他行业使用一级分类,制造业使用二级分类

22.png


附件内容


22.jpg

合成控制法SCM案例–包含稳健性检验/安慰剂检验(附示例数据和Stata代码)

moming阅读(18)

合成控制法SCM案例–包含稳健性检验/安慰剂检验

 

synth命令详解


安装命令

  1. ssc install synth, replace

复制代码

使用命令

  1. synth depvar predictorvars , trunit(#) trperiod(#) [ counit(numlist) xperiod(numlist) mspeperiod() resultsperiod() nested allopt unitnames(varname) figure keep(file) customV(numlist) optsettings ]

在使用synth命令必须先使用tsset或xtset声明下是面板数据集
譬如使用smoking.dta的话是 tsset state year 或xtset state year
注意state只能是数字,不能是文字

depvar

必填,结果变量(因变量)

predictorvars

必填,预测变量(自变量)

trunit(3)

必填,用于指定处理地区,smoking.dta中处理组对应的编号3(即Califonia)

trperiod(1989)

必填,指定政策干预开始的时期,smoking.dta中禁烟法案开始时间为1989年

counit(numlist)

指定控制地区,默认是除处理地区以外的所有地区都是控制地区,一般可以不加这个选项

xperiod(numlist)

指定将预测变量进行平均的期间,默认为政策干预开始之前的所有时期

mspeperiod()

用于指定最小化均方预测误差(MSPE)的时期,默认为政策干预开始之前的所有时期

figure

将处理地区与合成控制的结果变量画时间趋势图,通常是需要加上的

resultsperiod()

用来指定figure画图的时间范围,默认是整个样本时期

nested

使用嵌套的数值方法寻找最优的合成控制,会花更多时间,但更精确。在使用nested选项是,如果再加上allopt(即nested  allopt),则比单独使用nested还要费时间,但精确度可能更高

keep(结果)

把估计结果(合成控制的权重和结果变量)输出到”结果.dta”文件,以便后续计算

加州禁烟法案案例


以smoking.dta(加州禁烟法案)为例

  1. synth cigsale retprice lnincome age15to24 beer cigsale(1975) cigsale(1980) cigsale(1988),
  2. trunit(3) trperiod(1989) xperiod(1980(1)1988) figure nested allopt keep(结果)

复制代码

Graph.png

在没有使用合成控制法的时候加州和其他州的人均香烟消费量的时间趋势图
Graph.png

画处理效应的时间趋势图

2.png

屏幕快照 2019-04-06 22.03.53.png

安慰剂检验

Abadie et al. (2010)提出一种类似于统计学中的中秩检验(Rank Test)的排列检验(Permutation Test),叫做“安慰剂检验”。 “安慰剂”(placebo)一词来自医学上的随机实验,比如要检验某种新药的疗效。此时,可将参加实验的人群随机分为两组,其中一组为实验组,服用真药;而另一组为控制组,服用安慰剂(比如,无用的糖丸),并且不让参与者知道自己服用的究竟是真药还是安慰剂,以避免由于主观心理作用而影响实验效果,称为“安慰剂效应”(placebo effect)。

只保留干预前MSPE不超过处理地区干预前MSPE两倍的控制地区,如果干预前的拟合效果不理想,即使政策后期得到的较大的预测变量差值也不能反映政策的效果。(本例中是使用2倍以内,具体MSPE要筛选多少可以在代码中进行修改)本例中总共筛选了19个州
未筛选的代码中也有输出,这里就不展示了

2.png


包含两个处理组的案例(房产税试点)


示例数据
屏幕快照 2019-04-07 09.47.04.png

处理地区分别为上海和重庆
房产税政策开始时间为2011年
部分结果展示

重庆结果
上海.png

上海结果
重庆.png

安慰剂检验
只保留干预前MSPE不超过处理地区干预前MSPE两倍的控制地区,不包括其他干预组

重庆
重庆1.png

上海
上海.png


附件内容


屏幕快照 2019-04-07 11.24.49.png

企业风险承担Stata计算代码(附2000-2018年原始数据和结果)

moming阅读(20)

企业风险承担Stata计算代码

1、计算说明


      用企业盈利的波动性衡量风险承担水平。ROA为企业相应年度的税息折旧及摊销前利润(EBITDA)与当年末资产总额的比率。计算波动性时,先对企业每一年的ROA采用行业平均值进行调整,然后计算企业在每一观测时段内经行业调整的ROA的标准差和极差。

公式如下:

      N=3取值为3,由于我国上市公司的高管任期一般为三年,所以这里以每三年为一个观测时段(T,T+1,T+2)以每三年(t年至t+2年)作为一个观测时段,分别滚动计算经行业调整后的Roa(ADJ_ROA)的标准差和极差,以此考察管理者的在任情况并计算企业的风险承担水平。

i代表企业, n代表在观测时段内的年度,取值1到3。X代表某行业的企业总数量,,k代表该行业的第k家企业。

2、参考文献


CEO复合型职业经历_企业风险承担与企业价值_何瑛

 

3、数据说明


 

  • 数据来源于国泰安数据库
  • 原始数据为dta格式(Stata14版) 计算结果有excel格式的
  • 数据范围:沪深A股
  • EBITDA来自国泰安盈利能力表中的“息税折旧摊销前收入”字段
  • ASSET来自国泰安资产负债表中的“资产总计”字段
  • 行业以证监会2012年标准,并且制造业使用二级分类,其他行业使用大类
  • 剔除数据:剔除金融行业(根据需求修改)和剔除缺失值
  • 代码优化,有更详细的代码注释

 

4、附件下载


 

 

 

 

 

 

 

易获数据 论文数据获取 更专业 更方便

联系我们今日数据