摘 要
本文以全A股股票为股票池,建立了一个基于logistic回归的高转送预测模型。虽说现在在刘主席的监管下,高转送等炒作可能会逐渐失效。但是没有关系,通过找一些feature建立模型来预测事件发生的可能性,这种思路永远不会过时。倘若高转送不行了,我们可以很容易的切换到预测有党性的高分红事件嘛。
1
获取高转送数据
这里我们调用DataAPI,EquDivGet获取历史上各只股票的分红送转情况,参考了兴业证券的研报,将高转送定义为转股比例加上送股比例大于0.5。
如上便是各年份的发生高送转的数量,我国07年会计准则发生过大的改变,我们选取07年至16年作为我们的样本区间。
2
建立模型
目标:我们通过11月份已知的信息来预测当年年终该股票是否会发生高转送。
考虑变量(信息)
每股资本公积金与留存收益之和
EPS(TTM)
总股本
20个交易日平均股价
是否新股(上市250个交易日以内)
上市时间(年)
年中是否有分红
去年是否有高转送
汇总所有变量
得到解释变量与被解释变量构成的矩阵,其中Total_PS是每股资本公积金与每股留存收益之和,EPS是TTM的每股收益、Total_Shares是总股本单位为亿、listYear是上市时间单位年、ifNew是虚拟变量表示是否是新股、MidHasTransfer是虚拟变量表示年中是否有过高转送、LastHasTransfer是虚拟变量表示去年是否有过高转送,一共7个解释变量;isTransfer是被解释变量表示年终是否真的高转送。
最终的回归结果如上所示,可以看出Total_PS(每股资本公积金与每股留存收益之和)与EPS越大,年终进行高转送的概率也越大,并且显著性非常高;Total_Shares(总股本)和listYear(上市时间)越小,年终进行高转送的概率也越大,并且显著性非常高;而ifNew(是否是新股)系数是正的,但是不显著性,MidHasTransfer(年中是否高转送)也不显著;LastHasTransfer(去年是否高转送)比较显著。
3
样本内与样本外预测
依据我们得到的模型进行样本内外预测
大家可以对比其预测高转送概率(predict_probability)与是否发生了高转送(isTransfer)。以2015年年终的高转送实际情况,作为样本外点预测。
2015年样本外解释变量如上所示。
样本外的预测概率与是否转化如上所示,我们可以做一个简单的统计。
383 2762 0.138667632151
25 13 0.52
62 32 0.516129032258
383 153 0.399477806789
可以看出,在2015年末2762只股票中共有383只股票进行了高转送;如果我们瞎蒙的话大概有14%的概率蒙中。根据我们的预测模型,选取发生概率大于0.5的股票共有25只,其中13只实际发生了高转送,准确度为52%;选取发生概率大于0.4的股票共有62只,其中32只实际发生了高转送,准确度为51.6%;选取发生概率前383只的股票中共有153只实际发生了高转送,准确度为40%。总体来说,我们模型的效果相对于瞎猜有了很大的提高,但准确度看起来还不够高,有进一步优化的空间。
优矿专业版,助您的投资更有深度!
优矿专业版除了已有的 400+因子库、归因、并行计算及风险模型,即将推出深度学习框架!
扫二维码免费试用优矿专业版,助您的投资更有深度!
优矿社区传送门,点击查看源代码!
还没有评论,来说两句吧...