前言
最近跟朋友聊天的时候谈起了科创板估值的问题,朋友问到现在能在科创板上市的都不见得是好事,好像有倒挂的股票。 我也发现确实有部分股票有倒挂的情况,上市后的股价比上市前的还要低。 后来我就突发奇想,想同一个关于科创板的数据统计,目的是想看看在科创板上市的企业在上市后的第一天、一个星期、一个月、三个月、六个月、一年后的市盈率和市值变化情况, 我自己也想通过数据的分析了解一下是不是大部分上科创板的企业都是“鱼跃龙门”。
上一篇: 科创板上市企业不同阶段市盈率、市值变化 - 获取数据
上一篇介绍了如何获取数据,这里将介绍如何进行简单的数据统计。 其实不一定需要用到mysql来存储数据,我们可以用xlsx或者其他文件形式来存储读取就可以了,下面将继续用到mysql,所以需要用到pandas
的read_sql_query
来读取mysql。
统计的思路比较简单粗暴, 就是直接用pandas
提供的describe
函数来完成, 最后得到的output会显示数据相关的平均值和分位数等指标。
注册账号
首先,我们需要从tushare.pro注册一个账号并调用其API获取股票日线数据。可能大多数的童稚是第一次接触tushare.pro, 那我就直接贴上官方介绍:
Tushare是一个免费提供各类金融数据和区块链数据 , 助力智能投资与创新型投资的python财经数据接口包。拥有丰富的数据内容,如股票、基金、期货、数字货币等行情数据,公司财务、基金经理等基本面数据。
过程
这里将使用到tushare提供的数据接口,数据本身是免费的,但有一定的分值要求。
requirements.txt
1 | pandas |
代码
结果
先说明一下describe
函数的output
是什么意思:
- count:每一列非空值的数量
- mean: 每一列的平均值
- std:每一列的标准差
- min:最小值
- 25%:25%分位数,排序之后排在25%位置的数
- 50%:50%分位数
- 75%:75%分位数
- max:最大值
下面是科创板股票上市一年后的describe
数据:
在上面的jupyter notebook显示的代码中,我已经对股票总市值做了运算, 我新建了一个新字段total_mv_pct
用于表示时间段内的市值变化。
所以我们只需要留意total_mv_pct
就知道股票上市后一年的升跌幅。
mean
: 说明了在科创板上市的企业,一年后市值基本有171%的涨幅;25%
: 这里涵盖了25%的数据涨幅约为62%;75%
: 这里涵盖了75%的数据涨幅约为211%;max
: 最大涨幅, 这说明了科创板里面有一个股票翻了差不多8倍;