Pandas之Dataframe.describe() 用法

1、简介

count 1460.000000
mean 180921.195890
std 79442.502883
min 34900.000000
25% 129975.000000
50% 163000.000000
75% 214000.000000
max 755000.000000

对于数值数据，结果的索引将包括计数，平均值，标准差，最小值，最大值以及较低的百分位数和50。默认情况下，较低的百分位数为25，较高的百分位数为75，50百分位数与中位数相同。describe()函数自动计算的字段有count（非空值数）、unique（唯一值数）、top（频数最高者）、freq（最高频数）。

2、函数说明

DataFrame.describe(percentiles=None, include=None, exclude=None)

其物理意义在于观察这一系列数据的范围。大小、波动趋势等等，便于判断后续对数据采取哪类模型更合适。

第一个percentiles,这个参数可以设定数值型特征的统计量，默认是[.25, .5, .75],也就是返回25%，50%，75%数据量时的数字，但是这个可以修改的。 df['Parch'].describe(percentiles=[.2,.75, .8])默认有5

第二个参数：include，这个参数默认是只计算数值型特征的统计量，当输入include=['O']，会计算离散型变量的统计特征。

df.describe(include='O')  
df.describe(include=['O'])  
df.describe(include='all')

此外传参数是‘all’的时候会把数值型和离散型特征的统计都进行显示。

第三个参数的设计就更贴心了，第二个参数是你可以指定选那些，第三个参数就是你可以指定不选哪些，人性化设计。这个参数默认不丢弃任何列，相当于无影响。

综述，无法取指定行数，比如只取Min行

print(df.describe().iloc[3]) 暂时只能用这种方式

Pandas之Dataframe.describe() 用法 ​

1、简介 ​

2、函数说明 ​

Pandas之Dataframe.describe() 用法

1、简介

2、函数说明