方差:各个数据分别与其平均数之差的平方的和的平均数,用字母D表示。在概率论和数理统计中,方差(Variance)用来度量随机变量和其数学期望(即均值)之间的偏离程度。在许多实际问题中,研究随机变量和均值之间的偏离程度有着重要意义。
方差公式:S^2= ∑(X- ) ^2 / (n-1) ,即:S^2 = [(x1-x)^2 + (x2-x)^2 + ... + (xn-x)^2 ] /n。x表示样本的平均数,n表示样本的数量,xi表示个体,而s^2就表示方差。
使用要点:当数据分布比较分散(即数据在平均数附近波动较大)时,各个数据与平均数的差的平方和较大,方差就较大;当数据分布比较集中时,各个数据与平均数的差的平方和较小。因此方差越大,数据的波动越大;方差越小,数据的波动就越小。
样本方差:样本中各数据与样本平均数的差的平方和的平均数叫做样本方差;样本方差的算术平方根叫做样本标准差。样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大,样本数据的波动就越大。
方差和标准差是测算离散趋势最重要、最常用的指标。方差是各变量值与其均值离差平方的平均数,它是测算数值型数据离散程度的最重要的方法。标准差为方差的算术平方根,用S表示。
标准差:(Standard Deviation) ,又常称均方差,是离均差平方的算术平均数的平方根(总体各单位标准值与其平均数离差平方的算术平均数的平方根),用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。
方差单位和数据的单位不一致,没法使用。标准差和数据的单位一致,使用起来方便。
离散程度=变异大小(变异性)=波动大小:很多统计概率的书本上会用离散程度和变异大小来表示数据集之间偏离平均值的程度。这与“波动大小”表达的其实是同一个意思。
众数(Mode)是统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。 修正定义:是一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有好几个。用 M 表示。 理性理解:简单的说,就是一组数据中占比例最多的那个数。如数据2、3、-1、2、1、3中,2、3都出现了两次,它们都是这组数据中的众数。
中数又名中位数(Medians)统计学名词,是指将统计总体当中的各个变量值按大小顺序排列起来,形成一个数列,处于变量数列中间位置的变量值就称为中位数,用Me表示。当变量值的项数N为奇数时,处于中间位置的变量值即为中位数;当N为偶数时,中位数则为处于中间位置的2个变量值的平均数。(注意:中位数和众数不同,众数不一定在中间)