关于网站建设的合同范本,中国建设银行官网站住房公积金,龙岩kk网手机版,沈阳集团网站建设统计学里面#xff0c;正态分布#xff08;normal distribution#xff09;最常见。男女身高、寿命、血压、考试成绩、测量误差等等#xff0c;都属于正态分布。 作者#xff1a; 阮一峰以前#xff0c;我认为中间状态是事物的常态#xff0c;过高和过低… 统计学里面正态分布normal distribution最常见。男女身高、寿命、血压、考试成绩、测量误差等等都属于正态分布。 作者 阮一峰以前我认为中间状态是事物的常态过高和过低都属于少数这导致了正态分布的普遍性。最近读到了 John D. Cook 的文章才知道我的这种想法是错的。正态分布为什么常见真正原因是中心极限定理central limit theorem。多个独立统计量的和的平均值符合正态分布。上图中随着统计量个数的增加它们和的平均值越来越符合正态分布。根据中心极限定理如果一个事物受到多种因素的影响不管每个因素本身是什么分布它们加总后结果的平均值就是正态分布。举例来说人的身高既有先天因素基因也有后天因素营养。每一种因素对身高的影响都是一个统计量不管这些统计量本身是什么分布它们和的平均值符合正态分布。注意男性身高和女性身高都是正态分布但男女混合人群的身高不是正态分布。许多事物都受到多种因素的影响这导致了正态分布的常见。读到这里读者可能马上就会提出一个问题正态分布是对称的高个子与矮个子的比例相同但是很多真实世界的分布是不对称的。比如财富的分布就是不对称的富人的有钱程度可能比平均值高出上万倍远远超出穷人的贫穷程度平均值的十分之一就是赤贫了即财富分布曲线有右侧的长尾。相比来说身高的差异就小得多最高和最矮的人与平均身高的差距都在30%多。这是为什么呢财富明明也受到多种因素的影响怎么就不是正态分布呢原来正态分布只适合各种因素累加的情况如果这些因素不是彼此独立的会互相加强影响那么就不是正态分布了。一个人是否能够挣大钱由多种因素决定 家庭 教育 运气 工作 ...这些因素都不是独立的会彼此加强。如果出生在上层家庭那么你就有更大的机会接受良好的教育、找到高薪的工作、遇见好机会反之亦然。也就是说这不是 1 1 2 的效果而是 1 1 2。统计学家发现如果各种因素对结果的影响不是相加而是相乘那么最终结果不是正态分布而是对数正态分布log normal distribution即x的对数值log(x)满足正态分布。这就是说财富的对数值满足正态分布。如果平均财富是10,000元那么1000元10,000元之间的穷人比平均值低一个数量级宽度为9000与10,000元~100,000元之间的富人比平均值高一个数量级宽度为90,000人数一样多。因此财富曲线左侧的范围比较窄右侧出现长尾。参考链接Why isnt everything normally distributed?by John D. Cookhttps://www.johndcook.com/blog/2015/03/09/why-isnt-everything-normally-distributed/Achievement is not normal,by John D. Cookhttps://www.johndcook.com/blog/2015/03/09/why-isnt-everything-normally-distributed/来源阮一峰的日志