读书笔记--程序员数学之概率统计-统计思维(2-2)

读书笔记

2019-04-16

284

0

条件概率

依赖于某个条件的概率。

例如:已知某孕妇前38周没有生,计算在第39周生的概率。

计算方法:

  1. 根据PMF生成1000名孕妇的模拟人群
  2. 删除所有怀孕周期不足39周的孕妇
  3. 计算余下怀孕周期的PMF,这就是一个条件PMF
  4. 计算x=39时条件PMF的值

替代方案:将小于39的值从分布中删除,重新归一化数据。

术语:

区间(bin)

集中趋势(central tendency):最能代表平均水平的值

条件概率(conditional probability):某些条件成立的情况下计算出的概率

分布(distribution):对样本中的各个值及其频数或概率的总结

频数(frequency)

直方图(histogram):从值到频数的映射或表示这种关系的图形。

众数(mode)

归一化(normalization)

异常值(outlier)

概率(probability)

概率质量函数(Probability Mass Function PMF):以函数的形式表示分布,将值映射到概率。

相对风险(relative risk):两个概率的比值,通常用于衡量两个分布的差异。

分散(spread):数据变动有多大。

标准差(standard deviation)

修剪(trim):删除数据中的异常值。

方差(variance):用于量化分散程度的汇总统计量。

发表评论

全部评论:0条

Eric

莫等青春散场,才后悔来不及、回不去、得不到

热评文章

推荐文章