依赖于某个条件的概率。
例如:已知某孕妇前38周没有生,计算在第39周生的概率。
计算方法:
替代方案:将小于39的值从分布中删除,重新归一化数据。
区间(bin)
集中趋势(central tendency):最能代表平均水平的值
条件概率(conditional probability):某些条件成立的情况下计算出的概率
分布(distribution):对样本中的各个值及其频数或概率的总结
频数(frequency)
直方图(histogram):从值到频数的映射或表示这种关系的图形。
众数(mode)
归一化(normalization)
异常值(outlier)
概率(probability)
概率质量函数(Probability Mass Function PMF):以函数的形式表示分布,将值映射到概率。
相对风险(relative risk):两个概率的比值,通常用于衡量两个分布的差异。
分散(spread):数据变动有多大。
标准差(standard deviation)
修剪(trim):删除数据中的异常值。
方差(variance):用于量化分散程度的汇总统计量。