网站建设公司方案,wordpress 登录后页面,本地写wordpress,百度竞价排名案例分析概率密度函数#xff08;PDF#xff09;是一个描述连续随机变量取特定值的相对可能性的函数。对于正态分布的情况#xff0c;其PDF有一个特定的形式#xff0c;这个形式中包括了一个常数乘以一个指数函数#xff0c;它假设误差项服从均值为0的正态分布#xff1a; p ( …概率密度函数PDF是一个描述连续随机变量取特定值的相对可能性的函数。对于正态分布的情况其PDF有一个特定的形式这个形式中包括了一个常数乘以一个指数函数它假设误差项服从均值为0的正态分布 p ( ϵ ( i ) ) 1 2 π σ 2 exp ( − ( ϵ ( i ) ) 2 2 σ 2 ) p(\epsilon^{(i)}) \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left(-\frac{(\epsilon^{(i)})^2}{2\sigma^2}\right) p(ϵ(i))2πσ2 1exp(−2σ2(ϵ(i))2) 各名词解释 p ( ϵ ( i ) ) p(\epsilon^{(i)}) p(ϵ(i))这部分表示给定误差 ϵ ( i ) \epsilon^{(i)} ϵ(i)的概率密度。 σ 2 \sigma^2 σ2正态分布的形状完全由两个参数决定均值 μ \mu μ和方差 σ 2 \sigma^2 σ2。均值决定了分布的中心位置而方差标准差的平方决定了分布的离散程度。这里均值 μ \mu μ都假设为0因此不讨论。详细解释一下 σ 2 \sigma^2 σ2 σ 2 \sigma^2 σ2是分布宽度的度量 σ 2 \sigma^2 σ2的数值表示数据分布的离散程度 σ 2 \sigma^2 σ2越大数据分布越分散 σ 2 \sigma^2 σ2越小数据分布越集中(如上图中的钟形越瘦)。 σ 2 \sigma^2 σ2的计算过程 a.假设你有一组数据 X { x 1 , x 2 , . . . , x n } X \{x_1, x_2, ..., x_n\} X{x1,x2,...,xn}且已知均值 μ \mu μ为0。 b.计算每个数据点的平方 x i 2 x_i^2 xi2计算了每个数据点距离均值0的距离的平方。 c.计算这些平方的平均值即方差 σ 2 \sigma^2 σ2 σ 2 1 n ∑ i 1 n x i 2 \sigma^2 \frac{1}{n} \sum_{i1}^{n} x_i^2 σ2n1∑i1nxi2即 x i 2 x_i^2 xi2求和后平均 1 2 π σ 2 \frac{1}{\sqrt{2\pi\sigma^2}} 2πσ2 1这是正态分布概率密度函数的前缀其中 σ 2 \sigma^2 σ2是方差。它的作用是确保概率密度函数PDF的积分——也就是函数下整个面积等于1。在数学上这意味着对于连续概率分布确保所有概率值的总和为1。
exp e e e是一个重要的数学常数自然对数的底数约等于2.71828而exp是 e e e的幂。exp用于计算概率的指数部分确保了大多数数据点都集中在平均值附近而远离均值的数据点则呈指数级减少就是让曲线呈“钟形曲线高斯分布”。 − ( ϵ ( i ) ) 2 2 σ 2 -\frac{(\epsilon^{(i)})^2}{2\sigma^2} −2σ2(ϵ(i))2这是exp指数函数内的幂代表了 ϵ ( i ) \epsilon^{(i)} ϵ(i)偏离均值0的程度。
由于我们假设误差项 ϵ \epsilon ϵ均值为0所以这里直接用 ϵ ( i ) \epsilon^{(i)} ϵ(i)。这个比例的平方表示了误差项的值距离均值0的距离的平方然后除以 2 σ 2 {2\sigma^2} 2σ2来“标准化”这个距离。在正态分布中这个距离的平方越大观测到该误差的概率就越低。这个过程与误差项 ϵ ( i ) \epsilon^{(i)} ϵ(i)的值(第 i i i个数据点的误差项)的平方成正比这里的平方是必要的因为我们对误差的大小感兴趣而不管它是正的还是负的。平方确保了所有的误差值都是非负的且更大的误差无论正负都会产生更大的平方值。与方差 σ 2 {\sigma^2} σ2的两倍成反比这里 σ 2 {\sigma^2} σ2表示整个数据集中的误差项的分布宽度。方差的两倍是概率密度函数的标准组成部分用于“标准化”误差项的平方这样不同的分布具有不同的方差就可以使用相同的函数形式。这里的乘以 1 2 σ 2 \frac{1}{2\sigma^2} 2σ21类似于计算出“相对”值而不是“绝对”值在不改变误差项的方向的情况下调整它的相对重要性。主要作用是由于不同的数据集可能有不同的方差即不同的误差分布宽度我们需要有一种方式来标准化这些误差使它们可以在统一的尺度上比较。 − 1 2 σ 2 -\frac{1}{2\sigma^2} −2σ21这个负号和分母 2 σ 2 {2\sigma^2} 2σ2一起工作形成一个比例因子表示一个衰减的过程它反映了误差项 ϵ ( i ) \epsilon^{(i)} ϵ(i)相对于方差的大小。由于是负指数误差项的平方越大 e e e的幂就越小从而降低了该误差值的概率密度。