dw软件做的东西怎么在网站用,网建什么意思,免费的网络推广渠道,wordpress主题 自定义字段1. 简单线性回归模型举例#xff1a; 汽车卖家做电视广告数量与卖出的汽车数量#xff1a; 1.1 如何练出适合简单线性回归模型的最佳回归线/ 使sum of squares最小1.1.2 计算分子 (1-2)(14-20)(3-2)(24-20)(2-2)(18-20)(1-2)(17-20)(3-2)(27-20) 6 4 0 3 7 20分母 汽车卖家做电视广告数量与卖出的汽车数量 1.1 如何练出适合简单线性回归模型的最佳回归线/ 使sum of squares最小1.1.2 计算分子 (1-2)(14-20)(3-2)(24-20)(2-2)(18-20)(1-2)(17-20)(3-2)(27-20)6 4 0 3 720分母 1-2^2 (3-2)^2 (2-2)^2 (1-2)^2 (3-2)^21 1 0 1 14b1 20/4 5b020-5*220-10101.2 预测 假设有一周广告数量为6预测的汽车销售量是多少 x_given 6 Y_hat 5*6 10 40 1.3 Python实现 #!/usr/bin/env python
#-*-coding:utf-8-*-
#简单的线性回归
import numpy as npdef fitSLR(x,y):nlen(x)dinominator0#分母numerator0#分子for i in range(0,n):numerator(x[i]-np.mean(x))*(y[i]-np.mean(y))dinominator(x[i]-np.mean(x))**2print(numerator:,numerator)print(dinominator:,dinominator)b1numerator/float(dinominator)# b0np.mean(y)/float(np.mean(x))b0np.mean(y)-b1*np.mean(x);return b0,b1
def predict(x,b0,b1):return b0x*b1x[1,3,2,1,3]
y[14,24,18,17,27]b0,b1fitSLR(x,y)
print(intercept:,b0, slope:,b1)
x_test6
y_testpredict(6,b0,b1)print(y_test:,y_test) 结果分析numerator 估计线性回归方程的分子dinominator 估计线性回归方程的分母intercept 截距 slope 斜率y_test 测试样例0. 前提介绍为什么需要统计量统计量描述数据特征 0.1 集中趋势衡量 0.1.1均值平均数平均值mean {6, 2, 9, 1, 2} (6 2 9 1 2) / 5 20 / 5 4 0.1.2中位数 median: 将数据中的各个数值按照大小顺序排列居于中间位置的变量 0.1.2.1. 给数据排序1 2 2 6 9 0.1.2.2. 找出位置处于中间的变量2 当n为基数的时候直接取位置处于中间的变量 当n为偶数的时候取中间两个量的平均值 0.1.2众数 mode数据中出现次数最多的数 0.2 0.2.1. 离散程度衡量 0.2.1.1方差variance) {6, 2, 9, 1, 2} (1) (6 - 4)^2 (2 - 4) ^2 (9 - 4)^2 (1 - 4)^2 (2 - 4)^2 4 4 25 9 4 46 (2) n - 1 5 - 1 4 (3) 46 / 4 11.5 0.2.1.2标准差 (standard deviation) s sqrt(11.5) 3.39 1. 介绍回归(regression) Y变量为连续数值型(continuous numerical variable)如房价人数降雨量分类(Classification): Y变量为类别型(categorical variable)如颜色类别电脑品牌有无信誉2. 简单线性回归(Simple Linear Regression)
2.1 很多做决定过过程通常是根据两个或者多个变量之间的关系2.3 回归分析(regression analysis)用来建立方程模拟两个或者多个变量之间如何关联2.4 被预测的变量叫做因变量(dependent variable), y, 输出(output)2.5 被用来进行预测的变量叫做 自变量(independent variable), x, 输入(input)3. 简单线性回归介绍3.1 简单线性回归包含一个自变量(x)和一个因变量(y)3.2 以上两个变量的关系用一条直线来模拟3.3 如果包含两个以上的自变量则称作多元回归分析(multiple regression)4. 简单线性回归模型4.1 被用来描述因变量(y)和自变量(X)以及偏差(error)之间关系的方程叫做回归模型4.2 简单线性回归的模型是:其中 参数 偏差5. 简单线性回归方程E(y) β0β1x 这个方程对应的图像是一条直线称作回归线其中β0是回归线的截距β1是回归线的斜率 E(y)是在一个给定x值下y的期望值均值6. 正向线性关系7. 负向线性关系8 无关系9. 估计的简单线性回归方程 ŷb0b1x 这个方程叫做估计线性方程(estimated regression line) 其中b0是估计线性方程的纵截距 b1是估计线性方程的斜率 ŷ是在自变量x等于一个给定值的时候y的估计值 10. 线性回归分析流程 11. 关于偏差ε的假定11.1 是一个随机的变量均值为011.2 ε的方差(variance)对于所有的自变量x是一样的11.3 ε的值是独立的11.4 ε满足正态分布