三门峡市住房建设局网站,给几个网址谢谢,郑州电力高等专科学校校长,惠州私人做网站联系人分类问题
手写数字数据集 其中#xff0c;每个数字图片大小是28 x 28#xff0c;矩阵中每个元素的大小为[0#xff0c;1]区间的灰度值#xff0c;将二维矩阵拉平(flat)为一维784#xff0c;数据量不变#xff0c;这样能忽略上下位置相关性#xff0c;甚至左右位置相关性…分类问题
手写数字数据集 其中每个数字图片大小是28 x 28矩阵中每个元素的大小为[01]区间的灰度值将二维矩阵拉平(flat)为一维784数据量不变这样能忽略上下位置相关性甚至左右位置相关性也可忽略再插入一个维度变为[1,784]
线性模型能解决吗
一个简单的线性模型为y w * x b 但对于手写数字来说用一个简单的线性模型是不可能解决问题的。 故用以上三个线性函数进行嵌套 其中 d1 784d3 10中间矩阵转置、相乘、相加过程暂时抽象理解一下。
H3作为最后一个输出要如何计算loss。 最后的Label是0~9可以让H3的第一维度数字1表示照片数量第二个1表示是数字“1”。 使用one-hot编码避免数字编码具有大小关系。 若H3为[0.1 0.8 0.01 … 0]它与“1”的欧式距离计算如上图。
小结 H1作为H2的输入H2作为H3的输入 pred采用十维向量表示与真实编码数字向量作欧式距离计算优化这个计算理论上便能找到最优解。
非线性模型
即使通过嵌套线性模型增强了表达能力但整体模型仍为线性。人脑之所以能很简单地识别出数字样式是因为人脑有很强的非线性表达能力对于线性模型来说很难完成这样的任务。
解决在每个函数之后添加非线性部分 类似于生物学上的神经元输出不是多个输入的求和而是存在阈值控制输出结果如relu。
梯度下降解决 找到一组wb参数对于一个新的x使得其在pred上的映射无线接近于真实值y。
wb在这里由三组参数构成 给到一个新的x在经过三组wb的线性模型和激活函数的计算后得到的pred结果是[1,10]的矩阵其中值的大小表示所在位置索引数字的判断概率大小通过argmax函数实现最终结果输出的是最大0.8概率对应的索引数字“1”。