嘉兴建设公司网站,网络投票程序,平面广告设计作品集,如何创建公司2022arxiv的论文#xff0c;没有中#xff0c;但一作是P大图班本MIT博#xff0c;可信度应该还是可以的
0 摘要
深度回归模型通常以端到端的方式进行学习#xff0c;不明确尝试学习具有回归意识的表示。 它们的表示往往是分散的#xff0c;未能捕捉回归任务的连续性质。…2022arxiv的论文没有中但一作是P大图班本MIT博可信度应该还是可以的
0 摘要
深度回归模型通常以端到端的方式进行学习不明确尝试学习具有回归意识的表示。 它们的表示往往是分散的未能捕捉回归任务的连续性质。在本文中我们提出了“监督对比回归”Supervised Contrastive RegressionSupCR的框架 该框架通过将样本与目标距离进行对比来学习具有回归意识的表示。SupCR与现有的回归模型是正交的并且可以与这些模型结合使用以提高性能。在涵盖计算机视觉、人机交互和医疗保健领域的五个真实世界回归数据集上进行的大量实验表明使用SupCR可以达到最先进的性能并且始终在所有数据集、任务和输入模式上改进先前的回归基线。 SupCR还提高了对数据损坏的鲁棒性对减少的训练数据具有弹性改善了迁移学习的性能并且对未见过的目标有很好的泛化能力。
1 介绍
1.1 动机
之前的回归问题 都集中在以端到端的方式对最终预测进行约束并未明确考虑模型学到的表示——学习的表示往往是分散的未能捕捉回归任务中连续的关系图1(a)展示了在从网络摄像头户外图像预测天气温度的任务中由L1损失学习的表示 L1模型学习的表示并没有呈现连续的真实温度值相反它按不同的摄像头以一种碎片化的方式进行分组。 这种无序和碎片化的表示对于回归任务是次优的甚至可能会妨碍性能因为其中包含了干扰信息之前的表示学习都集中在分类问题上 尤其是监督学习和对比学习如图1(b)所示这些方法在上述视觉温度预测任务中学习的表示对于回归问题来说是次优的 因为它忽略了回归任务中样本之间的连续顺序。
1.2 本文思路
引入了“监督对比回归”Supervised Contrastive RegressionSupCR这一新的深度回归学习框架 首先学习一个表示确保嵌入空间中的距离与目标值的顺序相对应 为了学习这样一个具有回归意识的表示我们根据样本的标签/目标值距离将样本进行对比然后使用这个表示来预测目标值方法明确地利用样本之间的有序关系来优化下游回归任务的表示如1(c)所示此外SupCR与现有的回归方法正交 可以使用任何类型的回归方法将学习到的表示映射到预测值上。
2 方法
2.0 方法定义
学习一个神经网络由两部分组成 特征encoder预测器 从中预测 对于给定的输入 batch类似于对比学习,首先对数据进行两次数据增强得到batch的两个view 这两个view被输入到编码器f(·)中为每个增强的输入数据获取一个de维特征嵌入监督对比回归损失是在这些特征嵌入上计算的 为了将学习到的表示用于回归冻结编码器f(·)然后在其之上训练预测器使用回归损失例如L1损失
2.1 监督对比回归损失
大前提希望损失函数能够确保嵌入空间中的距离与标签空间中的距离相对应给定N个数据组成的batch 其中有input和label 对该批数据应用数据增强得到两个视图的batch t和t是两种数据增强方式——得到两个视图下的batch 数据增强后的batch会被喂到encoder中以获得相应的embedding 监督对比回归损失为 比如我们计算20这个样本的对比学习损失函数时将30作为anchor的时候会有两个负样本将0作为anchor的时候会有一个负样本 2.2 理论证明
略
3 实验
3.1 五个实验
AgeDB 从人脸图像预测年龄。包含了16,488张名人的图像和相应的年龄标签。年龄范围在0到101岁之间。数据集被分为12,208张训练图像、2140张验证图像和2140张测试图像。TUAB 从EEG静息态信号估计脑龄。包括1,385个21通道的EEG信号采样频率为200Hz来自年龄范围从0到95岁的个体。数据集被分为1,246个受试者的训练集和139个受试者的测试集。MPIIFaceGaze 从人脸图像估计注视方向。包含了213,659张从15名参与者收集的人脸图像将其划分为一个33,000张训练图像、6,000张验证图像和6,000张测试图像的数据集参与者之间没有重叠。注视方向被描述为一个二维向量第一维是俯仰角第二维是偏航角。俯仰角的范围是-40°到10°偏航角的范围是-45°到45°。SkyFinder 从户外网络摄像头图像预测温度。包含了由44台摄像头在每天上午11点左右拍摄的35,417张图像天气和照明条件涵盖了广泛的范围。温度范围是-20°C到-49°C。数据集被分为28,373张训练图像、3,522张验证图像和3,522张测试图像。IMDB-WIKI 从人脸图像预测年龄包含了523,051张名人图像和相应的年龄标签。年龄范围在0到186岁之间有些图像标签错误。使用该数据集来测试方法对减少训练数据的弹性迁移学习的性能以及对未见目标的泛化能力。
3.2 实验效果 3.3 数据损坏的鲁棒性
使用ImageNet-C基准测试中的损坏生成过程来对AgeDB测试集进行19种不同强度级别的多样化损坏。 3.4 训练数据的影响