在电脑怎么样下载沙漏(轻量级堆叠沙漏网络(附源代码下载))
公众号ID|ComputerVisionGzq
代码地址:https://github.com/jameelhassan/PoseEstimation
人体姿态估计(HPE)是计算机视觉中的一项经典任务,其重点是通过识别人的关节位置来表示人的方位。HPE可以用来理解和分析人类的几何和运动相关信息。Newell等人在[Stackedhourglassnetworksforhumanposeestimation.InEuropeanconferenceoncomputervision,pages483–499]中提出的堆叠沙漏结构是第一种引人注目的基于深度学习的HPE方法之一,因为在此之前,经典方法主导了HPE文献。在这项工作中,利用重复的自下而上和自上而下的处理来捕获来自不同尺度的信息,并引入中间监督来迭代地细化每个阶段的预测。与当时最先进的方法相比,这大大提高了准确性。
设计选择
DepthwiseSeparableConvolutions
深度可分离卷积取代了传统的卷积,以减少卷积运算的参数数量。这是通过使用卷积在空间上单独在信道上分割卷积来执行的,然后通过逐点卷积聚合信道信息,如下图所示:
DilatedConvolution
下面方程中描述的扩张卷积是规则卷积运算的一种变体,其具有在不损失分辨率或覆盖率的情况下指数增加感受野的能力,就像池化运算的情况一样。
GhostBottleneck
[Ghostnet:Morefeaturesfromcheapoperations.InProceedingsoftheIEEE/CVFconferenceoncomputervisionandpatternrecognition]提出的Ghost瓶颈还通过不同地分割卷积来降低卷积运算的计算复杂度。为了产生固定数量的信道,Ghost瓶颈使用规则卷积输出一小部分信道,其余信道通过更便宜的线性运算产生,如下图所示。这些被级联和卷积以输出所需数量的信道。
DiCEBottleneck
高效网络的维度卷积(DiCE)单元是Mehta等人提出的一种卷积单元,它折衷了维度卷积和维度融合。卷积运算应用于三个输入维度(宽度、高度和深度)中的每一个。为了沿着这些维度中的每个维度组合编码信息,使用有效的融合单元来组合这些表示。因此,DiCE单元可以有效地捕获沿着空间维度和信道维度的信息。
ShuffleBottleneck
[Shufflenet:Anextremelyefficientconvolutionalneuralnetworkformobiledevices.InProceedingsoftheIEEEconferenceoncomputervisionandpatternrecognition]中首次提出的混洗单元使用逐点群卷积和信道混洗来提高计算效率并保持准确性。
PerceptualLoss
感知损失用于比较具有微小差异的相似图像。在这里,我们将其用作两个图像之间的特征水平均方误差(MSE)损失,该损失在高级特征图而不是原始图像空间处计算损失。这里的假设是,如果让第一个沙漏“感知”第二个沙漏在高特征水平上“感知”的东西,网络的整体性能就会提高。下方程中所示的总损失由感知损失和原始预测损失组成,其中预测损失具有更高的权重。
Residualconnection
研究者还将现有的残差连接添加替换为级联的残差连接,然后进行逐点卷积,以获得所需数量的信道,称为ResConcat。还包括从沙漏(颈部)的最窄特征图到下一个沙漏颈部的残差连接,称为NarrowRes。
实验
Architectureofthebestmodel
转载请联系本公众号获得授权
<