2018-07-02
这篇文章有2篇论文速递,都是图像分割方向,包括运动捕捉图像的语义分割、将FCN和GAN结合的巩膜分割。其中一篇是ACM SIGGRAPH 2018,另一篇是BTAS 2018。
图像分割(Image Segmentation)
《Dilated Temporal Fully-Convolutional Network for Semantic Segmentation of Motion Capture Data》
ACM SIGGRAPH 2018
Abstract:运动捕捉序列的语义分割在许多数据驱动的运动合成框架中起着关键作用。 这是一个预处理步骤,其中运动捕捉序列的长记录被划分为较小的段。之后,可以将诸如统计建模的其他方法应用于每组结构相似的段以学习抽象运动流形。然而,分段任务通常仍然是手动任务,这增加了生成大规模运动数据库的工作量和成本。因此,我们提出了一种使用扩张的时间完全卷积网络的运动捕捉数据的语义分段的自动框架。我们的模型优于action segmentation中的最先进模型,以及用于序列建模的三个网络。 我们进一步显示我们的模型对高噪音训练标签是鲁棒的。
arXiv:https://arxiv.org/abs/1806.09174
《Fully Connected Networks and Generative Neural Networks Applied to Sclera Segmentation》
BTAS 2018
Abstract:由于世界对安全系统的需求,生物识别技术可被视为计算机视觉研究的重要课题。其中一种引起关注的生物识别形式是基于巩膜的识别。进行这种类型识别的最初和最重要的步骤是分割感兴趣的区域,即巩膜(sclera)。在此背景下,本文介绍了基于完全连接网络(FCN)和生成对抗网络(GAN)的两种方法。FCN类似于常见的卷积神经网络,然而全连接的层(即分类层)从网络的末端被移除并且通过组合来自不同卷积层的输出层来产生输出。GAN基于博弈论,我们有两个网络彼此竞争以产生最佳分割。为了与baselines 进行公平的比较以及对提出的方法进行定量和客观的评估,我们向科学界提供了来自两个数据库的新的1,300个手动分割图像。这些实验在UBIRIS.v2和MICHE数据库上进行,我们命题的最佳表现配置分别实现了F分数的87.48%和88.32%。