Illumination invariants in deep video expression recognition

Article ID	Journal	Published Year	Pages	File Type
6939511	Pattern Recognition	2018	31 Pages	PDF

Abstract

In this paper we present architectures based on deep neural nets for expression recognition in videos, which are invariant to local scaling. We amalgamate autoencoder and predictor architectures using an adaptive weighting scheme coping with a reduced size labeled dataset, while enriching our models from enormous unlabeled sets. We further improve robustness to lighting conditions by introducing a new adaptive filter based on temporal local scale normalization. We provide superior results over known methods, including recent reported approaches based on neural nets.

Keywords

Expression recognition Neural nets Video classification Deep learning Machine learning