On the convergence of formally diverging neural net-based classifiers

Article ID	Journal	Published Year	Pages	File Type
8905369	Comptes Rendus Mathematique	2018	11 Pages	PDF

Abstract

Nous étudions dans cette note le comportement asymptotique d'algorithmes du gradient appliqués Ã des problÃ¨mes de classification basés sur des modÃ¨les élémentaires de réseaux neuronaux Ã apprentissage supervisé. Nous prouvons que ces algorithmes divergent au sens mathématique strict, puisque la suite de paramÃ¨tres définissant le classifieur est non bornée. Toutefois, en développant des méthodes d'entropie-production d'entropie, notre approche conduit Ã des taux explicites qui montrent, au moins lorsque les classes peuvent Ãªtre bien séparées, que les paramÃ¨tres divergent seulement logarithmiquement alors que la fonction coÃ»t converge vers 0 polynomialement. En conséquence, d'un point de vue pratique, l'algorithme permet effectivement d'obtenir un classifieur avec de bonnes performances, et peut mÃªme sembler converger.