CNN vs RNN : Comprendre les architectures de réseaux de neurones pour le Deep Learning

L'architecture des réseaux de neurones est au cœur de nombreuses applications d'intelligence artificielle. Deux paradigmes structurels principaux émergent : les réseaux de neurones à propagation avant (feedforward) et les réseaux de neurones récurrents (feedback). Cet article compare ces deux architectures, analyse leurs forces et faiblesses, et explore des cas d'utilisation concrets.

Qu'est-ce qu'un réseau de neurones ?

Les réseaux de neurones, inspirés du cerveau humain, sont les fondations du deep learning. Ils traitent les données à travers plusieurs couches de neurones artificiels pour produire un résultat. Les applications sont vastes, allant de la classification d'images à la traduction de langues.

Eléments d'un réseau de neurones

Les éléments fondamentaux d'un réseau de neurones

Comprendre les composants suivants est essentiel :

Entrée : Les données, ou caractéristiques, envoyées au modèle d'apprentissage.
Poids : Ils attribuent de l'importance aux caractéristiques les plus pertinentes pour l'apprentissage.
Fonction d'activation : Introduce de la non-linéarité pour permettre au réseau de gérer des relations complexes. Les fonctions courantes incluent les fonctions sigmoïdes et ReLU.

Fonctions d'Actvation

Biais : Ajuste la sortie de la fonction d'activation, comme une constante dans une équation linéaire.
Couches : Un réseau de neurones est composé de plusieurs couches :
- Couche d'entrée : Reçoit les données brutes.
- Couches cachées : Effectuent les calculs et extraient les caractéristiques. Plusieurs couches cachées permettent un apprentissage profond.
- Couche de sortie : Produit la prédiction finale.

Couches d'un reseau de neurones

Comment ces couches interagissent-elles ? L'information, codée sous forme numérique, traverse le réseau. Chaque nœud effectue un calcul et transmet le résultat. Les erreurs entre la prédiction et la réalité sont utilisées pour ajuster les poids, via un processus appelé rétropropagation.

Exemple de réseau de neurones basique

Réseaux de neurones à propagation avant (Feedforward)

Dans un réseau feedforward, l'information circule dans une seule direction, de l'entrée à la sortie. Ils sont non récurrents et consistent en des couches d'entrée, cachées et de sortie. Un Perceptron est un bon exemple de réseau feedforward.

L'apprentissage se fait via la rétropropagation. Les propriétés de chaque échantillon d'entraînement sont stimulées par l'entrée. Les couches cachées reçoivent simultanément les sorties pondérées de la couche d'entrée.

Les réseaux de neurones convolutionnels (CNN) sont une des itérations de l'architecture feedforward. Ils sont particulièrement performants pour la classification d'images. Un CNN capture les dépendances spatiales et temporelles dans une image grâce à des filtres. Cela réduit le nombre de paramètres et permet une meilleure adaptation au dataset d'images.

architecture CNN

Comment entraîner un réseau feedforward ?

La rétropropagation est la méthode standard. Elle ajuste les poids du réseau en fonction de l'erreur de la prédiction.

algorithme de rétropropagation

Réseaux de neurones récurrents (Feedback)

Un réseau feedback, tel qu'un réseau de neurones récurrent (RNN), possède des connexions qui permettent aux signaux de voyager dans les deux directions. Cela crée une boucle, transformant le réseau en un système dynamique non linéaire.

Les RNN sont utilisés pour le traitement de séquences temporelles, comme la reconnaissance vocale. Grâce à leur état interne, ils peuvent se souvenir des informations passées.

Exemple de réseau feedback

Comment entraîner un réseau feedback ?

La rétropropagation à travers le temps (BPTT) est une méthode courante. C'est une extension de la rétropropagation, adaptée à la récurrence.

CNN vs RNN : le tableau comparatif

	Convolution Neural Networks (CNNs)	Recurrent Neural Networks (RNNs)
Architecture	Feed-forward neural network	Feed-back neural network
Layout	Multiple layers of nodes including convolutional layers	Information flows in different directions, simulating a memory effect
Data type	Image data	Sequence data
Input/Output	The size of the input and output are fixed (i.e input image with fixed size and outputs the classification)	The size of the input and output may vary (i.e receiving different texts and generating different translations for example)
Use cases	Image classification, recognition, medical imagery, image analysis, face detection	Text translation, natural language processing, language translation, sentiment analysis
Drawbacks	Large training data	Slow and complex training procedures
Description	CNN employs neuronal connection patterns. And, they are inspired by the arrangement of the individual neurons in the animal visual cortex, which allows them to respond to overlapping areas of the visual field.	Time-series information is used by recurrent neural networks. For instance, a user’s previous words could influence the model prediction on what he can says next.

Exemples d'architectures notables

AlexNet : Un CNN révolutionnaire avec huit couches, utilisant la fonction d'activation ReLU.
LeNet : Un des premiers CNN, précurseur du deep learning.
LSTM (Long Short-Term Memory) : Exemple important de RNN, capable d'analyser des séquences complètes de données. La mémoire à long terme est particulièrement utile pour l'identification d'écriture manuscrite.
GRU (Gated Recurrent Unit) : Une variante des RNN qui tente de résoudre le problème de mémoire à court terme.

Cas d'utilisation

Le choix entre feedforward (CNN) et feedback (RNN) dépend de l'application.

Prévision des taux de change : Une étude a montré qu'un modèle feedforward peut être plus précis qu'un RNN pour prédire les taux de change du yen japonais.

Reconnaissance d'objets partiellement masqués : Les RNN excellent dans ce domaine. Les connexions récurrentes peuvent reconstruire l'information manquante.

Analyser et comprendre le meilleur réseau de neurones pour vos besoins spécifiques est, au final, la seule chose qui va compte.