Pourquoi utiliser un modèle pré-entraîné ?

Pourquoi utiliser un modèle pré-entraîné ?
Pourquoi utiliser un modèle pré-entraîné ?
Anonim

En termes simples, un modèle pré-entraîné est un modèle créé par quelqu'un d'autre pour résoudre un problème similaire Au lieu de construire un modèle à partir de zéro pour résoudre un problème similaire, vous utiliser le modèle formé sur un autre problème comme point de départ. Par exemple, si vous voulez construire une voiture autodidacte.

Pourquoi est-il avantageux d'utiliser les modèles pré-entraînés pour les CNN ?

Habituellement, les CNN pré-entraînés disposent de filtres efficaces pour extraire les informations des images car ils sont entraînés avec un ensemble de données bien distribué et ils ont une bonne architecture. Fondamentalement, les filtres des couches convolutives sont correctement entraînés pour extraire les caractéristiques des images.

Qu'entend-on par modèle pré-entraîné ?

Définition. Un modèle qui a indépendamment appris des relations prédictives à partir de données de formation, souvent en utilisant l'apprentissage automatique.

Pourquoi les modèles pré-entraînés doivent-ils être affinés ?

La tâche d'affiner un réseau est d'ajuster les paramètres d'un réseau déjà formé afin qu'il s'adapte à la nouvelle tâche à accomplir Comme expliqué ici, les couches initiales apprendre des fonctionnalités très générales et à mesure que nous remontons dans le réseau, les couches ont tendance à apprendre des modèles plus spécifiques à la tâche sur laquelle elles sont entraînées.

Qu'est-ce qu'un jeu de données pré-entraîné ?

Un modèle pré-entraîné est un réseau enregistré qui a été précédemment entraîné sur un grand ensemble de données, généralement sur une tâche de classification d'images à grande échelle. Vous pouvez soit utiliser le modèle pré-entraîné tel quel, soit utiliser l'apprentissage par transfert pour personnaliser ce modèle en fonction d'une tâche donnée.