La raison la plus élémentaire et la plus fondamentale du recyclage du modèle est que le monde extérieur qui est prédit continue de changer et, par conséquent, les données sous-jacentes changent, entraînant une dérive du modèle.
Environnements dynamiques
- Les préférences des clients en constante évolution.
- Espace compétitif en mouvement rapide.
- Déplacements géographiques.
- Facteurs économiques.
Qu'est-ce que le recyclage d'un modèle ?
Au contraire, le recyclage se réfère simplement à la réexécution du processus qui a généré le modèle précédemment sélectionné sur un nouvel ensemble de données d'apprentissageLes fonctionnalités, l'algorithme du modèle et l'espace de recherche d'hyperparamètres doivent tous rester les mêmes. Une façon de penser à cela est que le recyclage n'implique aucun changement de code.
À quelle fréquence un modèle de données doit-il être conservé ?
Une organisation ne doit conserver les données que pendant aussi longtemps que nécessaire, que ce soit six mois ou six ans. La conservation des données plus longtemps que nécessaire occupe un espace de stockage inutile et coûte plus cher que nécessaire.
Pourquoi la reconversion des modèles est-elle importante ?
Cela montre pourquoi la reconversion est importante ! Comme il y a plus de données à apprendre et les modèles que le modèle a appris ne sont plus assez bons. Le monde change, parfois vite, parfois lentement, mais il change définitivement et notre modèle doit changer avec lui.
Comment gérer un modèle de machine learning ?
Surveiller la formation et le traitement des données pour la contamination
- Validez vos données entrantes. …
- Vérifiez l'écart formation-service. …
- Réduire l'écart formation-diffusion en s'entraînant sur les fonctionnalités diffusées. …
- Élaguez périodiquement les fonctionnalités redondantes. …
- Validez votre modèle avant de le déployer. …
- Shadow libère votre modèle. …
- Surveillez la santé de votre modèle.