Il s'agit d'une technique d'exploration de données qui transforme les données brutes en un format compréhensible. Les données brutes (données du monde réel) sont toujours incomplètes et ces données ne peuvent pas être envoyées via un modèle. Cela entraînerait certaines erreurs. C'est pourquoi nous devons prétraiter les données avant de les envoyer via un modèle
Pourquoi devons-nous prétraiter les données ?
Il s'agit d'une technique d'exploration de données qui transforme les données brutes en un format compréhensible Les données brutes (données du monde réel) sont toujours incomplètes et ne peuvent pas être envoyées via un modèle. Cela entraînerait certaines erreurs. C'est pourquoi nous devons prétraiter les données avant de les envoyer via un modèle.
Dois-je prétraiter les données de test ?
L'essentiel de ceci est: Vous ne devez pas utiliser une méthode de prétraitement adaptée à l'ensemble de données pour transformer les données de test ou d'entraînement. Si vous le faites, vous transportez par inadvertance des informations de la rame vers l'ensemble de test.
Qu'est-ce qu'un problème de fuite de données ?
La fuite de données est la transmission non autorisée de données de l'intérieur d'une organisation vers une destination ou un destinataire externe … La fuite de données, également connue sous le nom de vol de données faible et lent, est un énorme problème pour la sécurité des données, et les dommages causés à toute organisation, quelle que soit sa taille ou son secteur, peuvent être graves.
Comment transformer les données de test ?
transform transformera toutes les caractéristiques en soustrayant la moyenne et en divisant par la variance. Pour plus de commodité, ces deux appels de fonction peuvent être effectués en une seule étape à l'aide de fit_transform.