La régression linéaire par elle-même n'a pas besoin de l'hypothèse normale (gaussienne), les estimateurs peuvent être calculés (par les moindres carrés linéaires) sans avoir besoin d'une telle hypothèse, et rend parfait sens sans elle. … En pratique, bien sûr, la distribution normale est tout au plus une fiction commode.
La normalité est-elle requise pour la régression ?
La régression suppose uniquement la normalité pour la variable de résultat. La non-normalité dans les prédicteurs PEUT créer une relation non linéaire entre eux et le y, mais c'est un problème distinct. … L'ajustement n'exige pas la normalité.
Peut-on utiliser la régression linéaire si les données ne sont pas normalement distribuées ?
En bref, lorsqu'une variable dépendante n'est pas distribuée normalement, la régression linéaire reste une technique statistiquement valable dans les études portant sur des échantillons de grande taille. La figure 2 fournit des tailles d'échantillon appropriées (c'est-à-dire >3000) où les techniques de régression linéaire peuvent toujours être utilisées même si l'hypothèse de normalité n'est pas respectée.
Que se passe-t-il si les données ne sont pas normalement distribuées ?
Des données insuffisantes peuvent faire paraître une distribution normale complètement dispersée Par exemple, les résultats des tests en classe sont généralement distribués normalement. Un exemple extrême: si vous choisissez trois étudiants au hasard et tracez les résultats sur un graphique, vous n'obtiendrez pas une distribution normale.
Comment savoir si les données ne sont pas normalement distribuées ?
Si les données observées suivent parfaitement une distribution normale, la valeur de la statistique KS sera 0 La valeur P est utilisée pour décider si la différence est suffisamment grande pour être rejetée l'hypothèse nulle: … Si la P-Value du test KS est inférieure à 0.05, nous ne supposons pas une distribution normale.