Comment évaluer la signification statistique?
Pour évaluer la signification statistique, commencez par calculer l'écart type pour vos 2 groupes d'échantillons. Ensuite, utilisez l'écart type de chaque groupe pour calculer la variance entre les 2 groupes. Ensuite, branchez la variance dans la formule d'un score t et calculez le score t de vos données. Une fois que vous avez trouvé le score t, déterminez les degrés de liberté de vos groupes d'échantillons en additionnant le nombre total d'échantillons de chaque groupe et en soustrayant 2. Enfin, recherchez vos degrés de liberté et votre score t dans le tableau pour trouver la signification statistique. Pour plus de conseils sur la façon de calculer vos écarts types, continuez à lire l'article!

Le test d'hypothèse est guidé par une analyse statistique. La signification statistique est calculée à l'aide d'une valeur p, qui vous indique la probabilité que votre résultat soit observé, étant donné qu'une certaine affirmation (l'hypothèse nulle) est vraie. Si cette valeur p est inférieure au seuil de signification défini (généralement 0,05), l'expérimentateur peut supposer que l'hypothèse nulle est fausse et accepter l'hypothèse alternative. À l'aide d'un simple test t, vous pouvez calculer une valeur p et déterminer la signification entre deux groupes différents d'un ensemble de données.
Partie 1 sur 3: configuration de votre expérience
- 1Définissez vos hypothèses. La première étape de l'évaluation de la signification statistique consiste à définir la question à laquelle vous souhaitez répondre et à formuler votre hypothèse. L'hypothèse est une déclaration sur vos données expérimentales et les différences qui peuvent se produire dans la population. Pour toute expérience, il existe à la fois une hypothèse nulle et une hypothèse alternative. Généralement, vous comparerez deux groupes pour voir s'ils sont identiques ou différents.
- L'hypothèse nulle (H 0) indique généralement qu'il n'y a pas de différence entre vos deux ensembles de données. Par exemple: Les étudiants qui lisent le matériel avant le cours n'obtiennent pas de meilleures notes finales.
- L'hypothèse alternative (H a) est l'opposé de l'hypothèse nulle et c'est l'affirmation que vous essayez de soutenir avec vos données expérimentales. Par exemple: les élèves qui lisent le matériel avant le cours obtiennent de meilleures notes finales.
- 2Définissez le niveau de signification pour déterminer à quel point vos données doivent être inhabituelles avant de pouvoir être considérées comme significatives. Le niveau de signification (également appelé alpha) est le seuil que vous définissez pour déterminer la signification. Si votre valeur p est inférieure ou égale au seuil de signification défini, les données sont considérées comme statistiquement significatives.
- En règle générale, le niveau de signification (ou alpha) est généralement fixé à 0,05, ce qui signifie que la probabilité d'observer les différences observées dans vos données par hasard n'est que de 5%.
- Un niveau de confiance plus élevé (et, par conséquent, une valeur p plus faible) signifie que les résultats sont plus significatifs.
- Si vous voulez une plus grande confiance dans vos données, définissez la valeur p inférieure à 0,01. Des valeurs p inférieures sont généralement utilisées dans la fabrication lors de la détection de défauts dans les produits. Il est très important d'avoir une grande confiance dans le fait que chaque pièce fonctionnera exactement comme elle est censée le faire.
- Pour la plupart des expériences basées sur des hypothèses, un niveau de signification de 0,05 est acceptable.
- 3Décidez d'utiliser un test unilatéral ou bilatéral. L'une des hypothèses émises par un test t est que vos données sont distribuées normalement. Une distribution normale des données forme une courbe en cloche avec la majorité des échantillons tombant au milieu. Le test t est un test mathématique pour voir si vos données se situent en dehors de la distribution normale, soit au-dessus ou au-dessous, dans les "queues" de la courbe.
- Un test unilatéral est plus puissant qu'un test bilatéral, car il examine le potentiel d'une relation dans une seule direction (comme au-dessus du groupe de contrôle), tandis qu'un test bilatéral examine le potentiel d'une relation dans les deux sens. directions (comme au-dessus ou au-dessous du groupe de contrôle).
- Si vous ne savez pas si vos données seront supérieures ou inférieures au groupe de contrôle, utilisez un test bilatéral. Cela vous permet de tester la signification dans les deux sens.
- Si vous savez dans quelle direction vous vous attendez à ce que vos données évoluent, utilisez un test unilatéral. Dans l'exemple donné, vous vous attendez à ce que les notes de l'étudiant s'améliorent; par conséquent, vous utiliserez un test unilatéral.
Comment évaluer la signification statistique en ce qui concerne les sexes? - 4Déterminer la taille de l'échantillon avec une analyse de puissance. La puissance d'un test est la probabilité d'observer le résultat attendu, compte tenu d'une taille d'échantillon spécifique. Le seuil commun de puissance (ou) est de 80%. Une analyse de puissance peut être un peu délicate sans quelques données préliminaires, car vous avez besoin d'informations sur vos moyennes attendues entre chaque groupe et leurs écarts types. Utilisez un calculateur d'analyse de puissance en ligne pour déterminer la taille d'échantillon optimale pour vos données.
- Les chercheurs réalisent généralement une petite étude pilote pour éclairer leur analyse de puissance et déterminer la taille de l'échantillon nécessaire pour une étude plus vaste et plus complète.
- Si vous n'avez pas les moyens de faire une étude pilote complexe, faites quelques estimations sur les moyens possibles en vous basant sur la lecture de la littérature et des études que d'autres personnes ont pu réaliser. Cela vous donnera un bon point de départ pour la taille de l'échantillon.
Partie 2 sur 3: calcul de l'écart type
- 1Définissez la formule de l'écart type. L'écart type est une mesure de la répartition de vos données. Il vous donne des informations sur la similitude de chaque point de données dans votre échantillon, ce qui vous aide à déterminer si les données sont significatives. À première vue, l'équation peut sembler un peu compliquée, mais ces étapes vous guideront tout au long du processus de calcul. La formule est s = √∑((x i - µ) 2 /(N - 1)).
- s est l'écart type.
- ∑ indique que vous allez additionner toutes les valeurs d'échantillon collectées.
- x i représente chaque valeur individuelle de vos données.
- µ est la moyenne (ou moyenne) de vos données pour chaque groupe.
- N est le nombre total d'échantillons.
- 2Faites la moyenne des échantillons dans chaque groupe. Pour calculer l'écart type, vous devez d'abord prendre la moyenne des échantillons dans les groupes individuels. La moyenne est désignée par la lettre grecque mu ou µ. Pour ce faire, additionnez simplement chaque échantillon, puis divisez par le nombre total d'échantillons.
- Par exemple, pour trouver la note moyenne du groupe qui a lu le matériel avant le cours, examinons quelques données. Pour simplifier, nous utiliserons un jeu de données de 5 points: 90, 91, 85, 83 et 94.
- Additionnez tous les échantillons: 90 + 91 + 85 + 83 + 94 = 443.
- Divisez la somme par le numéro d'échantillon, N = 5: 440,6 = 88,6.
- La note moyenne pour ce groupe est de 88,6.
- 3Soustraire chaque échantillon de la moyenne. La partie suivante du calcul implique la partie (x i - µ) de l'équation. Vous soustrairez chaque échantillon de la moyenne que vous venez de calculer. Pour notre exemple, vous obtiendrez cinq soustractions.
- (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) et (94 - 88,6).
- Les nombres calculés sont maintenant 1,4, 2,4, -3,6, -5,6 et 5,4.
- 4Carré chacun de ces nombres et additionnez-les. Chacun des nouveaux nombres que vous venez de calculer sera maintenant mis au carré. Cette étape s'occupera également de tout signe négatif. Si vous avez un signe négatif après cette étape ou à la fin de votre calcul, vous avez peut-être oublié cette étape.
- Dans notre exemple, nous travaillons maintenant avec 1,96, 5,76, 12,96, 31,36 et 29,16.
- La somme de ces carrés donne: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
Le niveau de signification (également appelé alpha) est le seuil que vous définissez pour déterminer la signification. - 5Divisez par le nombre total d'échantillons moins 1. La formule divise par N - 1 car elle corrige le fait que vous n'avez pas compté une population entière; vous prenez un échantillon de la population de tous les élèves pour faire une estimation.
- Soustraire: N - 1 = 5 - 1 = 4
- Diviser: 81,0,5 = 20,3
- 6Prenez la racine carrée. Une fois que vous avez divisé par le nombre d'échantillon moins un, prenez la racine carrée de ce nombre final. C'est la dernière étape du calcul de l'écart type. Il existe des programmes statistiques qui feront ce calcul pour vous après avoir saisi les données brutes.
- Pour notre exemple, l'écart type des notes finales des élèves qui lisent avant les cours est: s =√20,3 = 4,51.
Partie 3 sur 3: déterminer l'importance
- 1Calculez la variance entre vos 2 groupes d'échantillons. Jusqu'à présent, l'exemple n'a traité que d'un des groupes d'échantillons. Si vous essayez de comparer 2 groupes, vous aurez évidemment des données des deux. Calculez l'écart type du deuxième groupe d'échantillons et utilisez-le pour calculer la variance entre les 2 groupes expérimentaux. La formule de la variance est s d = √((s 1 /N 1) + (s 2 /N 2)).
- s d est la variance entre vos groupes.
- s 1 est l'écart type du groupe 1 et N 1 est la taille de l'échantillon du groupe 1.
- s 2 est l'écart type du groupe 2 et N 2 est la taille de l'échantillon du groupe 2.
- Pour notre exemple, disons que les données du groupe 2 (étudiants qui n'ont pas lu avant le cours) ont une taille d'échantillon de 5 et un écart type de 5,81. L'écart est:
- s d = ((s 1) 2 /N 1) + ((s 2) 2 /N 2))
- s d = (((4,51) 2 /5) + ((5,81) 2 /5)) = √((20,30,8) + (33,71,2)) = √(4,07 + 6,75) = √10,82 = 3,29.
- 2Calculez le t-score de vos données. Un t-score vous permet de convertir vos données en un formulaire qui vous permet de les comparer à d'autres données. Les scores T vous permettent d'effectuer un test t qui vous permet de calculer la probabilité que deux groupes soient significativement différents l'un de l'autre. La formule pour un score t est: t = (µ 1 - µ 2)/s d.
- µ 1 est la moyenne du premier groupe.
- µ 2 est la moyenne du deuxième groupe.
- s d est la variance entre vos échantillons.
- Utilisez la plus grande moyenne comme µ 1 afin que vous n'ayez pas une valeur t négative.
- Pour notre exemple, disons que la moyenne de l'échantillon pour le groupe 2 (ceux qui n'ont pas lu) était de 80. Le t-score est: t = (µ 1 - µ 2)/s d = (88,6 - 80)/ 3,29 = 2,61.
- 3Déterminez les degrés de liberté de votre échantillon. Lors de l'utilisation du score t, le nombre de degrés de liberté est déterminé à l'aide de la taille de l'échantillon. Additionnez le nombre d'échantillons de chaque groupe, puis soustrayez deux. Pour notre exemple, les degrés de liberté (df) sont de 8 car il y a cinq échantillons dans le premier groupe et cinq échantillons dans le deuxième groupe ((5 + 5) - 2 = 8).Suivez un cours de niveau secondaire ou collégial (ou au-delà) sur l'inférence statistique pour vous aider à comprendre la signification statistique.
- 4Utiliser à table pour évaluer l'importance. Un tableau des scores t et des degrés de liberté peut être trouvé dans un livre de statistiques standard ou en ligne. Regardez la ligne contenant les degrés de liberté de vos données et trouvez la valeur p qui correspond à votre t-score.
- Avec 8 df et un t-score de 2,61, la valeur p pour un test unilatéral se situe entre 0,01 et 0,025. Parce que nous avons défini notre niveau de signification inférieur ou égal à 0,05, nos données sont statistiquement significatives. Avec ces données, nous rejetons l'hypothèse nulle et acceptons l'hypothèse alternative: les étudiants qui lisent le matériel avant le cours obtiennent de meilleures notes finales.
- 5Envisagez une étude de suivi. De nombreux chercheurs réalisent une petite étude pilote avec quelques mesures pour les aider à comprendre comment concevoir une étude plus vaste. Faire une autre étude, avec plus de mesures, vous aidera à augmenter votre confiance en votre conclusion.
- Une étude de suivi peut vous aider à déterminer si l'une de vos conclusions contenait une erreur de type I (observation d'une différence lorsqu'il n'y en a pas, ou un faux rejet de l'hypothèse nulle) ou une erreur de type II (non-observation d'une différence lorsqu'il y a un, ou fausse acceptation de l'hypothèse nulle).
- La statistique est un domaine vaste et complexe. Suivez un cours de niveau secondaire ou collégial (ou au-delà) sur l'inférence statistique pour vous aider à comprendre la signification statistique.
- Cette analyse est spécifique à un test t pour tester les différences entre 2 populations normalement distribuées. Vous avez eu besoin d'utiliser un test statistique différent en fonction de la complexité de votre jeu de données.
Questions et réponses
- Pouvez-vous expliquer le degré de liberté, comment vous êtes arrivé au nombre de plages de valeurs P et comment ils sont liés aux étapes finales?Les degrés de liberté sont le nombre d'échantillons dans votre population moins un. Le moins un vient de vous en utilisant un degré de liberté pour calculer la moyenne.
- Pourquoi ajustez-vous votre S1 dans votre exemple de variance, mais pas dans votre explication de la formule?La formule réelle de la source à laquelle il se réfère pour la variance est la racine carrée. Cela m'amène à croire que la notation sans racine carrée est simplement une erreur de l'auteur.
- Quelle est la différence entre l'ANOVA et le test t? J'ai des groupes catégoriques pour le poids et la taille et je veux comparer les données de chaque groupe et voir s'il y a une signification.Un test t est utilisé pour comparer les moyennes de SEULEMENT 2 populations. Si vous souhaitez comparer les moyennes de plus de 2 populations, vous utiliserez une ANOVA.
- Comment tirer une conclusion sur la théorie scientifique en utilisant uniquement les moyens et non les statistiques?
- Quelle est la signification radicale de 12 erreurs dans 989000 questions?
- Quand la statique conduit-elle au rejet d'une théorie?
- Comment évaluer la signification statistique en ce qui concerne les sexes?
- L'erreur standard serait-elle la même ou différente pour plusieurs personnes passant le même test?
Les commentaires (1)
- Je suis un développeur de logiciels SQL qui optimise la vitesse du logiciel d'un client et j'ai mesuré les métriques "avant" par rapport à "après". Oui, j'ai amélioré la vitesse. Cette augmentation est-elle significative? Votre article m'a aidé avec cette question. Merci!