13.3: Der t -Test unabhängiger Proben (Student -Test) (2024)

Letztes Update
PDF

Page ID: 151833

\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}}}\) \( \newcommand{\vecd}[1]{\overset{-\!- \ RightharpoonUp} \ vphantom {# 1} \ smash {# 1}}}}} {# 1}} {# 1} {{span}} \) {(\ mathrm {null} \, {null} \ \, \, \,, {null} \, {null} \, {range} \ rail} \, {range} \,} {range} \,} \) \ (\ nwcommand {\ alterart} \ math} \) \ (\ mathrm {{{\ alterart} \ math} \) \ (\ mathrm {{\ alterart} \ \) \ (\ mathrm {{\ alterart} \ \) \ (\ mathrm {{\ altert} \ \) \ (\ {{{{\ mathrm {{{{{ }}}}}}}}} \) \ (\ mathrm} \ mathrm}}}} \}}}}}}}}}}} \ (\ mathrm Ommand {\ norm}} [1] {1] {{{{\ | # | 1 \ |}} {\ | # 1, # 1, # 2 \ rangmn} [2] {\ newcommand {\ mathrm} \ span} \ {span}} \) \ (\ newcommand {\ id {{\ mathrm {id}} \) \ (\ newcommand {\ span} {\ mathhrm {span}} \) \ (\ newcommand {\ kernel} {\ math {null} \) \ (\ mathrm {range} \ \ (Bereich {null {null {null {null {null {null range} \ (} \) \ (\ mathrm {r}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}} }}}}} \ D { \ Imaginarypart} {\ mathrm {im} \) \ (\ mathrm {arg}}}}}}}}}}}}}}}}}}}}}}}}} }}}} {\ mathhrm}}}} {\ mathhrm}}}}} \ (\ | # 1 \ |} [1] {\ | # 1 \ | \ Newcommand} [2] {\ nner} [2 \ | ] {\ Langle # 1, # 1 \ rangle}}}}} \ (\ mathrm {span} \) \ (\ nwcommand {\ aa \ unicode [.8,0] {x212b} \)

Obwohl der Probe t -Test seine Verwendung hat, ist er nicht das typischste Beispiel für einen t -Test¹⁸⁹.Eine viel häufigere Situation tritt auf, wenn Sie zwei verschiedene Gruppen von Beobachtungen haben.In der Psychologie entspricht dies tendenziell zwei verschiedenen Gruppen von Teilnehmern, bei denen jede Gruppe einem anderen Zustand in Ihrer Studie entspricht.Für jede Person in der Studie wird eine gewisse variable Ergebnisergebnis gemessen, und die von den beiden Gruppen durchgeführte Forschungsfrage ist, ob die beiden Gruppen den gleichen Bevölkerungsdurchschnitt haben oder nicht.Dies ist die Situation, in der der t -Samples t -Test unabhängiger Proben ausgelegt ist.

Daten

Angenommen, wir haben 33 Studenten, die die Statistikkonferenzen von Dr. Harpo übernehmen, und Dr. Harpo qualifiziert keine Kurve.Tatsächlich ist die Qualifikation von Dr. Harpo etwas mysteriös, daher wissen wir wirklich nichts über die durchschnittliche Bewertung für die gesamte Klasse.Es gibt zwei Tutoren für die Klasse, Anastasia und Bernadette.Es gibt n₁= 15 Schüler in Anastasia Tutorials und n₂= 18 in Bernadette Tutorials.Die Forschungsfrage, die mich interessiert, ist, ob Anastasia oder Bernadette ein besserer Tutor ist oder ob es keinen großen Unterschied macht.Dr. Harpo sendet mich per E -Mail an die Kursbewertungen in der DateiHarpo.rdata.Wie üblich werde ich die Datei laden und einen Blick darauf werfen, welche Variablen sie enthält:

Belastung("./Rbook-master/data/harpo.rdata")str(Harpo)

## 'Data.Frame': 33 Obs.von 2 Variablen: ## $ Klasse: Num 65 72 66 74 73 71 66 76 69 79 ... ## $ Tutor: Faktor mit 2 Ebenen "Anastasia", "Bernadette": 1 2 2 1 1 2 2 2 2 22 ...

Wie wir sehen können, gibt es nur einen Datenrahmen mit zwei Variablen.GradyTutor.Die VariableGradEs ist ein numerischer Vektor, der die Qualifikationen aller n = 33 Studenten enthält, die Dr. Harpos Klasse belegen.Die VariableTutorEs ist ein Faktor, der angibt, wer jeder Schüler war.Im Folgenden finden Sie die ersten sechs Beobachtungen dieses Datensatzes:

Kopf(Harpo)

Tutor ## Klasse ## 1 65 Anastasia ## 2 72 Bernadette ## 3 66 Bernadette ## 4 74 Anastasia ## 5 73 Anastasia ## 6 71 Bernadette

Wir können Strümpfe und Standardabweichungen unter Verwendung von Funktionen berechnenbedeuten ()ySD ().Anstatt die Ausgabe R zu zeigen, ist hier eine kleine angenehme Zusammenfassung Tabelle:

	Medien	std dev	N
Anastasia -Studenten	74,53	9.00	15
Bernadette Alumnos	69.06	5.77	18

Um ihm eine detailliertere Vorstellung davon zu geben, was hier passiert, habe ich Histogramme gezeichnet, die die Verteilung der Qualifikationen für beide Tutoren zeigen (Abbildung 13.6 und 13.7).Die Inspektion dieser Histogramme legt nahe, dass Schüler der Anastasia -Klasse im Durchschnitt etwas bessere Qualifikationen erhalten können, obwohl sie auch etwas variabler zu sein scheinen.

13.3: La prueba t de Muestras Independientes (Prueba de Student) (2)

13.3: La prueba t de Muestras Independientes (Prueba de Student) (3)

Hier ist ein einfacheres Diagramm, das die entsprechenden Mittelwerte und Konfidenzintervalle für beide Gruppen von Schülern zeigt (Abbildung 13.8).

13.3: La prueba t de Muestras Independientes (Prueba de Student) (4)

Wir präsentieren den Test

DerT Test unabhängiger ProbenEs kommt auf zwei verschiedene Arten, die von Studenten und Welchs, der ursprüngliche Schüler t -Test, den ich in diesem Abschnitt beschreiben werde, ist der einfachste der beiden, basiert jedoch auf viel restriktiveren Annahmen als der T -Test Welch.Angenommen, Sie möchten einen bilateralen Test ausführen, ist das Ziel zu bestimmen, ob zwei "unabhängige Proben" von Populationsdaten mit demselben Durchschnitt (der Nullhypothese) oder unterschiedlichen Mitteln (die alternative Hypothese) extrahiert werden.Wenn wir "unabhängige" Proben sagen, meinen wir hier wirklich, dass es keine besondere Beziehung zwischen den Beobachtungen in beiden Proben gibt.Dies macht zu diesem Zeitpunkt wahrscheinlich nicht viel Sinn, aber es wird klarer, wenn wir über den T -Test der Proben sprechen können, die später gestoppt werden.Im Moment weisen wir nur darauf hin, dass, wenn wir ein experimentelles Design haben, bei dem die Teilnehmer zufällig einer von zwei Gruppen zugeordnet sind und wir wollen (anstelle eines Drehmoment -T -Tests).

Nun, dann lassen wir μ₁Bezeichnen Sie den wahren Bevölkerungsdurchschnitt für Gruppe 1 (z. B. Anastasia -Studenten) und μ₂Es wird der wahre Bevölkerungswert für Gruppe 2 sein (z. B. Bernadette -Studenten).¹⁹⁰Und wie immer werden wir gehen\ (\ bar {x} _ {1} \)y\ (\ bar {x} _ {2} \)Wir werden die für beide Gruppen beobachteten Probenstrümpfe bezeichnen.Unsere Nullhypothese legt fest, dass die beiden Populationsmittel identisch sind (μ₁= m₂) und die Alternative dazu ist, dass sie es nicht sind (μ₁≠ m₂).Geschrieben in Mathematik-das ist ...

_{H_{0: m}1_{= m}2}

_{H_{1: m}1_{≠ m}2}

13.3: La prueba t de Muestras Independientes (Prueba de Student) (5)

Um einen Hypothesentest zu erstellen, der dieses Szenario verwaltet, weisen wir zunächst darauf hin, dass der Unterschied zwischen den Mitteln der Bevölkerung, wenn die Nullhypothese wahr istgenauCero, μ₁- M₂= 0 Infolgedessen basiert eine diagnostische Teststatistik auf der Differenz zwischen den beiden Mitteln der Stichprobe.Denn wenn die Nullhypothese wahr ist, würden wir warten

\ (\ bar {x} _ {1} \)- -\ (\ bar {x} _ {2} \)

Seiziemlich knappVon Null.Wie wir jedoch bei unseren Tests einer Probe gesehen haben (dh der Z -Test einer Probe und den t -Test einer Probe) müssen wir genau seinwie knappVon Null dieser Unterschied

\ (\ t = {\ bar {x} _1 - \ bar {x} _2 \ over se} \)

Wir müssen nur herausfinden, was diese Standardfehlerschätzung wirklich ist.Dies ist etwas komplizierter als bei einem der beiden bisher gesehenen Tests. Wir müssen es also viel genauer überprüfen, um zu verstehen, wie es funktioniert.

"Gruppierte Schätzung" der Standardabweichung

Im ursprünglichen "t -Test" gehen wir davon aus, dass die beiden Gruppen die gleiche Standard -Populationsabweichung haben: Unabhängig davon, ob die Bevölkerungsmittel dieselben sind, gehen wir davon aus, dass die Bevölkerungsstandardabweichungen identisch sind, σ₁= m₂.Da wir davon ausgehen, dass die beiden Standardabweichungen gleich sind, senken wir die Unterlagen und bezeichnen beide als σ.Wie sollen wir das schätzen?Wie sollte eine einzelne Schätzung einer Standardabweichung erstellt werden, wenn wir zwei Proben haben?Die Antwort ist im Grunde gemittelt.Nun, so etwas wie.Eigentlich nehmen wir einen Durchschnittgewichtetder Schätzungen vonVarianz, dass wir als unsere benutzenGruppierungsvarianzschätzung.Das für jede Probe zugewiesene Gewicht entspricht der Anzahl der Beobachtungen in dieser Stichprobe, außer 1. mathematisch können wir dies als schreiben

\ (\ \ Omega_ {1} \)= N₁–1

\ (\ \ Omega_ {2} \)= N₂–1

Nachdem wir jeder Probe Pesos zugewiesen haben, berechnen wir die gruppierte Schätzung der Varianz, die den gewichteten Durchschnitt der beiden Varianzschätzungen nimmt.\ (\ \ Hat {\ sigma_1}^2 \)y\ (\ \ Hat {\ sigma_2}^2 \)

\ (\ \ Hat {\ sigma_p}^2 = {\ Omega_ {1} \ Hat {\ sigma_1}^2+\ omega_ {2} \ Hat {\ sigma_2}^2 \ \ Omega_ {1}+{1} {1} {1} {1 {1} \ Omega_ {1 \ Omga_{2}} \)

Schließlich konvertieren wir die Varianzschätzung in eine geschätzte Schätzung der gruppierten Standardabweichung, wobei wir die Quadratwurzel einnehmen.Dies gibt uns die folgende Formel für\ (\ \ Hat {\ sigma_p} \)Anwesend

\ (\ \ Hat {\ sigma_p} = \ sqrt {\ Omega_1 \ Hat {\ sigma_1}^2+\ omega_2 \ Hat {\ sigma_2}^2 \ over \ Omega_1+\ \ omega_2} \)

Und wenn Sie mental zurückzahlen\ (\ \ Omega_1 \)= N1 - 1 und\ (\ \ Omega_2 \)= N2 - 1 In dieser Gleichung erhalten Sie eine sehr hässliche Formel;Eine sehr hässliche Formel, die tatsächlich die "Standard" -Form der Beschreibung der Ausgabe der Standardabweichung gruppiert zu sein scheint.Es ist jedoch nicht meine bevorzugte Art, über gruppierte Standardabweichungen nachzudenken.¹⁹¹

Die gleiche Gruppe gruppiert, anders beschrieben

Ich denke lieber das.Unser Datensatz entspricht wirklich einer Reihe von n -Beobachtungen, die in zwei Gruppen eingeteilt werden.Dann verwenden wir die X -Notation_ICHBeziehen Sie sich auf die Qualifikation, die der I-Best-Student in der K-Tutorial-Gruppe erhalten hat: Das heißt, x₁₁Es ist die Qualifikation des ersten Schülers in der Anastasia -Klasse, x₂₁Es ist sein zweiter Schüler und so weiter.Und wir haben zwei separate Gruppensocken\ (\ \ bar {x_1} \)y\ (\ \ bar {x_2} \), auf die wir uns "Generell" mit der Notation beziehen konnten\ (\ \ bar {x_k} \)Das heißt, die durchschnittliche Bewertung für die K-Tutorial-Gruppe.So weit, ist es gut.Da jeder Schüler in eines der beiden Tutorials fällt, können wir seine Abweichung von den Gruppenmedien als Unterschied beschreiben

\ (\ X_ {i} - \ bar {x_k} \)

Warum also nicht nur diese Abweichungen verwenden (dh, inwieweit sich die Qualifikation jedes Schülers von der durchschnittlichen Notiz in seinem Tutorial unterscheidet?) Erinnern Sie sich, dass eine Varianz nur der Durchschnitt vieler Quadratsabweichungen ist.Mathematisch könnten wir es so schreiben:

\ (\ ∑_ {i} (x_ {i}-\ bar {x} _k)^2 \ über n \)

Wo die Notation "_ICH"Es ist eine faule Art zu sagen" zu berechnen, eine Summe zu berechnen, die alle Schüler in allen Tutorials betrachtet ", da jeder" IK "einem Schüler entspricht.¹⁹²Wie wir jedoch in Kapitel 10 gesehen haben, erzeugt die Berechnung der Varianz durch Teilen durch n eine voreingenommene Schätzung der Populationsvarianz.Und zuvor mussten wir uns durch n - 1 teilen, um dies zu beheben.Wie ich damals erwähnte, ist der Grund, warum diese Verzerrung existiert, darin, dass die Varianzschätzung auf dem Durchschnitt der Stichprobe basiert.Und in dem Maße, in dem der Durchschnitt der Stichprobe nicht dem Bevölkerungsdurchschnitt entspricht, kann er unsere Schätzung der Varianz systematisch verzerren.Aber diesmal vertrauen wirdesBeispiel Medien!Bedeutet das, dass wir mehr Vorurteile haben?Ja tut es.Und das bedeutet, dass wir jetzt durch n - 2 statt n - 1 teilen müssen, um unsere Ausgabe der gruppierten Varianz zu berechnen?Nur weil...

\ (\ Hat {\ sigma_ {p} \ ^{2} = \ frac {\ sum_ {i k} \ links (x_ {i k} -x_ {k} \ rechts) ^{2} {n-2} \)

Ah, und wenn Sie die Quadratwurzel davon übernehmen, erhalten Sie\ (\ \ Hat {\ sigma_ {p}} \)Die Standardabweichungsschätzung gruppiert.Mit anderen Worten, die Berechnung der gruppierten Standardabweichung ist nichts Besonderes: Sie unterscheidet sich nicht besonders von der Berechnung der regulären Standardabweichung.

Schließen Sie den Test ab

Unabhängig davon, wie Sie darüber nachdenken möchten, haben wir jetzt unsere gruppierte Schätzung der Standardabweichung.Von nun an werde ich den Narren fallen lassen, P hochgehen und diesen Schätzung einfach bezeichnen\ (\ \ Hat {\ sigma} \).Brillant.Denken wir nun über den blutigen Hypothesentest nach, okay?Alle unsere Gründe, diese Gruppe zu berechnen, war, dass wir wussten, dass dies bei der Berechnung unserer Schätzung von nützlich sein würdeStandart Fehler.Aber Standardfehler vonDas?Im t -Test einer Probe war es der Standardfehler des Probenmittelwerts SE (\ (\ \ bar {x} \)) und von SE (\ (\ \ bar {x} = \ sigma/ \ sqrt {n} \)Dies war der Nenner unserer Statistik t).Diesmal haben wir jedochdesProbenstrümpfe.Und was uns besonders interessiert, ist der Unterschied zwischen den beiden\ (\ \ bar {x_1} \)- -\ (\ \ bar {x_2} \).Infolgedessen ist der Standardfehler, den wir teilen müssenStandarddifferenzfehlerzwischen.Solange die beiden Variablen wirklich die gleiche Standardabweichung haben, ist unsere Schätzung für den Standardfehler

\ (\ operatorname {se} \ links (\ bar {x} _ {1}-\ bar {x} _ {2} \ right) = \ Hat {\ sigma} \ sqrt {\ dfrac {1 {n_ {n_ {1}}+\ dfrac {1} {n_ {2}}} \)

Und unsere T -Statistiken sind daher

\ (t = \ dfrac {\ bar {x} _ {1}-\ bar {x} _ {2}} {\ operatorname {se} \ links (\ bar {x} _ {1}-\ bar {x {x} _ {2} \ rechts)} \)

(Schockierend, richtig?) Solange die Nullhypothese wahr ist und alle Annahmen des Tests erfüllt sind.Die Freiheitsgrade sind jedoch etwas anders.Wie üblich können wir uns die Freiheitsgrade vorstellen, der Anzahl der Datenpunkte mit Ausnahme der Anzahl der Einschränkungen gleich zu sein.In diesem Fall haben wir N -Beobachtungen (N1 in Probe 1 und N2 in Probe 2) und 2 Einschränkungen (das Mittelwert der Probe).Dann sind die Gesamtfreiheitsgrade für diesen Test N - 2.

Tests bei r

Es ist nicht überraschend, dass Sie einen unabhängigen Proben -T -Test mit der Funktion durchführen könnent.test ()(Abschnitt 13.7), aber ich werde wieder mit einer etwas einfacheren Funktion im Paket beginnenLSR.Diese Funktion wird unbegründet genanntIndependentSAmpletTest ().Denken Sie zunächst daran, dass unsere Daten so aussehen:

Kopf(Harpo)

Tutor ## Klasse ## 1 65 Anastasia ## 2 72 Bernadette ## 3 66 Bernadette ## 4 74 Anastasia ## 5 73 Anastasia ## 6 71 Bernadette

Die Ergebnisvariable für unseren Test ist dieQualifikationdes Schülers, und die Gruppen sind in Bezug auf die definiertTutorFür jede Klasse.Es wird Sie wahrscheinlich nicht zu sehr überraschen, um zu sehen, dass wir den gewünschten Test in Bezug auf eine Formel R beschreiben werden, die so liestGrado ~ Tutor.Der spezifische Befehl, den wir brauchen, ist:

IndependentSsamplestTest(Formel = Grad ~ Tutor,# Formel Angabe von Ergebnis- und GruppenvariablenData = Harpo,# Datenrahmen, der die Variablen enthältvar.equal = true# Angenommen, die beiden Gruppen haben die gleiche Varianz)

## ## Student Unabhängige Muster T-Test ## ## Ergebnisvariable: Klasse ## Gruppierungsvariable: Tutor ## ## Deskriptive Statistik: ## Anastasia Bernadette ## Mittelwert 74.533 69.056 ## Std Dev.8.999 5.775 ## ## Hypothesen: ## NULL: Population bedeutet für beide Gruppen gleich ## Alternative: Unterschiedliche Bevölkerung in jeder Gruppe ## ## Testergebnisse: ## T-Statistik: 2.115 ## Freiheitsgrade: 31### P-Wert: 0.043 ## ## Weitere Informationen: ## Zweiseitiger 95% -Konfidenzintervall: [0.197, 10.759] ## Geschätzte Effektgröße (Cohen's D): 0.74

Die ersten beiden Argumente müssen Ihnen bekannt sein.Die erste ist die Formel, die R angibt, welche Variablen zu verwenden sind, und die zweite den Namen des Datenrahmens, der diese Variablen speichert.Das dritte Argument ist nicht so offensichtlich.Beim Sagenvar.equal = Verdadero, was wir wirklich tun, ist zu sagen, den t -Test unabhängiger Proben von zu verwendenStudent.Mehr dazu später.Lassen Sie uns vorerst das Stück ignorieren und den Ausgang sehen:

Der Ausgang hat eine sehr vertraute Form.Erstens erzählt er Ihnen, welchen Test er durchgeführt hat, und erzählt Ihnen die Namen der Variablen, die Sie verwendet haben.Der zweite Teil des Exit meldet die Beispielmittel und Standardabweichungen für beide Gruppen (dh beide Tutorial -Gruppen).Der dritte Abschnitt der Ausgabe legt die Nullhypothese und die alternative Hypothese auf ziemlich explizite Weise fest.Dann informieren Sie die Testergebnisse: Zum letzten Mal bestehen die Testergebnisse aus einer T -Statistik, den Freiheitsgraden und dem Wert p.Der letzte Abschnitt meldet zwei Dinge: Er gibt Ihnen ein Konfidenzintervall und eine Effektgröße.Ich werde später über die Größen der Effekte sprechen.Das Konfidenzintervall sollte jedoch jetzt sprechen.

Es ist sehr wichtig, sich darüber im Klaren zu sein, was sich dieses Vertrauensintervall wirklich bezieht: Es ist ein Konfidenzintervall für dieUnterschiedUnter den Gruppenstrümpfen.In unserem Beispiel hatten Anastasia -Studenten eine durchschnittliche Anmerkung von 74,5 und die Bernadette -Schüler hatten eine durchschnittliche Note von 69,1, so dass der Unterschied zwischen den beiden Stichproben mit 5,4 liegt.Aber natürlich könnte der Unterschied zwischen den Bevölkerungsmitteln größer oder weniger sein.Das von der Funktion gemeldete KonfidenzintervallIndependentSAmpletTest ()Es sagt Ihnen, dass es eine Wahrscheinlichkeit von 95% gibt, dass der tatsächliche Unterschied zwischen den Mitteln zwischen 0,2 und 10,8 liegt.

In jedem Fall ist der Unterschied zwischen den beiden Gruppen (kaum) signifikant, sodass wir das Ergebnis mit wie folgt schreiben können:

Die Mittelklasse in der Anastasia -Klasse betrug 74,5% (STD Dev = 9,0), während der Durchschnitt in der Klasse von Bernadette 69,1% (STD Dev = 5,8) betrug.Ein Test unabhängiger Studentenproben zeigte, dass dieser Unterschied von 5,4% signifikant war (t (31) = 2,1, p <0,05, IC₉₅= [0,2,10,8], d = 0,74), was darauf hindeutet, dass es einen echten Unterschied in den Lernergebnissen gegeben hat.

Beachten Sie, dass ich das Konfidenzintervall und die Effektgröße in den STAT -Block aufgenommen habe.Die Leute tun das nicht immer.Zumindest würden Sie erwarten, dass die Statistik t, die Freiheitsgrade und den Wert p sehen.Dann sollten Sie so etwas einschließen: t (31) = 2,1, p <0,05.Wenn die Statistiker ihre eigenen verlassen, würden alle auch das Konfidenzintervall und wahrscheinlich auch das Maß für die Effektgröße melden, da sie nützliche Dinge sind, die zu wissen sind.Das wirkliche Leben funktioniert jedoch nicht immer so, wie Statistiken funktionieren sollen: Sie müssen ein Urteil fällen, der darauf basiert, ob Sie glauben, dass sie Ihren Lesern helfen wird, und (wenn Sie einen wissenschaftlichen Artikel schreiben) der redaktionelle Standard für das Magazin in Frage.Einige Magazine erwarten Berichte über Effektgrößen, andere nicht, in einigen wissenschaftlichen Gemeinschaften ist es eine Standardpraxis, Konfidenzintervalle zu melden, in anderen nicht.Sie müssen herausfinden, was Ihr Publikum erwartet.Aber nur aus Gründen der Klarheit, wenn Sie meine Klasse besuchen wollen Sollte es tun.

Positive und negative t -Werte

Bevor ich über die Annahmen des T -Tests sprach, möchte ich einen zusätzlichen Punkt über die Verwendung von T -Tests in der Praxis machen.Die erste hängt mit dem Vorzeichen der T -Statistik zusammen (dh wenn es sich um eine positive oder negative Zahl handelt).Ein sehr häufiges Anliegen, das die Schüler haben, wenn sie ihren ersten t -Test durchführen, ist, dass sie häufig mit negativen Werten für die T -Statistik enden und nicht wissen, wie sie es interpretieren können.Tatsächlich ist es für zwei Personen, die unabhängig voneinander arbeiten, nicht ungewöhnlich, die mit R -Exits enden, die fast identisch sind, außer dass eine Person negative T -Werte hat und der andere einen positiven T -Wert hat.Unter der Annahme, dass Sie einen zweiseitigen Test durchführen, sind die p -Werte identisch.In einer genaueren Prüfung werden die Schüler feststellen, dass Vertrauensintervalle auch entgegengesetzte Zeichen haben.Dies ist vollkommen in Ordnung: Sobald dies geschieht, werden Sie feststellen, dass die beiden Versionen des R -Ausgangs auf etwas unterschiedliche Weise auftreten, um den T -Test auszuführen.Was hier passiert, ist sehr einfach.Die Statistik, die R hier berechnet, ist immer die Form

\ (t = \ dfrac {\ text {LAP} 1) - (\) {} {sexhm {

Wenn "Durchschnitt 1" größer als "durchschnittlich 2" ist, ist die Statistik t positiv, während wenn "durchschnittlich 2" größer ist, ist die Statistik t negativ. Auf die gleiche Weise ist das Konfidenzintervall, dass R das Konfidenzintervall für ist Die Differenz "(Durchschnitt 1) weniger (durchschnittlich 2)", die das Gegenteil von dem ist, was Sie erhalten würden, wenn Sie das Konfidenzintervall für die Differenz berechnen "(Durchschnitt 2) weniger (durchschnittlich 1)".

Nun, das ist ganz einfach, wenn Sie darüber nachdenken, aber jetzt betrachten Sie unseren T -Test, um die Anastasia -Klasse mit der Bernadette -Klasse zu vergleichen.Was wir "durchschnittlich 1" bezeichnen sollten und was wir "durchschnittlich 2" nennen sollten.Es ist willkürlich.Es ist jedoch wirklich notwendig, einen von ihnen als "durchschnittlich 1" und den anderen als "durchschnittlich 2" zu bezeichnen.Es ist nicht überraschend, dass die Art und Weise, wie R dies verwaltet, dies auch ziemlich willkürlich ist.In früheren Versionen des Buches habe ich versucht, es zu erklären, aber nach einer Weile gab ich mir, weil es nicht so wichtig ist und um ehrlich zu sein, kann ich mich nie daran erinnern.Immer wenn ich ein wesentliches Ergebnis des T -Tests bekomme und ich herausfinden möchte, welcher Durchschnitt der größte ist, versuche ich nicht, ihn zu lösen.Warum sollte ich das machen?Es ist Unsinn.Es ist einfacher, nur die realen Medien zu betrachten, da die Ausgabe RS sie wirklich zeigt!

Hier ist das Wichtigste.Weil es wirklich egal ist, was R druckt, versuche ich normalerweise dazuBerichtT Statistiken so, dass die Zahlen mit dem Text übereinstimmen.Das ist es, was ich meine ... Angenommen, ich möchte in meinem Bericht schreiben, "die Art von Anastasia hat höhere Bewertungen als Bernadettes Klasse".Die Formulierung hier impliziert, dass die Anastasia -Gruppe die erste ist, also macht es Sinn

Die Anastasia -Klasse hatte höhere Klassen als Bernadette (t (31) = 2,1, p = 0,04).

(Eigentlich würde ich das Wort "überlegen" im wirklichen Leben nicht betonen, ich tue es nur, um den Punkt zu betonen, dass "Superior" positive t -Werte entspricht).Nehmen wir hingegen an, dass die Phrasierung, die ich verwenden wollte, zuerst die Art von Bernadette aufgelistet hat.Wenn ja, ist es sinnvoller, seine Klasse wie Gruppe 1 zu behandeln, und wenn ja, sieht das Schreiben so aus:

Die Klasse von Bernadette hatte niedrigere Bewertungen als die Anastasia -Klasse (t (31) = –2,1, p = 0,04).

Da ich über eine Gruppe spreche, die bei dieser Gelegenheit "niedrigere" Bewertungen hat, ist es sinnvoller, die negative Form der Statistik t zu verwenden.Es lässt es einfach klarer lesen.

Eine letzte Sache: Denken Sie daran, dasskann nichtTun Sie dies für andere Arten von Teststatistiken.Es funktioniert für T-Tests, wäre aber für die F-Chi-Quadrat-Tests oder tatsächlich für die meisten Tests, die ich in diesem Buch spreche, nicht von Bedeutung.Überwinden Sie diesen Rat also nicht!Ich spreche hier wirklich nur über T -Tests und sonst nichts!

Beweisannahmen

Wie immer basiert unser Hypothesentest auf einigen Annahmen.Also, was sind sie?Für Student t -Test gibt es drei Annahmen, von denen einige zuvor im Zusammenhang mit dem t -Test einer Stichprobe gesehen wurden (siehe Abschnitt 13.2.3):

Normal.Wie der t -Test einer Stichprobe sollen die Daten normal verteilt werden.Insbesondere gehen wir davon aus, dass beide Gruppen normal verteilt sind.In Abschnitt 13.9 werden wir diskutieren, wie die Normalität nachgewiesen werden kann, und in Abschnitt 13.10 werden wir mögliche Lösungen erörtern.
Unabhängigkeit.Noch einmal wird angenommen, dass die Beobachtungen unabhängig befragt werden.Im Kontext des Schülertests hat dies zwei Aspekte.Zunächst gehen wir davon aus, dass die Beobachtungen in jeder Probe unabhängig voneinander sind (genau das gleiche wie für den Nachweis einer Probe).Wir gehen jedoch auch davon aus, dass es keine Abhängigkeiten zwischen Proben gibt.Wenn sich beispielsweise herausstellt, dass Sie einige Teilnehmer in beide experimentellen Bedingungen Ihrer Studie aufgenommen haben (zum Beispiel, indem Sie versehentlich unter verschiedenen Bedingungen registriert werden), gibt es einige Querprobeneinheiten, die Sie nehmen sollten berücksichtigen.
hom*ogenität der Varianz(auch "hom*ozedastizität" genannt).Die dritte Annahme ist, dass die Standardpopulationsabweichung in beiden Gruppen gleich ist.Sie können diese Annahme mit dem Lichttest versuchen, über den ich später im Buch sprechen werde (Abschnitt 14.7).Es gibt jedoch ein sehr einfaches Mittel für diese Annahme, über die ich im nächsten Abschnitt sprechen werde.