Matroids Matheplanet Forum Index
Moderiert von luis52
Mathematik » Stochastik und Statistik » Prüfen auf identische Verteilungen
Autor
Kein bestimmter Bereich Prüfen auf identische Verteilungen
cheo
Neu Letzter Besuch: im letzten Quartal
Dabei seit: 03.02.2023
Mitteilungen: 3
  Themenstart: 2023-02-03

Hallo zusammen, ich hoffe, der Betreff führt nicht in die Irre... Ich bin leider fachfremd und mein Stochastikwissen ist stark begrenzt. Aber: ich habe eine Frage. Ich habe eine große Anzahl empirischer Daten in Form von Verteilungen gesammelt. Also die Dinger, die sich so toll in Histogrammen visualisieren lassen. Die Abweichungen von einer Normalverteilung sind im Einzelnen recht groß und die Stichprobengrößen (ist das der richtige Ausdruck?) liegen jeweils im mittleren bis hohen vierstelligen Bereich. Für meine Belange ist es sinnvoll, jeweils zwei Verteilungen miteinander zu vergleichen. Ich kann das verbal tun und sagen "Verteilung A und B sehen recht gleich aus, Verteilung B und C hingegen nicht im gleichen Maße"... Aber das ist mir zu subjektiv und höchst unbefriedigend. Gibt es einen Kennwert, der das objektiver kann? Und falls ja; wie kann ich ihn ermitteln? Das Sahnetüpfelchen wäre, wenn es einen Kennwert gäbe, der mir die Wahrscheinlichkeit ausdrückt, mit der meine zwei Verteilungen zur gleichen Gesamtheit gehören. (ich hoffe, dieser Gedanke ist irgendwie legitim und verständlich) Ich habe also jeweils zwei mehr oder minder stark überschneidende Histogramme und möchte irgendeinen Kennwert haben, der den Grad, in welchen sich die Histogramme unterscheiden, in irgendeiner objektiven Weise zusammenfasst. Perfekt wäre, wenn mir jemand sagen kann, ob und wie ich sowas mit Excel umsetzen kann. Ich bin aber auch für etwas Handarbeit offen. Danke schonmal und liebe Grüße


   Profil
luis52
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 24.12.2018
Mitteilungen: 908
  Beitrag No.1, eingetragen 2023-02-03

Moin cheo, willkommen auf dem Matheplanet. Es gibt einige Verfahren zur Ueberpruefung auf identische Verteilungen. Da du anscheinend Bauchgrimmen hast, normalverteilte Daten zu unterstellen, bieten sich vielleicht nichtparametrische Verfahren an, wie der Mann-Whitney-Wilcoxon-Test oder der Kolmogorow-Smirnow-Test. Es koennte sein, dass MWW in EXCEL zur Verfuegung steht, der KS vermutlich nicht. Fuer deine Zwecke duerfte R eine gute Alternative sein. Ein Pruefverfahren, bei dem Histogramme verglichen werden, kenne ich nicht. vg Luis


   Profil
cheo
Neu Letzter Besuch: im letzten Quartal
Dabei seit: 03.02.2023
Mitteilungen: 3
  Beitrag No.2, vom Themenstarter, eingetragen 2023-02-03

zunächst einmal Danke, die Daten sind nach meinem laienhaften Urteil nicht ausreichend normalverteilt, aber ich glaube euch gern, wenn ihr es anders seht: ich habe ein repräsentatives Beispiel hochgeladen hier Inzwischen habe ich einiges probiert, aber die Abweichung ist anscheinend so groß, dass mit ein Zweistichproben t-Test (unterschiedliche Varianzen) nichtmal einen p Wert beschert hat <-- p (Berechnung via Excel) zu gering oder ich mache etwas falsch. Mit der Visualisierung bin ich derweil zufrieden, ich suche jetzt noch einen knackigen statistischen Kennwert. Über den Namen Kolmogorow-Smirnow bin ich heute schon mehrmals gestolpert. Vielleicht bringt ja mein.jpg auch neue Ideen. P.S. vielleicht muss ich noch hinzufügen, dass ich mir recht sicher bin, dass die Verteilungen nicht identisch sind. Was ich suche, ist ein simpler Gradmesser für das Ausmaß des Unterschieds (falls es denn sowas gibt) LG


   Profil
luis52
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 24.12.2018
Mitteilungen: 908
  Beitrag No.3, eingetragen 2023-02-03

Was meinst du mit dass mit ein Zweistichproben t-Test (unterschiedliche Varianzen) nichtmal einen p Wert beschert hat <-- p (Berechnung via Excel) zu gering oder ich mache etwas falsch. Ist der p-Wert sehr klein oder was hat EXCEL dir beschert? Ein sehr kleiner p-Wert ueberrascht bei deiner Graphik nicht. Ein kleiner p-Wert ist ein angemessener Gradmesser für das Ausmaß des Unterschieds. vg Luis


   Profil
cheo
Neu Letzter Besuch: im letzten Quartal
Dabei seit: 03.02.2023
Mitteilungen: 3
  Beitrag No.4, vom Themenstarter, eingetragen 2023-02-03

Excel beschert mir nichts. Also nicht einmal eine 0. Ich hätte vermutet, dass da Probleme mit dem Gleitkomma auftreten und Excel einfach aufgibt... Ein anderes tool habe ich bislang noch nicht konsultiert. mal dumm gefragt: ist der p-Wert denn über die Abweichung der Mittelwerte hinaus aussagekräftig?


   Profil
Folgende Antworten hat der Fragensteller vermutlich noch nicht gesehen.
Er/sie war noch nicht wieder auf dem Matheplaneten
luis52
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 24.12.2018
Mitteilungen: 908
  Beitrag No.5, eingetragen 2023-02-03

\(\begingroup\)\(%**************************************************************** %************************** Abkuerzungen ************************ %**************************************************************** \newcommand{\eps}{\epsilon} \newcommand{\veps}{\varepsilon} \) EXCEL hat sicherlich seine Staerken, im Bereich statistischer Analysen eher nicht. Da wuerde ich zu R raten: Spezielle Statistik-Software, leistungsstark, Freeware. Unterstellst du Normalverteilungen, so ist der t-Test in der Tat ein Test auf Gleichheit der Erwartungswerte, also $\text{H}_0:\mu_1=\mu_2$. Der KS-Test ist allgemeiner, indem geprueft wird $\text{H}_0:F_1(x)=F_2(x)$ fuer alle $x\in\IR$. Dabei bezeichnet die $F_j$ die Verteilungsfunktion in Grundgesamtheit $j$. Ein sehr kleiner p-Wert deutet auf starke Unterschiede in beiden Verteilungen hin. vg Luis\(\endgroup\)


   Profil

Wechsel in ein anderes Forum:
 Suchen    
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2023 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]