Matroids Matheplanet Forum Index
Moderiert von Kleine_Meerjungfrau Monkfish epsilonkugel
Mathematik » Stochastik und Statistik » Bachelorarbeit Datenanalyse
Druckversion
Druckversion
Antworten
Antworten
Autor
Universität/Hochschule Bachelorarbeit Datenanalyse
Mazl_99
Neu Letzter Besuch: im letzten Monat
Dabei seit: 13.04.2021
Mitteilungen: 4
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Themenstart: 2021-04-13


Hallo allerseits! Ich beschäftige mich im Zuge meiner Bachelorarbeit mit dem Einfluss von Kläranlagen auf Fließgewässer in Bezug auf verschiedene Parameter (Temperatur, Sauerstoff,...). Ich habe zu jeder Kläranlage von 2010 bis 2020 vier Datenpunkte, jeweils zwei aus dem zweiten Quartal und zwei aus dem Dritten. In Excel habe ich verschiedene Vergleiche angestellt (die zwei Datenreihen zu jeder Ka und Parameter in einem Quartal miteinander, Vergleich zweites und drittes Quartal bspw). Dazu hab ich den Zwei-Stichproben-t-Test für abhängige Stichproben genommen, der erschien mir in meiner Internetrecherche am sinnvollsten.
Nun zu meinem Problem: Mein Betreuer möchte ein Kapitel darüber haben, ob die extremen Hitzeperioden 2018,19&20 herausstechen. Das heißt, ich muss in Quartal 3 die Werte von 2010-17 denen von 2018-20 gegenüberstellen. Da diese Messreihen unterschiedlich groß sind, weigert sich Excel den von mir gewählten Test durchzuführen. Was kann ich tun? Welche alternativen Tests gibt es, oder sollte man mit 3 Werten keine Statistik betreiben?
Vielen Dank im Voraus



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Delastelle
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 17.11.2006
Mitteilungen: 1665
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.1, eingetragen 2021-04-14


Hallo Mazl_99!

Willkommen auf dem Matheplaneten!

Zu Deiner Frage kann ich wenig sagen.
Mir ist nur eingefallen:
Bei der großen Hitze 2019 hatten wir in Thüringen einmal 37°C, in Köln waren es ca. 42 Grad.
Eventuell kannst Du für die Orte der Kläranlagen Klimadaten finden
(anhand der geografischen Koordinaten falls vorhanden).
Dies könnte bei der Beurteilung eine Rolle spielen...


Viele Grüße
Ronald



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
luis52
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 24.12.2018
Mitteilungen: 513
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.2, eingetragen 2021-04-14


Moin Mazl_99,

willkommen auf dem MP.

Ich lese aus deiner Frage heraus, dass du mit 8 Werten $x_1,\dots,x_8$ fuer die Jahre 2010-2018 und 3 Werten $y_1,y_2,y_3$ fuer die Jahre 2018-2020 auf Unterschiede in den Zeitraeumen testen willst.

Ich vermute, dass du den Zwei-Stichprobentest anwenden willst. Wie das in EXCEL geht, kann ich dir leider auch nicht sagen. Aber mit Googlen von "two sample t test excel" wird man schnell fuendig. In R gibt es den Test als $\texttt{t.test()}$, mit oder ohne Annahme der Varianzhomogenitaet.

vg Luis



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Mazl_99
Neu Letzter Besuch: im letzten Monat
Dabei seit: 13.04.2021
Mitteilungen: 4
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.3, vom Themenstarter, eingetragen 2021-04-14


Vielleicht formuliere ich meine Frage noch einmal anders: gibt es einen statistischen Test, für den es (auch in Excel) egal ist, dass die Stichprobenumfänge unterschiedlich groß sind?



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
luis52
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 24.12.2018
Mitteilungen: 513
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.4, eingetragen 2021-04-14


Schon gegoogelt? Siehe mal hier.

vg Luis



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Mazl_99
Neu Letzter Besuch: im letzten Monat
Dabei seit: 13.04.2021
Mitteilungen: 4
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.5, vom Themenstarter, eingetragen 2021-04-15


Ja, mit google hab ich es schon versucht. Und dein Video war zunächst wirklich hilfreich, bis ich feststellen musste, dass der darin gezeigte Test für UNABHÄNGIGE Stichproben verwendet wird. Bei mir handelt es sich jedoch um verbundene Stichproben :/



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
luis52
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 24.12.2018
Mitteilungen: 513
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.6, eingetragen 2021-04-15


2021-04-15 10:18 - Mazl_99 in Beitrag No. 5 schreibt:
Ja, mit google hab ich es schon versucht. Und dein Video war zunächst wirklich hilfreich, bis ich feststellen musste, dass der darin gezeigte Test für UNABHÄNGIGE Stichproben verwendet wird. Bei mir handelt es sich jedoch um verbundene Stichproben :/

In Beitrag #2 habe ich beschrieben, wie *ich* deine Fragestellung verstehe. Leider hast du mich nicht korrigiert, so dass ich nach wie vor im Dunklen tappe.

Wenn du gebundene Beobachtungspaare $(x_1,y_1),\dots,(x_n,y_n)$ (z.B. vorher-nachher) vorliegen hast, so kannst du ja Differenzen $x_1-y_1,\dots,x_n-y_n$ bilden und damit einen Ein-Stichprobentest durchfuehren. Der sollte auch in EXCEL ohne Weiteres vorhanden sein. Ansonsten weiss ich nicht, was du unter einem Zwei-Stichproben-t-Test für abhängige Stichproben verstehst, zumal du jetzt von gebundenen Stichproben sprichst.

vg Luis



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Mazl_99
Neu Letzter Besuch: im letzten Monat
Dabei seit: 13.04.2021
Mitteilungen: 4
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.7, vom Themenstarter, eingetragen 2021-04-15


Hallo Luis,

deine Interpretation in Abschnitt 1 von Beitrag 2 ist richtig. Abschnitt 2 jedoch nicht so ganz, das steht ja schon in meiner ursprünglichen Frage: Excel möchte den zwei-Stcihproben-t-Test für verbundene Stichproben nicht machen, da die Stichprobe 2010-17 mehr Werte enthält ist als 2018-20. Entsprechend ist es mir egal, welcher Test nun abhängige Stichproben unterschiedlicher Stichprobengrößen vergleichen kann. Ich hab halt in den betrachteten Fließgewässern zwei feste Messpunkte zu jeder Kläranlage. Nennen wir Messpunkt 1 also mal "o" und Messpunkt 2 "u". Jetzt habe ich an o und u von 2010-20 jedes Jahr zwei Messwerte zu den verschiedenen Parametern (wobei wir ja bei den Hitzeperioden nur Quartal 3 betrachten). Ich kann ja nicht sagen, dass die Stichprobe 2018-20 unabhängig ist von 2010-17, da sich die Daten ja auf denselben Messpunkt beziehen. Also, ich möchte bei o und u überprüfen, ob die Hitzeperioden am jeweiligen Punkt signifikant herausstechen.



Eine Notiz zu diese Forumbeitrag schreiben Notiz   Profil  Quote  Link auf diesen Beitrag Link
Mazl_99 hat die Antworten auf ihre/seine Frage gesehen.
Mazl_99 wird per Mail über neue Antworten informiert.
Neues Thema [Neues Thema] Antworten [Antworten]    Druckversion [Druckversion]

 


Wechsel in ein anderes Forum:
 Suchen    
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2021 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]