Die Mathe-Redaktion - 20.08.2018 13:01 - Registrieren/Login
Auswahl
ListenpunktHome
ListenpunktAktuell und Interessant ai
ListenpunktArtikelübersicht/-suche
ListenpunktAlle Links / Mathe-Links
ListenpunktFach- & Sachbücher
ListenpunktMitglieder / Karte
ListenpunktRegistrieren/Login
ListenpunktArbeitsgruppen
ListenpunktSchwätz / Top 15
ListenpunktWerde Mathe-Millionär!
ListenpunktFormeleditor fedgeo
Schwarzes Brett
Aktion im Forum
Suche
Stichwortsuche in Artikeln und Links von Matheplanet
Suchen im Forum
Suchtipps

Bücher
Englische Bücher
Software
Suchbegriffe:
Mathematik bei amazon
Naturwissenschaft & Technik
In Partnerschaft mit Amazon.de
Kontakt
Mail an Matroid
[Keine Übungsaufgaben!]
Impressum

Bitte beachten Sie unsere Nutzungsbedingungen, die Distanzierung, unsere Datenschutzerklärung und
die Forumregeln.

Sie können Mitglied werden. Mitglieder können den Matheplanet-Newsletter bestellen, der etwa alle 2 Monate erscheint.

Der Newsletter Okt. 2017

Für Mitglieder
Mathematisch für Anfänger
Wer ist Online
Aktuell sind 443 Gäste und 21 Mitglieder online.

Sie können Mitglied werden:
Klick hier.

Über Matheplanet
 
Zum letzten Themenfilter: Themenfilter:
Matroids Matheplanet Forum Index
Moderiert von Kleine_Meerjungfrau Monkfish epsilonkugel
Mathematik » Stochastik und Statistik » Regression mit mehreren Messungen pro unabhängiger Variable
Druckversion
Druckversion
Antworten
Antworten
Autor
Kein bestimmter Bereich Regression mit mehreren Messungen pro unabhängiger Variable
zwiebelfisch
Junior Letzter Besuch: in der letzten Woche
Dabei seit: 15.07.2018
Mitteilungen: 12
Aus:
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Themenstart: 2018-07-16


Hi,


da ich meinen anderen Thread nicht mit diversen Fragen überfrachten möchte erstelle ich mal einen neuen. Der Titel mag Murks sein, doch leider ist mir keine korrekte und prägnante Beschreibung eingefallen^^.

Angenommen man möchte die Temperaturabhängigkeit eines elektrischen Widerstandes messen. Der Widerstand soll für fünf verschiedene Temperaturen gemessen werden (die hier mal ohne Fehler eingestellt werden können). Nun misst man für jeden Temperaturschritt mehrmals, sagen wir 10x, den Widerstand.

Trägt man nun die gemessen Werte über der Temperatur auf, bekommt man für jeden Temperaturschritt 10 Werte. Meine Frage ist nun, wie berechnet man hier eine korrekte Regressionskurve, da man ja für jedes x mehrere y hat?

1. Idee: Man berechnet erst den Mittelwert pro Temperaturstufe und berechnet die Regression mit diesen Mittelwerten.
2. Man berechnet die Regression normal und hat dann halt mehrere Werte für jedes x.
3. Wäre 2. letztlich nicht das Gleiche wie 1.?

Wie macht man das denn korrekt?


Was passiert denn, wenn man nun noch Fehler in der Temperatureinstellung, also x, zulässt? Wird das dann einfach so gerechnet, als wären die Widerstandsmessungen an (leicht) unterschiedlichen Temperaturen durchgeführt worden?


Nochmals danke für eure Hilfe!



  Profil  Quote  Link auf diesen Beitrag Link
Kitaktus
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 11.09.2008
Mitteilungen: 5438
Aus: Niedersachsen
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.1, eingetragen 2018-07-17


Wenn an jedem Temperaturschritt die gleiche Anzahl an Messungen durchgeführt wird, dann ergeben 1 und 2 das gleiche.

Rechnet man von Hand, dann bietet es sich an, erst die Mittelwertbildung vorzunehmen, da man dann mit weniger Werten rechnen muss.

Sind zusätzlich die x-Werte leicht unterschiedlich, dann kann man natürlich mit allen einzelnen Wertepaaren rechnen.
In der Regel ist der Fehler aber klein (aber nicht 0), wenn man stattdessen sowohl die x- als auch die y-Werte einer Gruppe mittelt.



  Profil  Quote  Link auf diesen Beitrag Link
zwiebelfisch
Junior Letzter Besuch: in der letzten Woche
Dabei seit: 15.07.2018
Mitteilungen: 12
Aus:
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.2, vom Themenstarter, eingetragen 2018-07-17


dankeschön!



  Profil  Quote  Link auf diesen Beitrag Link
zwiebelfisch
Junior Letzter Besuch: in der letzten Woche
Dabei seit: 15.07.2018
Mitteilungen: 12
Aus:
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.3, vom Themenstarter, eingetragen 2018-07-18


Angenommen man hat drei Messreihen und will aus diesen drei Messreihen nun eine Regression berechnen:

x1	y1	x2	y2	x3	y3
0	1,1	0,2	1,6	0,1	0,48
1	2,1	0,8	2,4	1,1	1,55
2	2,9	2,1	3,5	1,9	2,6
3	3,85	2,9	4,65	3,3	3,4
4	5,1			4,1	4,57
				4,9	5,5

Nimmt man alle Werte gleichzeitig, dann hat die Regressionsgerade eine (so kommt es mir vor) zu geringe Steigung, da sie bei größeren x-Werten eher zu kleine y gemessen werden.

Was wäre denn nun die korrekte Methode daraus eine Regression zu berechnen:

1. alle Werte nehmen und direkt eine Kurve berechnen.
2. für jede der drei Messreihen eine eigene Regression durchführen, und dann die Parameter a1, a2, a3 und b1, b2 und b3 jeweils mitteln?

Rein optisch sieht die 2. Variante besser aus.

Im Unterschied zur Eingangsfrage macht das hier wohl einen Unterschied.

Vielen Dank!



  Profil  Quote  Link auf diesen Beitrag Link
Kitaktus
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 11.09.2008
Mitteilungen: 5438
Aus: Niedersachsen
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.4, eingetragen 2018-07-18


"... da sie bei größeren x-Werten eher zu kleine y gemessen werden."

Bei den drei größten x-Werten (4, 4.1 und 4.9) liegt die Ausgleichsgerade bei zwei Werten über dem gemessenen y-Wert und bei einem darunter. Mir ist daher nicht klar, worauf sich Deine Aussage bezieht.

"Rein optisch sieht die 2. Variante besser aus."
Wenn Du die Daten wie von Dir vorgeschlagen gruppierst, dann "siehst" Du drei halbwegs parallele Geraden (Anstiege 0.975 bis 1.0778) und erwartest als gemeinsame Ausgleichsgerade eine Gerade mit etwa dem gleichen Anstieg. Was Deine Empfindung dabei nicht berücksichtigt, ist der Umstand, dass die Gerade aus der mittleren Gruppe nur durch Datenpunkte mit x<3 gestützt wird. Gäbe es in der zweiten Gruppe einen weiteren Datenpunkt etwa (x=5, y=6.8), dann würde die gemeinsame Ausgleichsgerade auch da liegen, wo Du sie vermutest. Diesen Punkt gibt es aber nicht und daher wird die Ausgleichsgerade von den Punkten mit den größeren x-Werten nach unten gezogen und hat eine kleinere Steigung, als von Dir erwartet.


Welches Verfahren ist nun das "richtige"?
Ist die Einteilung in die drei Gruppen willkürlich, dann gibt es keinen Grund, die Punkte nicht alle gleichberechtigt in die Ausgleichsgerade einfließen zu lassen.
Es gibt aber auch Anwendungsfälle, bei denen es sinnvoll ist, die Unterteilung in diese drei Gruppen vorzunehmen und jede einzeln auszuwerten. Z.B. wenn es drei Messungen von drei verschiedenen Tagen sind und die Annahme naheliegt, dass der Anstieg der Geraden relativ konstant ist, aber der Konstant-Anteil streuen kann.



  Profil  Quote  Link auf diesen Beitrag Link
zwiebelfisch
Junior Letzter Besuch: in der letzten Woche
Dabei seit: 15.07.2018
Mitteilungen: 12
Aus:
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.5, vom Themenstarter, eingetragen 2018-07-18


2018-07-18 15:31 - Kitaktus in Beitrag No. 4 schreibt:
Mir ist daher nicht klar, worauf sich Deine Aussage bezieht.

Das bezog sich auf den von dir im folgenden Zitat beschriebenen Zusammenhang. Ich hab das wohl nur etwas unglücklich formuliert.


"Rein optisch sieht die 2. Variante besser aus."
Wenn Du die Daten wie von Dir vorgeschlagen gruppierst, dann "siehst" Du drei halbwegs parallele Geraden (Anstiege 0.975 bis 1.0778) und erwartest als gemeinsame Ausgleichsgerade eine Gerade mit etwa dem gleichen Anstieg. Was Deine Empfindung dabei nicht berücksichtigt, ist der Umstand, dass die Gerade aus der mittleren Gruppe nur durch Datenpunkte mit x<3 gestützt wird. Gäbe es in der zweiten Gruppe einen weiteren Datenpunkt etwa (x=5, y=6.8), dann würde die gemeinsame Ausgleichsgerade auch da liegen, wo Du sie vermutest. Diesen Punkt gibt es aber nicht und daher wird die Ausgleichsgerade von den Punkten mit den größeren x-Werten nach unten gezogen und hat eine kleinere Steigung, als von Dir erwartet.


Welches Verfahren ist nun das "richtige"?
Ist die Einteilung in die drei Gruppen willkürlich, dann gibt es keinen Grund, die Punkte nicht alle gleichberechtigt in die Ausgleichsgerade einfließen zu lassen.
Es gibt aber auch Anwendungsfälle, bei denen es sinnvoll ist, die Unterteilung in diese drei Gruppen vorzunehmen und jede einzeln auszuwerten. Z.B. wenn es drei Messungen von drei verschiedenen Tagen sind und die Annahme naheliegt, dass der Anstieg der Geraden relativ konstant ist, aber der Konstant-Anteil streuen kann.

Die Einteilung resultiert tatsächlich aus den gleichen Messungen von unterschiedlichen Tagen. Ich habe allerdings keine Ahnung, weshalb der Konstant-Anteil so streut. Also macht es hier tatsächlich Sinn die Daten zu gruppieren. Kann man dann die Parameter der einzelnen "Gruppen"-Regressionskurven mitteln?

Normalerweise kann man aus der Regression ja noch den Fehler der beiden Parameter bestimmen. Geht das auch dann noch, wenn man die Parameter der einzelnen Kurven gemittelt hat? Müsste man die Fehler dann auch mitteln (oder gar addieren)?



  Profil  Quote  Link auf diesen Beitrag Link
zwiebelfisch
Junior Letzter Besuch: in der letzten Woche
Dabei seit: 15.07.2018
Mitteilungen: 12
Aus:
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.6, vom Themenstarter, eingetragen 2018-07-19

\(\begingroup\)
Ich habe mir nochmal Gedanken zu der Problematik gemacht und auch den BAM-Leitfaden zur Ermittlung von Messunsicherheiten zurate gezogen.

Aus meinen drei Messungen (die alle das gleiche Objekt gemessen haben, an unterschiedlichen Tagen) folgen mit den obigen Zahlenwerten drei Regressionsgeraden mit folgenden Gleichungen inkl. Fehler:

\[1: y = (0,957 \pm 0,0431)\cdot x +(1,06\pm 0,106)\] \[2: y = (1,0778 \pm 0,0814)\cdot x +(1,4208\pm 0,150)\] \[3: y = (1,0076 \pm 0,0558)\cdot x +(0,4304\pm 0,1713)\]
Da die Kurven, wie von Kitaktus treffend beschrieben, ungleichmäßige Stützstellen haben, kann ich nicht eine Regression mit allen Datenpunkten berechnen. Was ich nun gerne hätte, wäre eine Art "mittlere" Regressionskurve entsprechend der Gleichung:

\[y = (\bar{a} \pm u_a)\cdot x +(\bar{b}\pm u_b)\]
Diese besteht aus dem Mittelwert der Koeffizienten \(\bar{a}\) (a1, a2, a3) und \(\bar{b}\) (b1, b2, b3) der ganz einfach mit

\[\bar{x} = \frac{\sum_{i=1}^n x_i}{n}\]
berechnet wird. Daraus erhält man die Werte \(\bar{a} = 1,0201\) und \(\bar{b} = 0,9704\).

Nun stellt sich die Frage, wie man mit den Fehlern umgeht:

Variante #1:

Man nutzt die Fehlerfortpflanzung auf die Berechnungsformel für den Mittelwert der Fehler, also z. B.:

\[u_a = \frac{u_a1+u_a2+u_a3}{3} = \frac{\sqrt{u_a1^2+u_a2^2+u_a3^2}}{3}\]
Variante #2:

Man behandelt die Koeffizienten wie normale Messwerte und ignoriert die Fehler aus der Regression. Dann könnte man mit den folgenden beiden Gleichungen die empirische Standardabweichung und die Unsicherheit berechnen:

\[s = \sqrt{\frac{\sum_{i=1}^n (x_i-\bar{x})^2}{n-1}}\]
\[u(\bar{x}) = \frac{s}{\sqrt{n}}\]
Variante #3:

In dem erwähnten BAM-Leitfaden habe ich folgendes gefunden (S. 38, der ist frei zugänglich):

"Die Standardunsicherheit des Mittelwertes \(\bar{y}\) aus n unabhängigen Einzelwerten y1, y2, ... ist gegeben durch:"

\[u(\bar{y})^2=\frac{\sum_{i=n}^n u(y_i)^2}{n^2}\]
Wenn ich das richtig sehe, dann wäre das doch genau das, was ich suche, oder?


Welche der drei Varianten ist denn nun richtig, oder ist es eine komplett andere?

Danke für eure Hilfe!

EDIT: Mir ist eben erst, als ich den Post in seiner Gesamtheit gesehen habe, aufgefallen, dass Variante 1 und 3 identisch ist xD
\(\endgroup\)


  Profil  Quote  Link auf diesen Beitrag Link
Flowsen95
Aktiv Letzter Besuch: in der letzten Woche
Dabei seit: 25.07.2015
Mitteilungen: 79
Aus: Mannheim
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.7, eingetragen 2018-07-19

\(\begingroup\)
Hi,

ich konnte leider noch nicht alles lesen. Hast Du bereits eine Regression mit binären Regressoren für die jeweiligen Messungen in Erwägung gezogen? So könnte man unterschiedliche Werte für die Konstante bei Betrachtung der einzelnen Teilmengen des Samples bekommen, ohne dabei Werte wegzuwerfen.

Hinsichtlich der Varianzschätzung der Koeffizienten ist das natürlich wünschenswert, da die Formeln auf asymptotischen Ergebnissen basieren und somit die Glaubwürdigkeit bei größerem \(n\) höher ist.

Viele Grüße
Flowsen95
\(\endgroup\)


  Profil  Quote  Link auf diesen Beitrag Link
zwiebelfisch
Junior Letzter Besuch: in der letzten Woche
Dabei seit: 15.07.2018
Mitteilungen: 12
Aus:
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.8, vom Themenstarter, eingetragen 2018-07-21


Ähm, leider habe ich keine Ahnung wie das geht^^. Mir fehlt da so ein wenig die grundlegende Ausbildung in dem Thema (Falls jemand gute Literaturempfehlungen hat, immer her damit :) )

Müsste mein Problem mit Variante 1 oder 3 nicht gelöst sein?



  Profil  Quote  Link auf diesen Beitrag Link
Kitaktus
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 11.09.2008
Mitteilungen: 5438
Aus: Niedersachsen
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.9, eingetragen 2018-07-23


Hast Du irgendeine physikalische Erklärung, warum sich die drei geschätzten Absolutglieder der Ausgleichsgeraden so deutlich unterscheiden? Denkbar wären z.B. Temperaturabhängigkeiten.

Davon würde schon abhängen, wie man mit den erfassten Daten umgehen sollte.



  Profil  Quote  Link auf diesen Beitrag Link
zwiebelfisch
Junior Letzter Besuch: in der letzten Woche
Dabei seit: 15.07.2018
Mitteilungen: 12
Aus:
Zum letzten BeitragZum nächsten BeitragZum vorigen BeitragZum erstem Beitrag  Beitrag No.10, vom Themenstarter, eingetragen 2018-07-23


Leider nicht. Es handelt sich dabei um elektrochemische Messungen die gerne mal "machen was sie wollen". Es wird zwar die Temperaturabhängigkeit gemessen (EMK-Messungen), erwartet hätte ich aber, dass die Streuung deutlich kleiner ist, da die Temperatur recht genau geregelt wird.



  Profil  Quote  Link auf diesen Beitrag Link
zwiebelfisch hat die Antworten auf ihre/seine Frage gesehen.
zwiebelfisch hatte hier bereits selbst das Ok-Häkchen gesetzt.
Neues Thema [Neues Thema] Antworten [Antworten]    Druckversion [Druckversion]

 


Wechsel in ein anderes Forum:
 Suchen    
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2018 by Matroids Matheplanet
This web site was made with PHP-Nuke, a web portal system written in PHP. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]