Matroids Matheplanet Forum Index
Moderiert von luis52
Mathematik » Stochastik und Statistik » Quantile und Histogramm zu einem Datensatz ausrechnen
Autor
Universität/Hochschule Quantile und Histogramm zu einem Datensatz ausrechnen
Max_804
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 29.04.2022
Mitteilungen: 187
  Themenstart: 2022-10-24

Hallo, ich habe folgenden Datensatz gegeben: x_1 = 51, x_2 = 47, x_3 = 52, x_4 = 48, x_5 = 46, x_6 = 54, x_7 = 52, x_8 = 59 Aufgaben sind: a) Median ausrechnen b) Quartile Q_1 und Q_3 ausrechnen c) Interquartilsabstand ausrechnen d) Berechnen Sie das Histogramm für die Klassengrenzen 44 < 48 < 52 < 56 < 60. Bitte geben Sie Ihre Lösung als Liste ein. Die Eingabe [1,2,3,4] zum Beispiel würde bedeuten, dass das Histogramm auf dem Intervall (44,48] den Wert 1 annimmt. a) Erstmal habe ich die Liste sortiert, [46,47,48,51,52,52,54,59] Der Median ist dann 51.5. b) Hier habe ich R benutzt, da folgt dann für Q_1 = 47.75, und Q_2 = 52.5. Die Lösungen sind aber Q_1 = 47.5 und Q_2 = 53. Da ich neu drinne bin, weiß ich nicht wieso das richtig ist. Ich komme auf das gleiche Ergebnis wenn ich die doppelte 52 entferne, jedoch war davon nie die Rede in der Vorlesung, dass man doppelte Daten entfernt. c) Mit den richtigen Lösungen folgt dann IQR = 5.5 d) Hier habe ich keinen Ansatz.


   Profil
Diophant
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.01.2019
Mitteilungen: 10689
Wohnort: Rosenfeld, BW
  Beitrag No.1, eingetragen 2022-10-24

Hallo, zu den Quartilen: die Musterlösung, die dir vorliegt, nutzt offensichtlich die Definition, die man auf Wikipedia findet. Dort steht nicht umsonst, dass es auch davon abweichende Definitionen gibt. Und in R wird dann (bei der Funktion quantile) vermutlich eine andere Definition zum Einsatz kommen. Ich erhalte mit R ebenfalls dein abweichendes Resultat. Zu d): was ist denn da dein Problem, da geht es doch nur um die Höhe der einzelnen Histogramm-Balken? Gruß, Diophant


   Profil
Max_804
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 29.04.2022
Mitteilungen: 187
  Beitrag No.2, vom Themenstarter, eingetragen 2022-10-24

\quoteon(2022-10-24 22:48 - Diophant in Beitrag No. 1) Hallo, zu den Quartilen: die Musterlösung, die dir vorliegt, nutzt offensichtlich die Definition, die man auf Wikipedia findet. Dort steht nicht umsonst, dass es auch davon abeichende Definitionen gibt. Und in R wird dann (bei der Funktion quantile) vermutlich eine andere Definition zum Einsatz kommen. Ich erhalte mit R ebenfalls dein abweichendes Resultat. Zu d): was ist denn da dein Problem, da geht es doch nur um die Höhe der einzelnen Histogramm-Balken? Gruß, Diophant \quoteoff Die Folie ist da etwas schwammig. Wenn ich es richtig verstanden habe, ist die Balkenbreite 4. Ich verstehe jedoch nicht, wieso ich bei dem Intervall (44,48] den Wert 1 kriegen würde. Vielleicht habe ich es falsch verstanden, aber in dem Intervall wären doch 3 Werte?


   Profil
Diophant
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.01.2019
Mitteilungen: 10689
Wohnort: Rosenfeld, BW
  Beitrag No.3, eingetragen 2022-10-24

\(\begingroup\)\(\newcommand{\ba}{\begin{aligned}} \newcommand{\ea}{\end{aligned}} \newcommand{\bc}{\begin{cases}} \newcommand{\ec}{\end{cases}} \newcommand{\bpm}{\begin{pmatrix}} \newcommand{\epm}{\end{pmatrix}} \newcommand{\bvm}{\begin{vmatrix}} \newcommand{\evm}{\end{vmatrix}} \newcommand{\mb}[1]{\mathbb{#1}} \newcommand{\mc}[1]{\mathcal{#1}} \newcommand{\mf}[1]{\mathfrak{#1}} \newcommand{\ms}[1]{\mathscr{#1}} \newcommand{\on}{\operatorname} \newcommand{\ds}{\displaystyle}\) Hallo, \quoteon(2022-10-24 23:04 - Max_804 in Beitrag No. 2) Die Folie ist da etwas schwammig. Wenn ich es richtig verstanden habe, ist die Balkenbreite 4. Ich verstehe jedoch nicht, wieso ich bei dem Intervall (44,48] den Wert 1 kriegen würde. Vielleicht habe ich es falsch verstanden, aber in dem Intervall wären doch 3 Werte? \quoteoff Die unterste Klasse geht von 44 bis 47 (achte auf die Ordnungsrelationen!). Also \([44,48)\) in deiner Schreibweise. Von daher sollte die entsprechende Säule die Höhe 2 haben. (Die Bemerkung in der Aufgabenstellung, auf die du dich da beziehst, dient nur als Information, in welcher Schreibweise man die Histogramm-Höhen angeben soll.) Gruß, Diophant\(\endgroup\)


   Profil
zippy
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 24.10.2018
Mitteilungen: 4647
  Beitrag No.4, eingetragen 2022-10-24

\quoteon(2022-10-24 21:32 - Max_804 im Themenstart) b) Hier habe ich R benutzt, da folgt dann für Q_1 = 47.75, und Q_2 = 52.5. \quoteoff Die R-Funktion quantile hat einen type-Parameter, mit dem man zwischen 9 unterschiedlichen Berechnungsmethoden wählen kann. \sourceon R x <- c(51, 47, 52, 48, 46, 54, 52, 59) sapply(1:9, \(t) quantile(x, type = t)[2]) 25% 25% 25% 25% 25% 25% 25% 25% 25% 47.00000 47.50000 47.00000 47.00000 47.50000 47.25000 47.75000 47.41667 47.43750 sapply(1:9, \(t) quantile(x, type = t)[4]) 75% 75% 75% 75% 75% 75% 75% 75% 75% 52.00000 53.00000 52.00000 52.00000 53.00000 53.50000 52.50000 53.16667 53.12500 \sourceoff --zippy


   Profil
Max_804
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 29.04.2022
Mitteilungen: 187
  Beitrag No.5, vom Themenstarter, eingetragen 2022-10-25

\quoteon(2022-10-24 23:09 - Diophant in Beitrag No. 3) Hallo, \quoteon(2022-10-24 23:04 - Max_804 in Beitrag No. 2) Die Folie ist da etwas schwammig. Wenn ich es richtig verstanden habe, ist die Balkenbreite 4. Ich verstehe jedoch nicht, wieso ich bei dem Intervall (44,48] den Wert 1 kriegen würde. Vielleicht habe ich es falsch verstanden, aber in dem Intervall wären doch 3 Werte? \quoteoff Die unterste Klasse geht von 44 bis 47 (achte auf die Ordnungsrelationen!). Also \([44,48)\) in deiner Schreibweise. Von daher sollte die entsprechende Säule die Höhe 2 haben. (Die Bemerkung in der Aufgabenstellung, auf die du dich da beziehst, dient nur als Information, in welcher Schreibweise man die Histogramm-Höhen angeben soll.) Gruß, Diophant \quoteoff Die Lösung wäre dann [2,2,2,1], richtig? Leider kann ich es nicht kontrollieren, da die Abgabe vorbei ist.


   Profil
Diophant
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.01.2019
Mitteilungen: 10689
Wohnort: Rosenfeld, BW
  Beitrag No.6, eingetragen 2022-10-25

\(\begingroup\)\(\newcommand{\ba}{\begin{aligned}} \newcommand{\ea}{\end{aligned}} \newcommand{\bc}{\begin{cases}} \newcommand{\ec}{\end{cases}} \newcommand{\bpm}{\begin{pmatrix}} \newcommand{\epm}{\end{pmatrix}} \newcommand{\bvm}{\begin{vmatrix}} \newcommand{\evm}{\end{vmatrix}} \newcommand{\mb}[1]{\mathbb{#1}} \newcommand{\mc}[1]{\mathcal{#1}} \newcommand{\mf}[1]{\mathfrak{#1}} \newcommand{\ms}[1]{\mathscr{#1}} \newcommand{\on}{\operatorname} \newcommand{\ds}{\displaystyle}\) \quoteon(2022-10-25 16:00 - Max_804 in Beitrag No. 5) Die Lösung wäre dann [2,2,2,1], richtig? \quoteoff Nein, falsch. Das sind so Fehler, die kann man vermeiden. Wenn die Stichprobe den Umfang \(n=8\) hat, dann sollten die Histogramm-Höhen aufsummiert natürlich auch 8 ergeben. Du hast dich verzählt, das (korrekt formatierte) Ergebnis ist \[\left[2,2,3,1\right]\] Gruß, Diophant\(\endgroup\)


   Profil
Max_804
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 29.04.2022
Mitteilungen: 187
  Beitrag No.7, vom Themenstarter, eingetragen 2022-10-25

\quoteon(2022-10-25 16:03 - Diophant in Beitrag No. 6) \quoteon(2022-10-25 16:00 - Max_804 in Beitrag No. 5) Die Lösung wäre dann [2,2,2,1], richtig? \quoteoff Nein, falsch. Das sind so Fehler, die kann man vermeiden. Wenn die Stichprobe den Umfang \(n=8\) hat, dann sollten die Histogramm-Höhen aufsummiert natürlich auch 8 ergeben. Du hast dich verzählt, das (korrekt formatierte) Ergebnis ist \[\left[2,2,3,1\right]\] Gruß, Diophant \quoteoff Stimmt, habe die doppelte 52 vergessen. Vielen Dank!


   Profil
Max_804
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 29.04.2022
Mitteilungen: 187
  Beitrag No.8, vom Themenstarter, eingetragen 2022-10-25

\quoteon(2022-10-24 23:27 - zippy in Beitrag No. 4) \quoteon(2022-10-24 21:32 - Max_804 im Themenstart) b) Hier habe ich R benutzt, da folgt dann für Q_1 = 47.75, und Q_2 = 52.5. \quoteoff Die R-Funktion quantile hat einen type-Parameter, mit dem man zwischen 9 unterschiedlichen Berechnungsmethoden wählen kann. \sourceon R x <- c(51, 47, 52, 48, 46, 54, 52, 59) sapply(1:9, \(t) quantile(x, type = t)[2]) 25% 25% 25% 25% 25% 25% 25% 25% 25% 47.00000 47.50000 47.00000 47.00000 47.50000 47.25000 47.75000 47.41667 47.43750 sapply(1:9, \(t) quantile(x, type = t)[4]) 75% 75% 75% 75% 75% 75% 75% 75% 75% 52.00000 53.00000 52.00000 52.00000 53.00000 53.50000 52.50000 53.16667 53.12500 \sourceoff --zippy \quoteoff Danke für den Hinweis. Gibt es Definitionen zu den Berechnungsmethoden? EDIT: Habe es eben selber schon gefunden. Danke!


   Profil
Diophant
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 18.01.2019
Mitteilungen: 10689
Wohnort: Rosenfeld, BW
  Beitrag No.9, eingetragen 2022-10-25

\(\begingroup\)\(\newcommand{\ba}{\begin{aligned}} \newcommand{\ea}{\end{aligned}} \newcommand{\bc}{\begin{cases}} \newcommand{\ec}{\end{cases}} \newcommand{\bpm}{\begin{pmatrix}} \newcommand{\epm}{\end{pmatrix}} \newcommand{\bvm}{\begin{vmatrix}} \newcommand{\evm}{\end{vmatrix}} \newcommand{\mb}[1]{\mathbb{#1}} \newcommand{\mc}[1]{\mathcal{#1}} \newcommand{\mf}[1]{\mathfrak{#1}} \newcommand{\ms}[1]{\mathscr{#1}} \newcommand{\on}{\operatorname} \newcommand{\ds}{\displaystyle}\) \quoteon(2022-10-25 16:07 - Max_804 in Beitrag No. 8) \quoteon(2022-10-24 23:27 - zippy in Beitrag No. 4) Die R-Funktion quantile hat einen type-Parameter, mit dem man zwischen 9 unterschiedlichen Berechnungsmethoden wählen kann. \sourceon R x <- c(51, 47, 52, 48, 46, 54, 52, 59) sapply(1:9, \(t) quantile(x, type = t)[2]) 25% 25% 25% 25% 25% 25% 25% 25% 25% 47.00000 47.50000 47.00000 47.00000 47.50000 47.25000 47.75000 47.41667 47.43750 sapply(1:9, \(t) quantile(x, type = t)[4]) 75% 75% 75% 75% 75% 75% 75% 75% 75% 52.00000 53.00000 52.00000 52.00000 53.00000 53.50000 52.50000 53.16667 53.12500 \sourceoff --zippy \quoteoff Danke für den Hinweis. Gibt es Definitionen zu den Berechnungsmethoden? EDIT: Habe es eben selber schon gefunden. Danke! \quoteoff Trotzdem für die Nachwelt: die offizielle Dokumentation. Gruß, Diophant\(\endgroup\)


   Profil
Max_804 hat die Antworten auf ihre/seine Frage gesehen.
Max_804 hatte hier bereits selbst das Ok-Häkchen gesetzt.

Wechsel in ein anderes Forum:
 Suchen    
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2023 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]