|
Autor |
Quantile und Histogramm zu einem Datensatz ausrechnen |
|
Max_804
Aktiv  Dabei seit: 29.04.2022 Mitteilungen: 187
 | Themenstart: 2022-10-24
|
Hallo,
ich habe folgenden Datensatz gegeben:
x_1 = 51, x_2 = 47, x_3 = 52, x_4 = 48, x_5 = 46, x_6 = 54, x_7 = 52, x_8 = 59
Aufgaben sind:
a) Median ausrechnen
b) Quartile Q_1 und Q_3 ausrechnen
c) Interquartilsabstand ausrechnen
d) Berechnen Sie das Histogramm für die Klassengrenzen 44 < 48 < 52 < 56 < 60. Bitte geben Sie Ihre Lösung als Liste ein. Die Eingabe [1,2,3,4] zum Beispiel würde bedeuten, dass das Histogramm auf dem Intervall (44,48] den Wert 1 annimmt.
a) Erstmal habe ich die Liste sortiert, [46,47,48,51,52,52,54,59]
Der Median ist dann 51.5.
b) Hier habe ich R benutzt, da folgt dann für Q_1 = 47.75, und Q_2 = 52.5. Die Lösungen sind aber Q_1 = 47.5 und Q_2 = 53. Da ich neu drinne bin, weiß ich nicht wieso das richtig ist. Ich komme auf das gleiche Ergebnis wenn ich die doppelte 52 entferne, jedoch war davon nie die Rede in der Vorlesung, dass man doppelte Daten entfernt.
c) Mit den richtigen Lösungen folgt dann IQR = 5.5
d) Hier habe ich keinen Ansatz.
|
Profil
|
Diophant
Senior  Dabei seit: 18.01.2019 Mitteilungen: 10689
Wohnort: Rosenfeld, BW
 | Beitrag No.1, eingetragen 2022-10-24
|
Hallo,
zu den Quartilen: die Musterlösung, die dir vorliegt, nutzt offensichtlich die Definition, die man auf Wikipedia findet. Dort steht nicht umsonst, dass es auch davon abweichende Definitionen gibt. Und in R wird dann (bei der Funktion quantile) vermutlich eine andere Definition zum Einsatz kommen. Ich erhalte mit R ebenfalls dein abweichendes Resultat.
Zu d): was ist denn da dein Problem, da geht es doch nur um die Höhe der einzelnen Histogramm-Balken?
Gruß, Diophant
|
Profil
|
Max_804
Aktiv  Dabei seit: 29.04.2022 Mitteilungen: 187
 | Beitrag No.2, vom Themenstarter, eingetragen 2022-10-24
|
\quoteon(2022-10-24 22:48 - Diophant in Beitrag No. 1)
Hallo,
zu den Quartilen: die Musterlösung, die dir vorliegt, nutzt offensichtlich die Definition, die man auf Wikipedia findet. Dort steht nicht umsonst, dass es auch davon abeichende Definitionen gibt. Und in R wird dann (bei der Funktion quantile) vermutlich eine andere Definition zum Einsatz kommen. Ich erhalte mit R ebenfalls dein abweichendes Resultat.
Zu d): was ist denn da dein Problem, da geht es doch nur um die Höhe der einzelnen Histogramm-Balken?
Gruß, Diophant
\quoteoff
Die Folie ist da etwas schwammig. Wenn ich es richtig verstanden habe, ist die Balkenbreite 4. Ich verstehe jedoch nicht, wieso ich bei dem Intervall (44,48] den Wert 1 kriegen würde. Vielleicht habe ich es falsch verstanden, aber in dem Intervall wären doch 3 Werte?
|
Profil
|
Diophant
Senior  Dabei seit: 18.01.2019 Mitteilungen: 10689
Wohnort: Rosenfeld, BW
 | Beitrag No.3, eingetragen 2022-10-24
|
\(\begingroup\)\(\newcommand{\ba}{\begin{aligned}}
\newcommand{\ea}{\end{aligned}}
\newcommand{\bc}{\begin{cases}}
\newcommand{\ec}{\end{cases}}
\newcommand{\bpm}{\begin{pmatrix}}
\newcommand{\epm}{\end{pmatrix}}
\newcommand{\bvm}{\begin{vmatrix}}
\newcommand{\evm}{\end{vmatrix}}
\newcommand{\mb}[1]{\mathbb{#1}}
\newcommand{\mc}[1]{\mathcal{#1}}
\newcommand{\mf}[1]{\mathfrak{#1}}
\newcommand{\ms}[1]{\mathscr{#1}}
\newcommand{\on}{\operatorname}
\newcommand{\ds}{\displaystyle}\)
Hallo,
\quoteon(2022-10-24 23:04 - Max_804 in Beitrag No. 2)
Die Folie ist da etwas schwammig. Wenn ich es richtig verstanden habe, ist die Balkenbreite 4. Ich verstehe jedoch nicht, wieso ich bei dem Intervall (44,48] den Wert 1 kriegen würde. Vielleicht habe ich es falsch verstanden, aber in dem Intervall wären doch 3 Werte?
\quoteoff
Die unterste Klasse geht von 44 bis 47 (achte auf die Ordnungsrelationen!). Also \([44,48)\) in deiner Schreibweise.
Von daher sollte die entsprechende Säule die Höhe 2 haben.
(Die Bemerkung in der Aufgabenstellung, auf die du dich da beziehst, dient nur als Information, in welcher Schreibweise man die Histogramm-Höhen angeben soll.)
Gruß, Diophant\(\endgroup\)
|
Profil
|
zippy
Senior  Dabei seit: 24.10.2018 Mitteilungen: 4647
 | Beitrag No.4, eingetragen 2022-10-24
|
\quoteon(2022-10-24 21:32 - Max_804 im Themenstart)
b) Hier habe ich R benutzt, da folgt dann für Q_1 = 47.75, und Q_2 = 52.5.
\quoteoff
Die R-Funktion quantile hat einen type-Parameter, mit dem man zwischen 9 unterschiedlichen Berechnungsmethoden wählen kann.
\sourceon R
x <- c(51, 47, 52, 48, 46, 54, 52, 59)
sapply(1:9, \(t) quantile(x, type = t)[2])
25% 25% 25% 25% 25% 25% 25% 25% 25%
47.00000 47.50000 47.00000 47.00000 47.50000 47.25000 47.75000 47.41667 47.43750
sapply(1:9, \(t) quantile(x, type = t)[4])
75% 75% 75% 75% 75% 75% 75% 75% 75%
52.00000 53.00000 52.00000 52.00000 53.00000 53.50000 52.50000 53.16667 53.12500
\sourceoff
--zippy
|
Profil
|
Max_804
Aktiv  Dabei seit: 29.04.2022 Mitteilungen: 187
 | Beitrag No.5, vom Themenstarter, eingetragen 2022-10-25
|
\quoteon(2022-10-24 23:09 - Diophant in Beitrag No. 3)
Hallo,
\quoteon(2022-10-24 23:04 - Max_804 in Beitrag No. 2)
Die Folie ist da etwas schwammig. Wenn ich es richtig verstanden habe, ist die Balkenbreite 4. Ich verstehe jedoch nicht, wieso ich bei dem Intervall (44,48] den Wert 1 kriegen würde. Vielleicht habe ich es falsch verstanden, aber in dem Intervall wären doch 3 Werte?
\quoteoff
Die unterste Klasse geht von 44 bis 47 (achte auf die Ordnungsrelationen!). Also \([44,48)\) in deiner Schreibweise.
Von daher sollte die entsprechende Säule die Höhe 2 haben.
(Die Bemerkung in der Aufgabenstellung, auf die du dich da beziehst, dient nur als Information, in welcher Schreibweise man die Histogramm-Höhen angeben soll.)
Gruß, Diophant
\quoteoff
Die Lösung wäre dann [2,2,2,1], richtig?
Leider kann ich es nicht kontrollieren, da die Abgabe vorbei ist.
|
Profil
|
Diophant
Senior  Dabei seit: 18.01.2019 Mitteilungen: 10689
Wohnort: Rosenfeld, BW
 | Beitrag No.6, eingetragen 2022-10-25
|
\(\begingroup\)\(\newcommand{\ba}{\begin{aligned}}
\newcommand{\ea}{\end{aligned}}
\newcommand{\bc}{\begin{cases}}
\newcommand{\ec}{\end{cases}}
\newcommand{\bpm}{\begin{pmatrix}}
\newcommand{\epm}{\end{pmatrix}}
\newcommand{\bvm}{\begin{vmatrix}}
\newcommand{\evm}{\end{vmatrix}}
\newcommand{\mb}[1]{\mathbb{#1}}
\newcommand{\mc}[1]{\mathcal{#1}}
\newcommand{\mf}[1]{\mathfrak{#1}}
\newcommand{\ms}[1]{\mathscr{#1}}
\newcommand{\on}{\operatorname}
\newcommand{\ds}{\displaystyle}\)
\quoteon(2022-10-25 16:00 - Max_804 in Beitrag No. 5)
Die Lösung wäre dann [2,2,2,1], richtig?
\quoteoff
Nein, falsch. Das sind so Fehler, die kann man vermeiden. Wenn die Stichprobe den Umfang \(n=8\) hat, dann sollten die Histogramm-Höhen aufsummiert natürlich auch 8 ergeben. Du hast dich verzählt, das (korrekt formatierte) Ergebnis ist
\[\left[2,2,3,1\right]\]
Gruß, Diophant\(\endgroup\)
|
Profil
|
Max_804
Aktiv  Dabei seit: 29.04.2022 Mitteilungen: 187
 | Beitrag No.7, vom Themenstarter, eingetragen 2022-10-25
|
\quoteon(2022-10-25 16:03 - Diophant in Beitrag No. 6)
\quoteon(2022-10-25 16:00 - Max_804 in Beitrag No. 5)
Die Lösung wäre dann [2,2,2,1], richtig?
\quoteoff
Nein, falsch. Das sind so Fehler, die kann man vermeiden. Wenn die Stichprobe den Umfang \(n=8\) hat, dann sollten die Histogramm-Höhen aufsummiert natürlich auch 8 ergeben. Du hast dich verzählt, das (korrekt formatierte) Ergebnis ist
\[\left[2,2,3,1\right]\]
Gruß, Diophant
\quoteoff
Stimmt, habe die doppelte 52 vergessen. Vielen Dank!
|
Profil
|
Max_804
Aktiv  Dabei seit: 29.04.2022 Mitteilungen: 187
 | Beitrag No.8, vom Themenstarter, eingetragen 2022-10-25
|
\quoteon(2022-10-24 23:27 - zippy in Beitrag No. 4)
\quoteon(2022-10-24 21:32 - Max_804 im Themenstart)
b) Hier habe ich R benutzt, da folgt dann für Q_1 = 47.75, und Q_2 = 52.5.
\quoteoff
Die R-Funktion quantile hat einen type-Parameter, mit dem man zwischen 9 unterschiedlichen Berechnungsmethoden wählen kann.
\sourceon R
x <- c(51, 47, 52, 48, 46, 54, 52, 59)
sapply(1:9, \(t) quantile(x, type = t)[2])
25% 25% 25% 25% 25% 25% 25% 25% 25%
47.00000 47.50000 47.00000 47.00000 47.50000 47.25000 47.75000 47.41667 47.43750
sapply(1:9, \(t) quantile(x, type = t)[4])
75% 75% 75% 75% 75% 75% 75% 75% 75%
52.00000 53.00000 52.00000 52.00000 53.00000 53.50000 52.50000 53.16667 53.12500
\sourceoff
--zippy
\quoteoff
Danke für den Hinweis. Gibt es Definitionen zu den Berechnungsmethoden?
EDIT:
Habe es eben selber schon gefunden. Danke!
|
Profil
|
Diophant
Senior  Dabei seit: 18.01.2019 Mitteilungen: 10689
Wohnort: Rosenfeld, BW
 | Beitrag No.9, eingetragen 2022-10-25
|
\(\begingroup\)\(\newcommand{\ba}{\begin{aligned}}
\newcommand{\ea}{\end{aligned}}
\newcommand{\bc}{\begin{cases}}
\newcommand{\ec}{\end{cases}}
\newcommand{\bpm}{\begin{pmatrix}}
\newcommand{\epm}{\end{pmatrix}}
\newcommand{\bvm}{\begin{vmatrix}}
\newcommand{\evm}{\end{vmatrix}}
\newcommand{\mb}[1]{\mathbb{#1}}
\newcommand{\mc}[1]{\mathcal{#1}}
\newcommand{\mf}[1]{\mathfrak{#1}}
\newcommand{\ms}[1]{\mathscr{#1}}
\newcommand{\on}{\operatorname}
\newcommand{\ds}{\displaystyle}\)
\quoteon(2022-10-25 16:07 - Max_804 in Beitrag No. 8)
\quoteon(2022-10-24 23:27 - zippy in Beitrag No. 4)
Die R-Funktion quantile hat einen type-Parameter, mit dem man zwischen 9 unterschiedlichen Berechnungsmethoden wählen kann.
\sourceon R
x <- c(51, 47, 52, 48, 46, 54, 52, 59)
sapply(1:9, \(t) quantile(x, type = t)[2])
25% 25% 25% 25% 25% 25% 25% 25% 25%
47.00000 47.50000 47.00000 47.00000 47.50000 47.25000 47.75000 47.41667 47.43750
sapply(1:9, \(t) quantile(x, type = t)[4])
75% 75% 75% 75% 75% 75% 75% 75% 75%
52.00000 53.00000 52.00000 52.00000 53.00000 53.50000 52.50000 53.16667 53.12500
\sourceoff
--zippy
\quoteoff
Danke für den Hinweis. Gibt es Definitionen zu den Berechnungsmethoden?
EDIT:
Habe es eben selber schon gefunden. Danke!
\quoteoff
Trotzdem für die Nachwelt: die offizielle Dokumentation.
Gruß, Diophant\(\endgroup\)
|
Profil
|
Max_804 hat die Antworten auf ihre/seine Frage gesehen. Max_804 hatte hier bereits selbst das Ok-Häkchen gesetzt. |
|
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2023 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen. Lesen Sie die
Nutzungsbedingungen,
die Distanzierung,
die Datenschutzerklärung und das Impressum.
[Seitenanfang]
|