Matroids Matheplanet Forum Index
Moderiert von Kleine_Meerjungfrau Monkfish epsilonkugel
Mathematik » Stochastik und Statistik » A Kernel Method for the Two-Sample Problem
Autor
Universität/Hochschule A Kernel Method for the Two-Sample Problem
HDMIii
Aktiv Letzter Besuch: im letzten Quartal
Dabei seit: 21.03.2017
Mitteilungen: 166
  Themenstart: 2021-11-29

Hallo zusammen, ich weiß nicht, ob ich mit meiner Frage hier richtig bin, aber ich versuche mal mein Gück. Meine aktuelle Problemstellung: Um die Ähnlichkeit zweier Stichproben zu untersuchen kann die sogenannte Maximum Mean Discrepancy berechnet werden. Dazu folgender Artikel: https://arxiv.org/pdf/0805.2368.pdf Da ich kein Matematiker bin, ist für mich vor allem die Formel (6) relevant. Ich möchte die Formel gerne auf zwei Stichproben anwenden. Allerdings bin ich mir unsicher, welche Randbdingungen zur Anwendung der Formel gelten müssen und wie man das dann mathematisch korrekt formuliert. Daher wäre es sehr nett von euch, wenn ihr mir dabei weiterhelfen könntet. Aktuell habe ich in meiner Dokumanation folgendes formuliert: Die MMD erlaubt mittels zweier Stichproben X={x_i} und Y={y_i} die Messung des Abstandes der den zwei Stichproben zugrundeliegenden Wahrscheinlichkeitsverteilungen (Borel-Wahrscheinlichkeitsmaße). Die Berechnugnsformel lautet <>. Hierbei ist k eine positive definite kernel Funktion. m ist die Stichprobengröße von X und die Stichprobengröße von Y ist n. Aus meiner Sicht klingt das stimmig. Allerdings wird es mathematisch vermutlich nicht "sauber" formuliert sein, oder? Ziel ist es eine mathematisch saubere und möglichst "einfache" Definition hinzubekommen. (Muss nicht allgemeingültig formuliert sein, sondern nur für den konkreten Anwendungsfall zweier Stichproben). Laut Artikel muss gelten: 1. F is the unit ball in a reproducing kernel Hilbert space: D.h. das ist eine Restriktion für den Kernel k, oder? Im Text weiter oben steht, dass k ein positiv definiter Kernel sein soll. Ist damit die Anforderung 1 erfüllt? Habe gelesen "Every reproducing kernel is positive-definite, and every positive definite kernel defines a unique RKHS, of which it is the unique reproducing kernel." 2. Zu X und Y: "let p, q be two Borel probability measures defined on X. Hier bin ich mir unsicher. Ich habe ja 2 Stichproben denen 2 Wahrschenlichkeitsverteilungen zugrunde liegen (p und q). Aber ist das jetzt ein Borel probability measure? Habe es in meiner Definion mal in Klammer eingetragen, was aber unschön ist.


   Profil
Bozzo
Senior Letzter Besuch: in der letzten Woche
Dabei seit: 11.04.2011
Mitteilungen: 2187
Wohnort: Franken
  Beitrag No.1, eingetragen 2021-11-30

F ist keine Restriktion. F ist in (3) rausgeflogen, das war nur für die Konstruktion des Arguments notwendig. Ein RKHS reicht scheinbar noch nicht, direkt vor Theorem 3 wird auch noch gefordert, dass H dicht in C(X) sein muss (weil sich ja Lemma 1 auf ganz C(X) bezieht). An derselben Stelle steht auch, dass Gaussian und Laplacian Kernel funktioniern würden, daher würde ich einfach bei denen bleiben. Das mit den Borel-Maßen kannst du aus praktischer Sicht ziemlich sicher ignorieren.


   Profil
HDMIii hat die Antworten auf ihre/seine Frage gesehen.

Wechsel in ein anderes Forum:
 Suchen    
 
All logos and trademarks in this site are property of their respective owner. The comments are property of their posters, all the rest © 2001-2022 by Matroids Matheplanet
This web site was originally made with PHP-Nuke, a former web portal system written in PHP that seems no longer to be maintained nor supported. PHP-Nuke is Free Software released under the GNU/GPL license.
Ich distanziere mich von rechtswidrigen oder anstößigen Inhalten, die sich trotz aufmerksamer Prüfung hinter hier verwendeten Links verbergen mögen.
Lesen Sie die Nutzungsbedingungen, die Distanzierung, die Datenschutzerklärung und das Impressum.
[Seitenanfang]