Frage : Blüten-Filterdurchschnitt anfällig für Geburtstag-Paradox?

Die folgende abstrakte Idee betrachten, für den zusammenpassenden Blütenfilter, der zu mir als Alternative zu einzelnes Anwärter…

Assume oben einzeln schauen vorgeschlagen wurde, das, wir einen universellen Blütenfilter benutzen, der k-Spitzen pro Eintragung einstellt, in der K aber > 1

We Bau ein Blütenfilter für eine Ansammlung unbestimmt ist. Wir haben dann eine Bewerberliste der Einzelteile, die wir gegen diesen Filter überprüfen möchten, also errichten wir einen anderen Filter aus der Bewerberliste heraus. Wir führen dann durchführen einen Spitzendurchschnitt (Zweiheit und Betrieb) auf den zwei Filtern durch. Es wird angenommen, dass wenn überhaupt von den Spitzen im Resultat dort ist eine relativ gute Wahrscheinlichkeit eingestellt werden, dass eins der Einzelteile in Satz B im Satz A.

It gefunden werden kann ist meine Absicht, dass wirklich die Wahrscheinlichkeit eines falschen Positivs sehr hoch ist, weil wir das Sprechen sind wenn überhaupt, das in den Gleichen des Filters A gebissen wird, die jede mögliche Spitze in Filter B es ein Gleiches gibt. Ich sehe dieses als, seiend kein unterschiedliches zum Geburtstag-Paradox, in dem wir wenn überhaupt Person in den Raumanteilen um um jedes mögliches birthday.

Am I falsch oder recht bitten und (ohne über einfaches School-Mathe hinauszugehen - da ich wirklich nicht bin, dass klug), Sie es prüfen kann? Würde dieses noch eine Ausgabe sein, wenn wir nur 1 Bit pro Eintragung einstellten?

NB. Dieses ist nicht eine „Heimarbeitsfrage,“ - mein Profil überprüfen -, das es eine reale Weltdiskussion ist, ich having.

Thank you.
bin-

Antwort : Blüten-Filterdurchschnitt anfällig für Geburtstag-Paradox?

>> erkläre ich, dass es ein hohes Maß der Wahrscheinlichkeit gibt, dass es ein falsches Positiv aus den Gründen gibt, die in der Frage angegeben.

Intuitiv kommen ich zur gleichen Zusammenfassung.


Aber uns versuchen lassen, Mathe zu tun.

Ein einfaches Beispiel eines Satzes B von Größe 1. nehmen. Der sein der normale Fall, als, überprüfend, ob ein Einzelteil im Blütenfilter anwesend ist. Jedoch gibt es einen großen Unterschied bezüglich der Annäherung, die genommen, um diese Überprüfung durchzuführen:

        normale Annäherung: überprüfen, ob alle Spitzen von B in A eingestellt
        vorgeschlagene Annäherung: überprüfen, ob mindestens ein Bit B in A eingestellt

Die Wahrscheinlichkeit der falschen Positive ist beziehungsweise (wo m die Zahl Spitzen im Blütenfilter ist, ist k die Zahl Durcheinanderfunktionen, und n ist die Zahl den Einzelteilen, die im Blütenfilter) gespeichert:

        normale Annäherung: p^k
        vorgeschlagene Annäherung: 1 - (1 - p)^k

wo p die Wahrscheinlichkeit ist, dass eine bestimmte Spitze 1 in A ist:

        p = (1 - ((1 - (1/m)) ^ (kn)))

mit k = 3, m = 256, n = 64 zum Beispiel, erhalten wir dieses p ~= 0.52833, damit die folgenden Wahrscheinlichkeiten der falschen Positive geben:

        normale Annäherung: (0.52833) ^3 ~= 0.14747
        vorgeschlagene Annäherung: 1 - (1 - 0.52833) ^3 ~= 0.89507

so hat die vorgeschlagene Annäherung eine 6mal höhere Wahrscheinlichkeit eines falschen Positivs (für dieses Beispiel) oder fast eine 90% Wahrscheinlichkeit eines falschen Positivs (für dieses Beispiel).


Jetzt uns lassen extrapolieren das zu einem Satz B der Größe L. Jetzt:

        normale Annäherung: für jedes der Einzelteile, Überprüfung, wenn alle Spitzen von den Durcheinanderfunktionen in A eingestellt, der Reihe nach
        vorgeschlagene Annäherung: überprüfen, ob mindestens ein Bit B in A eingestellt

Die Wahrscheinlichkeit der falschen Positive ist jetzt beziehungsweise:

        normale Annäherung: 1 - (1 - p^k)^l
        vorgeschlagene Annäherung: 1 - (1 - p)^qm

wo q die Wahrscheinlichkeit ist, dass eine bestimmte Spitze 1 in B ist:

        q = (1 - ((1 - (1/m)) ^ (Kiloliter)))

mit k = 3, m = 256, n = 64, L = 8 zum Beispiel, erhalten wir dieses p ~= 0.52833 und q ~= 0.08966, damit die folgenden Wahrscheinlichkeiten der falschen Positive geben:

        normale Annäherung: 1 - (1 - (0.52833) ^3)^8 ~= 0.72096
        vorgeschlagene Annäherung: 1 - (1 - 0.52833) ^ (0.08966 * 256) ~= 0.99999996

so hat die vorgeschlagene Annäherung fast eine 100%-Wahrscheinlichkeit eines falschen Positivs (für dieses Beispiel).


Ich weiß, Sie, sagten Mathe nicht zu verwenden, aber es die einfachste Weise war, damit ich prüfe, dass unsere Intuition recht ist und sie scheint, dass unsere Intuition uns nicht heh betrog.


Meine Berechnungen bitte überprüfen, da ich gerade sie schnell unten notierte.
Weitere Lösungen  
 
programming4us programming4us