Vraag : De kruising van de Filter van de bloei naar voren gebogen aan de Paradox van de Verjaardag?

Overweeg het volgende abstracte idee, voor bloeifilter aanpassing, die aan me als alternatief voor het kijken omhoog individuele kandidaten tegelijkertijd…

Assume werd voorgesteld wij een filter gebruiken van de algemeen doelbloei die de beetjes van K per ingang plaatst waar K onbepaald is maar > 1

We bouwen een bloeifilter voor een inzameling. Wij hebben dan een kandidaatlijst van punten die wij hebben willen om tegen die filter controleren zodat bouwen wij een andere filter uit de kandidaatlijst. Wij presteren dan uitvoeren een beetjekruising (binair getal en verrichting) op de twee filters. Men veronderstelt dat als om het even welke beetjes in het resultaat worden geplaatst er een redelijk goede waarschijnlijkheid is dat één van de punten in Reeks B in reeks A.

It kan worden gevonden is mijn geschil dat, eigenlijk, de waarschijnlijkheid van een vals positief zeer hoog is omdat wij zeggen als om het even welk beetje in filter A om het even welk beetje in filter B daar is een gelijke aanpast. Ik zie dit zoals zijnd geen verschillend aan de Paradox van de Verjaardag waar wij vragen of deelt kan om het even welke persoon in de ruimte om het even welke verkeerde of juiste birthday.

Am I en (zonder het gaan verder dan eenvoudige middelbare schoolwiskunde - aangezien ik werkelijk niet dat knap) ben u het bewijzen? Zou dit nog een kwestie zijn als wij slechts 1 beetje per ingang plaatsen?

NB. Dit is geen „thuiswerkvraag“ - controleer mijn profiel - het is een echte wereldbespreking ik having.

Thank you.
ben

Antwoord : De kruising van de Filter van de bloei naar voren gebogen aan de Paradox van de Verjaardag?

>> die Ik er is een hoge graad van waarschijnlijkheid heb beweerd dat er zijn=zal= een vals die positief om de redenen verklaard=worden= in de vraag.

Intuïtief, zou ik aan de zelfde conclusie komen.


Maar proberen om math te doen.

Neem een eenvoudig voorbeeld van vastgestelde B van grootte 1. Dat zou het normale geval wanneer het controleren zijn als een punt in de bloeifilter aanwezig is. Nochtans, is er een groot die verschil in de benadering wordt gekozen om te presteren dat controle:

        normale benadering: controleer als alle beetjes van B in A worden geplaatst
        voorgestelde benadering: controleer als minstens men van B wordt geplaatst in A beet

De kans van valse positieven is respectievelijk (waar m het aantal beetjes in de bloeifilter is, is k het aantal knoeiboelfuncties, en die n is het aantal punten in de bloeifilter) worden opgeslagen:

        normale benadering: p^k
        voorgestelde benadering: 1 - (1 - p) ^k

waar p de waarschijnlijkheid is dat een bepaald beetje 1 in A is:

        p = (1 - ((1 - (1/m))^ (kn)))

met k = 3, m = 256, n = 64 bijvoorbeeld, krijgen wij dat p ~= 0.52833, zodat de volgende kansen van valse positieven zou geven:

        normale benadering: (0.52833) ^3 ~= 0.14747
        voorgestelde benadering: 1 - (1 - 0.52833) ^3 ~= 0.89507

zo, heeft de voorgestelde benadering een 6 keer hogere kans van een vals positief (dit bijvoorbeeld), of bijna een 90% kans van een vals positief (dit bijvoorbeeld).


Nu, extrapoleren dat aan vastgestelde B van grootte l. Nu:

        normale benadering: voor elk van de punten, controle als alle beetjes van de knoeiboelfuncties in A, opeenvolgend worden geplaatst
        voorgestelde benadering: controleer als minstens men van B wordt geplaatst in A beet

De kans van valse positieven is nu respectievelijk:

        normale benadering: 1 - (1 - p^k) ^l
        voorgestelde benadering: 1 - (1 - p) ^qm

waar q de waarschijnlijkheid is dat een bepaald beetje 1 in B is:

        q = (1 - ((1 - (1/m))^ (kl)))

met k = 3, m = 256, n = 64, l = 8 bijvoorbeeld, krijgen wij dat p ~= 0.52833 en q ~= 0.08966, zodat de volgende kansen van valse positieven zou geven:

        normale benadering: 1 - (1 - (0.52833) ^3) ^8 ~= 0.72096
        voorgestelde benadering: 1 - (1 - 0.52833) ^ (0.08966 * 256) ~= 0.99999996

zo, heeft de voorgestelde benadering bijna een 100% kans van een vals positief (dit bijvoorbeeld).


Ik weet u zei om wiskunde niet te gebruiken, maar het was de gemakkelijkste manier voor me om te bewijzen dat onze intuïtie juist is, en het schijnt onze intuïtie ons niet heh bedroog.


Gelieve te controleren mijn berekeningen, aangezien ik hen enkel snel neer noteerde.
Andere oplossingen  
 
programming4us programming4us