Question : À paradoxe de l'anniversaire enclin d'intersection de filtre de fleur ?

Considérer l'idée abstraite suivante, pour le filtre de fleur s'assortissant, qui a été proposé à moi comme alternative à rechercher le

Assume de candidats un par un… que nous utilisons un filtre d'usage universel de fleur qui place le peu de K par entrée où K est indéterminé mais > construction de 1

We un filtre de fleur pour une collection. Nous avons alors une liste de candidat d'articles que nous voulons vérifier contre ce filtre ainsi nous construisons un autre filtre hors de la liste de candidat. Nous exécutons alors effectuons une intersection de peu (binaire et opération) sur les deux filtres. On le suppose que le cas échéant du peu dans le résultat sont placés il y a une probabilité raisonnablement bonne qu'un des articles dans l'ensemble B peut être trouvé dans l'ensemble A.

It est ma controverse que, réellement, la probabilité d'un positif faux est très haute parce que nous disons que le cas échéant a mordu dans des allumettes du filtre A que n'importe quel peu dans le filtre B il y a une allumette. Je ne vois ceci en tant qu'étant aucunement différent du paradoxe de l'anniversaire où nous demandons le cas échéant à personne dans les parts de chambre n'importe quel birthday.

Am I faux ou droit et (sans aller au delà des maths simples de lycée - car je ne suis vraiment pas qu'intelligent) peux vous le prouver ? Est-ce que c'était toujours une issue si nous placions seulement 1 bit par entrée ?

NB. Ce n'est pas une « question de travail » - vérifier mon profil - que c'est une discussion de monde réel je suis having.

Thank you.
class= de

Réponse : À paradoxe de l'anniversaire enclin d'intersection de filtre de fleur ?

>> j'affirme qu'il y a un niveau important de la probabilité qu'il y aura un positif faux pour les raisons indiquées en question.

Intuitivement, je viendrais à la même conclusion.


Mais essayons de faire les maths.

Prendre un exemple simple d'un ensemble B de la taille 1. Ce serait le cas normal en vérifiant si un article est présent dans le filtre de fleur. Cependant, il y a une grande différence dans l'approche adoptée pour exécuter ce contrôle :

        approche normale : vérifier si tout le peu de B est placé dans A
        approche proposée : vérifier si au moins un bit de B est placé dans A

La possibilité des positifs faux est respectivement (où m est le nombre de peu dans le filtre de fleur, k est le nombre de fonctions de gâchis, et n est le nombre d'articles stockés dans le filtre de fleur) :

        approche normale : p^k
        approche proposée : 1 - (1 - p)^k

là où p est la probabilité qu'un certain peu est 1 dans A :

        p = (1 - ((1 - (1/m)) ^ (kn)))

avec k = 3, m = 256, n = 64 par exemple, nous obtenons ce ~= 0.52833 de p, de sorte que donne les possibilités suivantes des positifs faux :

        approche normale : (0.52833) ^3 ~= 0.14747
        approche proposée : 1 - (1 - 0.52833) ^3 ~= 0.89507

ainsi, l'approche proposée a une possibilité 6 fois plus élevée d'un positif faux (pour cet exemple), ou presque une possibilité de 90% d'un positif faux (pour cet exemple).


Maintenant, nous laisser extrapolent cela à un ensemble B de la taille L. Maintenant :

        approche normale : pour chacun des articles, contrôle si tout le peu des fonctions de gâchis est placé dans A, séquentiellement
        approche proposée : vérifier si au moins un bit de B est placé dans A

La possibilité des positifs faux est maintenant respectivement :

        approche normale : 1 - (1 - p^k)^l
        approche proposée : 1 - (1 - p)^qm

là où q est la probabilité qu'un certain peu est 1 à B :

        q = (1 - ((1 - (1/m)) ^ (kilolitre)))

avec k = 3, m = 256, n = 64, l = 8 par exemple, nous obtenons ce ~= 0.52833 de p et ~= 0.08966 de q, de sorte que donne les possibilités suivantes des positifs faux :

        approche normale : 1 - (1 - (0.52833) ^3)^8 ~= 0.72096
        approche proposée : 1 - (1 - 0.52833) ~= 0.99999996 du ^ (0.08966 * 256)

ainsi, l'approche proposée a presque une possibilité de 100% d'un positif faux (pour cet exemple).


Je sais vous avez dit de ne pas employer des maths, mais c'était la manière la plus facile pour que je montre que notre intuition est exacte, et elle semble que notre intuition ne nous a pas trompés heh.


Veuillez vérifier mes calculs, puisque je juste rapidement les ai pris vers le bas.
Autres solutions  
  •  MS Excel 2007 et pdf - l'exportation vers le pdf prend de longues heures !
  •  Dans le Perl, comment j'ajoute une valeur à la liste, puis le contrôle pour voir si la valeur existent avant d'ajouter une nouvelle valeur
  •  Comment fais j'initialiser de la HP BL460c G6 de san et de la HP XP 240000
  •  Comment fais j'employer une clef de permis de volume sur un ordinateur de HP avec du CD de restauration
  •  Emplacement primaire de deux SCCM dans l'annuaire actif
  •  L'initiateur et la HP D2D de l'iSCSI R2 du serveur 2008 de Windows GERCENT l'issue
  •  Stocker le dossier dans le mysql using connector.net et le champ de goutte
  •  Carte vidéo d'USB - bit 32 sur le matériel travaillant au niveau du bit 64 ?
  •  asp.net que j'essaye de convertir une forme de HTML en forme d'aspx ou ? ce qui jamais. Aide du besoin sur la façon dont à à elle.
  •  Winzip 12 issues de secours du travail ?
  •  
    programming4us programming4us