Questione : A paradosso di compleanno incline dell'intersezione del filtro dalla fioritura?

Considerare la seguente idea astratta, per il filtro dalla fioritura che corrisponde, che è stato proposto a me come alternativa a osservare in su i diversi candidati un alla volta…

Assume che stiamo utilizzando un filtro per tutti gli usi dalla fioritura che regola le punte di K per entrata in cui K è indeterminato ma > configurazione di 1

We un filtro dalla fioritura per una collezione. Allora abbiamo una lista del candidato degli articoli che vogliamo controllare contro quel filtro in modo da costruiamo un altro filtro dalla lista del candidato. Allora effettuiamo realizziamo un'intersezione della punta (paio e funzionamento) sui due filtri. È presupposto che se c'è ne delle punte nel risultato sono regolate ci sia una probabilità ragionevolmente buona che uno degli articoli nell'insieme B può essere trovato nell'insieme A.

It è il mio conflitto che, realmente, la probabilità di un positivo falso è molto alta perché stiamo dicendo se qualunque punta in filtro A abbina qualunque punta in filtro B là è un fiammifero. Vedo questo come essendo nessun differente al paradosso di compleanno dove chiediamo se chiunque nella stanza riparte qualunque birthday.

Am I errato o di destra e (senza andare oltre i per la matematica semplici della High School - poichè non sono realmente che intelligente) posso voi dimostrarlo? Questa ancora sarebbe un'edizione se regolassimo soltanto 1 bit per entrata?

NB. Ciò non è “una domanda di lavoro„ - controllare il mio profilo - che sia una discussione del mondo reale sono having.

Thank you.
class= del

Risposta : A paradosso di compleanno incline dell'intersezione del filtro dalla fioritura?

>> asserisco che ci è un alto livello di probabilità che ci sarà un positivo falso per i motivi addotti in domanda.

Intuitivo, giungerei alla stessa conclusione.


Ma proviamo a fare il per la matematica.

Fare un esempio semplice di un insieme B del formato 1. Quello sarebbe il caso normale quando controlla se un articolo è presente nel filtro dalla fioritura. Tuttavia, ci è una grande differenza nel metodo adottato per effettuare quel controllo:

        metodo normale: controllare se tutte le punte della B sono regolate in A
        metodo proposto: controllare se almeno un bit della B è regolato in A

La probabilità dei positivi falsi è rispettivamente (dove la m. è il numero delle punte nel filtro dalla fioritura, K è il numero delle funzioni di hash e la n è il numero degli articoli immagazzinati nel filtro dalla fioritura):

        metodo normale: p^k
        metodo proposto: 1 - (1 - p)^k

dove la p è la probabilità che una determinata punta è 1 in A:

        p = (1 - ((1 - (1/m)) ^ (kn)))

con K = 3, m. = 256, n = 64 per esempio, otteniamo quel ~= 0.52833 di p, di modo che dare le seguenti probabilità dei positivi falsi:

        metodo normale: (0.52833) ^3 ~= 0.14747
        metodo proposto: 1 - (1 - 0.52833) ^3 ~= 0.89507

così, il metodo proposto ha una probabilità più alta 6 volte di un positivo falso (per questo esempio), o quasi una probabilità di 90% di un positivo falso (per questo esempio).


Ora, lasciarli estrapolano quello ad un insieme B del formato L. Ora:

        metodo normale: per ciascuno degli articoli, controllo se tutte le punte dalle funzioni di hash sono regolate in A, in sequenza
        metodo proposto: controllare se almeno un bit della B è regolato in A

La probabilità dei positivi falsi è ora rispettivamente:

        metodo normale: 1 - (1 - p^k)^l
        metodo proposto: 1 - (1 - p)^qm

dove la q è la probabilità che una determinata punta è 1 in B:

        q = (1 - ((1 - (1/m)) ^ (chilolitro)))

con K = 3, m. = 256, n = 64, l = 8 per esempio, otteniamo quel ~= 0.52833 di p e il ~= 0.08966 di q, di modo che dare le seguenti probabilità dei positivi falsi:

        metodo normale: 1 - (1 - (0.52833) ^3)^8 ~= 0.72096
        metodo proposto: 1 - (1 - 0.52833) ~= 0.99999996 del ^ (0.08966 * 256)

così, il metodo proposto ha quasi una probabilità di 100% di un positivo falso (per questo esempio).


So avete detto di non usare i per la matematica, ma era il senso più facile affinchè me dimostri che la nostra intuizione è di destra e sembra che la nostra intuizione non li abbia ingannati heh.


Controllare prego i miei calcoli, poiché li ho annotati appena rapidamente giù.
Altre soluzioni  
 
programming4us programming4us