>> asserisco che ci è un alto livello di probabilità che ci sarà un positivo falso per i motivi addotti in domanda.
Intuitivo, giungerei alla stessa conclusione.
Ma proviamo a fare il per la matematica.
Fare un esempio semplice di un insieme B del formato 1. Quello sarebbe il caso normale quando controlla se un articolo è presente nel filtro dalla fioritura. Tuttavia, ci è una grande differenza nel metodo adottato per effettuare quel controllo:
metodo normale: controllare se tutte le punte della B sono regolate in A
metodo proposto: controllare se almeno un bit della B è regolato in A
La probabilità dei positivi falsi è rispettivamente (dove la m. è il numero delle punte nel filtro dalla fioritura, K è il numero delle funzioni di hash e la n è il numero degli articoli immagazzinati nel filtro dalla fioritura):
metodo normale: p^k
metodo proposto: 1 - (1 - p)^k
dove la p è la probabilità che una determinata punta è 1 in A:
p = (1 - ((1 - (1/m)) ^ (kn)))
con K = 3, m. = 256, n = 64 per esempio, otteniamo quel ~= 0.52833 di p, di modo che dare le seguenti probabilità dei positivi falsi:
metodo normale: (0.52833) ^3 ~= 0.14747
metodo proposto: 1 - (1 - 0.52833) ^3 ~= 0.89507
così, il metodo proposto ha una probabilità più alta 6 volte di un positivo falso (per questo esempio), o quasi una probabilità di 90% di un positivo falso (per questo esempio).
Ora, lasciarli estrapolano quello ad un insieme B del formato L. Ora:
metodo normale: per ciascuno degli articoli, controllo se tutte le punte dalle funzioni di hash sono regolate in A, in sequenza
metodo proposto: controllare se almeno un bit della B è regolato in A
La probabilità dei positivi falsi è ora rispettivamente:
metodo normale: 1 - (1 - p^k)^l
metodo proposto: 1 - (1 - p)^qm
dove la q è la probabilità che una determinata punta è 1 in B:
q = (1 - ((1 - (1/m)) ^ (chilolitro)))
con K = 3, m. = 256, n = 64, l = 8 per esempio, otteniamo quel ~= 0.52833 di p e il ~= 0.08966 di q, di modo che dare le seguenti probabilità dei positivi falsi:
metodo normale: 1 - (1 - (0.52833) ^3)^8 ~= 0.72096
metodo proposto: 1 - (1 - 0.52833) ~= 0.99999996 del ^ (0.08966 * 256)
così, il metodo proposto ha quasi una probabilità di 100% di un positivo falso (per questo esempio).
So avete detto di non usare i per la matematica, ma era il senso più facile affinchè me dimostri che la nostra intuizione è di destra e sembra che la nostra intuizione non li abbia ingannati heh.
Controllare prego i miei calcoli, poiché li ho annotati appena rapidamente giù.