Cuestión : ¿Paradoja de cumpleaños propensa de la intersección del filtro de la floración?

Considerar la idea abstracta siguiente, para el filtro de la floración que empareja, que fue propuesto a mí como alternativa a mirar para arriba el

Assume de los candidatos uno a la vez… que estamos utilizando un filtro de fines generales de la floración que fije pedacitos de K por entrada donde está indeterminada K pero > estructura de 1

We un filtro de la floración para una colección. Entonces tenemos una lista del candidato de artículos que queremos comprobar contra ese filtro así que construimos otro filtro fuera de la lista del candidato. Entonces nos realizamos realizamos una intersección del pedacito (binario y operación) en los dos filtros. Se asume que eventualmente de los pedacitos en el resultado están fijados allí es una probabilidad razonablemente buena que uno de los artículos en el sistema B se puede encontrar en el sistema A.

It es mi contención que, realmente, la probabilidad de un positivo falso es muy alta porque estamos diciendo que eventualmente mordió en fósforos del filtro A que cualquier pedacito en el filtro B hay un fósforo. ¿Veo esto como siendo ningún diferente a la paradoja de cumpleaños donde pedimos eventualmente a persona en las partes del sitio cualquier birthday.

Am I incorrecto o derecho y (sin ir más allá de matemáticas simple de la High School secundaria - pues no soy realmente que listo) puedo usted probarlo? ¿Esto todavía sería una edición si fijamos solamente 1 pedacito por entrada?

NB. Esto no es una “pregunta de la preparación” - comprobar mi perfil - que es una discusión del mundo real soy having.

Thank you.
class= del

Respuesta : ¿Paradoja de cumpleaños propensa de la intersección del filtro de la floración?

>> afirmo que hay un alto nivel de probabilidad que habrá un positivo falso por las razones indicadas en la pregunta.

Intuitivo, llegaría a la misma conclusión.


Pero intentemos hacer la matemáticas.

Tomar un ejemplo simple de un sistema B del tamaño 1. Ése sería el caso normal al comprobar si un artículo está presente en el filtro de la floración. Sin embargo, hay una diferencia grande en el acercamiento tomado para realizar ese cheque:

        acercamiento normal: comprobar si todos los pedacitos de B se fijan en A
        acercamiento propuesto: comprobar si por lo menos un pedacito de B se fija en A

La ocasión de positivos falsos está respectivamente (donde está el número m de pedacitos en el filtro de la floración, k es el número de funciones de picadillo, y n es el número de artículos almacenados en el filtro de la floración):

        acercamiento normal: p^k
        acercamiento propuesto: 1 - (1 - p)^k

donde está la probabilidad p que cierto pedacito es 1 en A:

        p = (1 - ((1 - (1/m)) ^ (kn)))

con k = 3, m = 256, n = 64 por ejemplo, conseguimos ese ~= 0.52833 de p, de modo que diera las oportunidades siguientes de positivos falsos:

        acercamiento normal: (0.52833) ^3 ~= 0.14747
        acercamiento propuesto: 1 - (1 - 0.52833) ^3 ~= 0.89507

Así pues, el acercamiento propuesto tiene una ocasión 6 veces más alta de un positivo falso (por este ejemplo), o casi una ocasión del 90% de un positivo falso (por este ejemplo).


Ahora, dejarnos extrapolan eso a un sistema B del tamaño L. Ahora:

        acercamiento normal: para cada uno de los artículos, cheque si todos los pedacitos de las funciones de picadillo se fijan en A, secuencialmente
        acercamiento propuesto: comprobar si por lo menos un pedacito de B se fija en A

La ocasión de positivos falsos ahora está respectivamente:

        acercamiento normal: 1 - (1 - p^k)^l
        acercamiento propuesto: 1 - (1 - p)^qm

donde está la probabilidad q que cierto pedacito es 1 en B:

        q = (1 - ((1 - (1/m)) ^ (kilolitro)))

con k = 3, m = 256, n = 64, l = 8 por ejemplo, conseguimos ese ~= 0.52833 de p y el ~= 0.08966 de q, de modo que diera las oportunidades siguientes de positivos falsos:

        acercamiento normal: 1 - (1 - (0.52833) ^3)^8 ~= 0.72096
        acercamiento propuesto: 1 - (1 - 0.52833) ~= 0.99999996 del ^ (0.08966 * 256)

Así pues, el acercamiento propuesto casi tiene una ocasión del 100% de un positivo falso (por este ejemplo).


Sé usted dijo no utilizar matemáticas, pero era la manera más fácil para que pruebe que nuestra intuición correcta, y parece que nuestra intuición no nos engañó heh.


Comprobar por favor mis cálculos, puesto que acabo de escribirlos rápidamente rápidamente abajo.
Otras soluciones  
 
programming4us programming4us