sábado, 25 de septiembre de 2010

PROBABILIDAD CONDICIONAL E INDEPENDIENTE

Probabilidad condicionada

De Wikipedia, la enciclopedia libre
Probabilidad condicionada es la probabilidad de que ocurra un evento A, sabiendo que también sucede otro evento B. La probabilidad condicional se escribe P(A|B), y se lee «la probabilidad de A dado B.
No tiene por qué haber una relación causal o temporal entre A y B. A puede preceder en el tiempo a B, sucederlo o pueden ocurrir simultáneamente. A puede causar B, viceversa o pueden no tener relación causal. Las relaciones causales o temporales son nociones que no pertenecen al ámbito de la probabilidad. Pueden desempeñar un papel o no dependiendo de la interpretación que se le dé a los eventos.
El condicionamiento de probabilidades puede lograrse aplicando el teorema de Bayes.

Definición

Dado un espacio de probabilidad (Ω,F,P) y dos eventos (o sucesos) A, B\in F con P(B) > 0, la probabilidad condicional de A dado B está definida como:
P(A \mid B) = \frac{P(A \cap B)}{P(B)}.

P(A \mid B) se puede interpretar como, tomando los mundos en los que B se cumple, la fracción en los que también se cumple A.

 Interpretación

P(A \mid B) se puede interpretar como, tomando los mundos en los que B se cumple, la fracción en los que también se cumple A. Si el evento B es, por ejemplo, tener la gripe, y el evento A es tener dolor de cabeza, P(A \mid B) sería la probabilidad de tener dolor de cabeza cuando se está enfermo de gripe.
Gráficamente, si se interpreta el espacio de la ilustración como el espacio de todos los mundos posibles, A serían los mundos en los que se tiene dolor de cabeza y B el espacio en el que se tiene gripe. La zona verde de la intersección representaría los mundos en los que se tiene gripe y dolor de cabeza P(A \cap B). En este caso P(A \mid B), es decir, la probabilidad de que alguien tenga dolor de cabeza sabiendo que tiene gripe, sería la proporción de mundos con gripe y dolor de cabeza (color verde) de todos los mundos con gripe: El área verde dividida por el área de B. Como el área verde representa P(A \cap B) y el área de B representa a P(B), formalmente se tiene que:
P(A \mid B) = \frac{P(A \cap B)}{P(B)}.

 Propiedades

  1. P(A \mid B) + P(\bar{A} \mid B) = 1
  2.  B \subseteq A \to P(A \mid B) = 1

Pero NO es cierto que P(A \mid B) + P(A \mid \bar{B}) = 1

La proporción de zona verde dentro de B es la misma que la de A en todo el espacio y, de la misma forma, la proporción de la zona verde dentro de A es la misma que la de B en todo el espacio. Son sucesos independientes.

Independencia de sucesos

Artículo principal: Independencia (probabilidad)
Dos sucesos aleatorios A y B son independientes si y sólo si:
P(A \cap B) \ = \ P(A)  P(B).
O sea que si A y B son independientes, su probabilidad conjunta, P(A \cap B) ó P(A,B).
puede ser expresada como el producto de las probabilidades individuales. Equivalentemente:
P(A|B) \ = \ P(A)
 P(B|A) \ = \ P(B).
En otras palabras, si A y B son independientes, la probabilidad condicional de A dado B es simplemente la probabilidad de A y viceversa.

 Exclusividad mutua


Los conjuntos A y B no intersecan. Son mutuamente excluyentes.
Dos sucesos A y B son mutuamente excluyentes si y sólo si A \cap B = \emptyset. Entonces, P(A \cap B) = 0.
Además, si P(B) > 0 entonces P(A\mid B) es igual a 0.

 La falacia de la probabilidad condicional

La falacia de la probabilidad condicional se basa en asumir que P(A|B) es casi igual a P(B|A). El matemático John Allen Paulos analiza en su libro El hombre anumérico este error muy común cometido por doctores, abogados y otras personas que desconocen la probabilidad.
La verdadera relación entre P(A|B) y P(B|A) es la siguiente:
P(B \mid A)= P(A \mid B) \cdot \frac{P(B)}{P(A)} (Teorema de Bayes)

Problemas de ejemplo

---La paradoja del falso positivo---
La magnitud de este problema es la mejor entendida en términos de probabilidades condicionales.
Supongamos un grupo de personas de las que el 1 % sufre una cierta enfermedad, y el resto está bien. Escogiendo un individuo al azar:
P(enfermo) = 1% = 0.01 y P(sano) = 99% = 0.99
Supongamos que aplicando una prueba a una persona que no tiene la enfermedad, hay una posibilidad del 1 % de conseguir un falso positivo, esto es:
P(positivo | sano) = 1% y P(negativo | sano) = 99%
Finalmente, supongamosque aplicando la prueba a una persona que tiene la enfermedad, hay una posibilidad del 1 % de un falso negativo, esto es:
P(negativo | enfermo) = 1% y P(positivo | enfermo) = 99%

Ahora, uno puede calcular lo siguiente:
La fracción de individuos en el grupo que están sanos y dan negativo:

P( sano \cap negativo) = P(sano) \times P(negativo|sano)=99% \times 99%=98.01%

La fracción de individuos en el grupo que están enfermos y dan positivo:

P( enfermo \cap positivo) = P(enfermo) \times P(postivo|enfermo) = 1% \times 99% = 0.99%

La fracción de individuos en el grupo que dan falso positivo:

P( sano \cap positivo) = P(sano) \times P(postivo|sano) = 99% \times 1% = 0.99%

La fracción de individuos en el grupo que dan falso negativo:

P( enfermo \cap negativo) = P(enfermo) \times P(negativo|enfermo) = 1% \times 1% = 0.01%

Además, la fracción de individuos en el grupo que dan positivo:

P( positivo ) = P ( sano \cap positivo ) + P ( enfermo \cap postivo ) = 0.99% + 0.99% = 1.98%

Finalmente, la probabilidad de que un individuo realmente tenga la enfermedad, dado un resultado de la prueba positivo:
P(enfermo|positivo) = \frac{P(enfermo \cap positivo)}{P(positivo)}=\frac{0.99%}{1.98%}=50%
En este ejemplo, debería ser fácil ver la diferencia entre las probabilidades condicionadas P (positivo | enfermo) (que es del 99 %) y P (enfermo | positivo) (que es del 50 %): la primera es la probabilidad de que un individuo enfermo de positivo en la prueba; la segunda es la probabilidad de que un individuo que da positivo en la prueba tenga realmente la enfermedad. Con los números escogidos aquí, este último resultado probablemente sería considerado inaceptable: la mitad de la gente que da positivo en realidad está sana.


La probabilidad de tener una enfermedad rara es de 0,001: P(enfermo) = 0,001


La probabilidad de que cuando el paciente está enfermo se acierte en el diagnóstico es de 0,99: P(positivo | enfermo) = 0,99
La probabilidad de falso positivo es de 0,05: P(positivo | sano) = 0,05
Pregunta: Me dicen que he dado positivo, ¿Qué probabilidad hay de que tenga la enfermedad?
P(enfermo|positivo)=\frac{P(enfermo) \times P(positivo|enfermo)}{P(positivo)} P(enfermo|positivo)= P(enfermo) \times \frac{P(positivo|enfermo)}{P(enfermo) \times P(positivo|enfermo)+P(sano) \times P(positivo|sano)} P(enfermo|positivo)=\frac{ 0,001 \times 0,99 }{0,001 \times 0,99+0,999 \times 0,05}= 0,019= 1,9%



Probabilidad Independiente

De Wikipedia, la enciclopedia libre
En teoría de probabilidades, se dice que dos sucesos aleatorios son independientes entre sí cuando la probabilidad de cada uno de ellos no está influida por que el otro suceso ocurra o no, es decir, cuando ambos sucesos no están correlacionados.

Definición formal

Dos sucesos son independientes si la probabilidad de que ocurran ambos simultáneamente es igual al producto de las probabilidades de que ocurra cada uno de ellos, es decir, si A y B son dos sucesos, y P(A) y P(B) son las probabilidades de que ocurran respectivamente entonces:
A y B son independientes si y solo si P(A\cap B) = P(A)P(B)

 Motivación de la definición

Sean A y B dos sucesos tales que P(B) > 0, intuitivamente A es independiente de B si la probabilidad de A condicionada por B es igual a la probabilidad de A. Es decir si:
P(A|B) \ = \ P(A)
De la propia definición de probabilidad condicionada:
P(A \mid B) = \frac{P(A \cap B)}{P(B)}.
se deduce que P(A \cap B) \ = \ P(A \mid B) P(B), y dado que P(A|B) \ = \ P(A) deducimos trivialmente que P(A \cap B) \ = \ P(A)  P(B),.
Si el suceso A es independiente del suceso B, automáticamente el suceso B es independiente de A.

 Propiedades

La independencia de sucesos es algo muy importante para la estadística y es condición necesaria en multitud de teoremas. Por ejemplo, una de las primeras propiedades que se deriva de la definición de sucesos independientes es que si dos sucesos son independientes entre sí, la probabilidad de la intersección es igual al producto de las probabilidades.

0 comentarios:

Publicar un comentario