La probabilidad es uno de los conceptos más escurridizos que conozco. Curiosamente, la probabilidad suele considerarse un asunto menor. Por ejemplo, los planes de estudios de matemáticas para estudiantes de letras, popularmente conocidos como matemáticas fáciles (no entraré aquí a evaluar si este pseudónimo es o no apropiado), suelen centrarse más en la estadística y la probabilidad que en el álgebra y el cálculo, tradicionalmente reservados para las matemáticas para ciencias.
Para hacernos una idea rápida de la complejidad del concepto de probabilidad, nótese que esta cuantifica cómo de posible es un determinado suceso. Esto es, no solamente nos dice si un suceso es posible o no, sino cuánto. Si no fuese porque estamos acostumbrados a ella, la frase anterior nos sonaría a ciencia ficción.
Cuando digo que la probabilidad es difícil no pienso en problemas especialmente rebuscados. Es fácil encontrar problemas sencillos con resultados poco intuitivos. Aquí va uno:
Supongamos un mundo sin hermanos gemelos. Un mundo en el que los partos múltiples no existen, y además la probabilidad de tener un bebé niño sea 0.5, y la de tener una bebé niña 0.5 también. Supongamos ahora que conocemos a una madre que, sabemos, ha tenido dos partos consecutivos y, por lo tanto, tiene dos bebés. Empecemos por las preguntas fáciles y vayamos subiendo en dificultad:
¿Cuál es la probabilidad de que…
- … los dos bebés sean niñas?
- … un bebé sea niño y el otro sea niña?
- … los dos bebés sean niños, sabiendo que uno de ellos es niño?
- … los dos bebés sean niños, sabiendo que el mayor de ellos es niño?
Si quieres darle una pensada, espera antes de seguir leyendo.
Las respuestas, a continuación:
- 0.25
- 0.5
- 0.33
- 0.5
Para entender estos resultados basta con aplicar la aparentemente sencilla definición frecuentista de probabilidad: dividir casos favorables entre casos posibles. Los casos posibles son: (niño, niño), (niño, niña), (niña, niño), (niña, niña), dónde el primer elemento es el hermano (o hermana) mayor y el otro el (o la) menor. Podemos ordenarlos cómodamente en un diagrama como el siguiente:
Para el problema número 1, marcaremos en verde el único caso favorable, y en rojo los casos desfavorables. Vemos que la probabilidad de tener dos niñas es 1 entre 4, esto es, 0.25.
Siguiendo la misma estrategia gráfica, la solución al problema número 2 presenta el siguiente aspecto, donde se ve claramente por qué la respuesta es 0.5:
El caso 3 da un salto en dificultad; es lo que se conoce como un problema de probabilidad condicionada. La diferencia con los anteriores es que introducimos información nueva, y esto altera el panorama general. Si sabemos que uno de los bebés es varón, el caso (niña, niña) queda excluído. Indicaremos esto marcándolo en gris. Tenemos, pues, un caso favorable de tres posibles:
Y por último, el problema 4. Saber que el hijo mayor es varón nos proporciona más información que saber simplemente que alguno de los hijos es varón. Esto se ve reflejado por el hecho de que hay dos casos que quedan excluidos, (niña, niña) y (niña, niño), pues recordemos que el primer elemento representa al hermano/a mayor. Tenemos pues un caso favorable de dos posibles:
Una información que, a primera vista, parecía accesoria (si la información se refiere al mayor, al menor o simplemente a a uno de los dos) resulta ser de vital importancia para el problema.
Pero no se trata solamente de una curiosidad académica: este problema tiene un análogo práctico nada menos que en física de partículas. Imaginemos que tenemos dos partículas, cada una de las cuales puede tener dos propiedades mutuamente excluyentes (que en lugar de niño-niña llamaremos 0-1, y que pueden representar, por ejemplo, dos estados de espín). Tendremos entonces cuatro posibilidades (0-0), (0-1), (1-0) y (1-1). ¿Mismo problema, verdad?
Pues… sí y no. En el problema de los bebés hemos tomado por cierta una verdad que es válida para los bebés, pero no necesariamente para las partículas: su distinguibilidad*. A escala humana es posible distinguir al hermano mayor del menor. En el caso de las partículas, a menudo es imposible diferenciarlas mediante proceso físico alguno. ¿Y qué consecuencias tiene esto? En un primer vistazo ninguna consecuencia, pero… si las partículas son indistinguibles, etiquetarlas como partícula 1 y partícula 2 carece de sentido. En ese caso no nos queda más remedio que tratarlas como un conjunto. Más concretamente, en el caso de partículas indistinguibles nuestras opciones se reducen a tres: (las dos 0), (las dos 1), (las dos diferentes), pues las opciones (1-0) y (0-1) pierden su sentido individual.
Puede parecer un detalle menor, una mera curiosidad matemática, pero el hecho de que las partículas involucradas en un proceso físico sean o no distinguibles afecta enormemente a su comportamiento. O más bien al revés: son las peculiaridades de su comportamiento la que las hacen distinguibles o no.
En resumen: cuidado con la probabilidad. Es el concepto científico más engañosamente sencillo con el que me he topado jamás.
*: y no es la única. También hemos asumido que la distribución de probabilidad subyacente es uniforme y que el estado de cada partícula es independiente del estado de la otra. Pero en bastantes harinas nos estamos metiendo ya…
Yo he acertado las cuatro respuestas porque hace poco leí ‘El andar del borracho’, de Leonard Mlodinow, donde se explica que esa forma de calcular las probabilidades (partiendo del espacio muestral, es decir, del conjunto de resultados posibles) la descubrió en el siglo XVI Gerolamo Cardano.
Mlodinow analiza también en su libro del célebre problema de Monty Hall, que a muchos les trae de cabeza, aunque basta con tener en cuenta el espacio muestral para que se vuelva fácil de resolver.
Muy breve e interesante! Me he quedado con las ganas de saber qué pasa cuando los estados son dependientes. Quizá para la próxima entrada ¿?
Sobre los estados dependientes, el caso más común se da cuando las partículas pertenecen a la familia de los fermiones. Los electrones son un ejemplo de fermión.
En este caso se aplica el principio de exclusión de Pauli, que impide que dos partículas posean el mismo estado. Esto hace que el único caso posible, cuando tenemos dos fermiones indistinguibles, sea (estados diferentes) con probabilidad del 100%.
Para más información, este artículo (especialmente la Tabla 1):
https://en.m.wikipedia.org/wiki/Identical_particles
No entiendo por qué saber que el hijo mayor es varón da más información sobre la duda «cuantos hijos varones tiene» que saber solo que uno de los hijos es varón. En principio el orden no afecta a la duda, da igual en que orden hayan nacido. ¿Qué es lo que no estoy teniendo en cuenta?
Para fines ilustrativos, ¿podría alguien ayudarme a resolver el mismo problema pero usando la aproximación bayesiana, esto es, calculando P(A|B), etc?
Hasta ahora, deduzco que la distribucion es 2-dimensinal: P(X,Y); X={0,1}, Y={0,1} y que para los casos a) y b) uno tiene:
a) P(1,1) = P(1).P(1) = 1/2 x 1/2 = 1/4
b) P(0,1) = P(0).P(1) + P(1).P(0) = 1/4 x 1/4 + 1/4 x 1/4 = 1/2
¿pero para c) y d) ?