La CUP y la binomial

Tweet con la  solución errónea
Tweet con la solución errónea

Cierto bloguero, quien se define matemático junto a otro detalle no tan honorable (en mi subjetiva opinión), hizo la afirmación que tenéis en la anterior imagen. Bueno, con esto de la política corren ríos de tinta. De política no es que me entere mucho, pero parece ser que debían decidir entre sí o no a votación los de la CUP una cuestión entre 3030 personas. La pregunta es, ¿cuál es la probabilidad de empate, o sea, que salgan 1515 que sí y 1515 que no?

La fórmula utilizada era 1/(n-1), siendo n=3030, el número de participantes. A mí me sonó mal de entrada. Siempre me ha funcionado muy bien en física y matemáticas hacer un razonamiento similar a la falacia de la pendiente resbaladiza. Lo que hago es buscar casos y consecuencias extremas y ver qué pasa. En este caso podemos imaginar que, si en lugar de 3030 fueran 4 personas, entonces, la probabilidad de empate… ¿sería 1/3? Posteriormente comentaron que no, que era 1/n o 1/(n+1), o sea, 1/4 o 1/5. Tampoco me cuadraba.

Voy a resolverlo a mi manera, con lo que aprendí en la facultad. No sé si es la forma actual u ortodoxa, pero sí ha sido la suficiente como para que después de años aún quede algo en mi memoria. Vamos a poner antes dos ejemplos para aclararnos. Llamemos n al número de participantes y veamos todas las posibles combinaciones de votos que pueden tener. Supongamos que fueran n=2 personas. Los resultados posibles serían los siguientes:

Sí, Sí Sí, No -> OK No, No No, Sí -> OK

Claramente, la probabilidad de empate es 2 casos favorables frente a 4 posibles: un 50%. Quien lo hiciera con 1/n acertaría pero, ¿funciona para un n cualquiera? Supongamos que fueran n=4 participantes y veamos si volvemos a acertar. Los resultados posibles serían los siguientes.

Sí, Sí, Sí, Sí Sí, Sí, Sí, No Sí, Sí, No, Sí Sí, Sí, No, No -> OK Sí, No, Sí, Sí Sí, No, Sí, No -> OK Sí, No, No, Sí -> OK Sí, No, No, No No, Sí, Sí, Sí No, Sí, Sí, No -> OK No, Sí, No, Sí -> OK No, Sí, No, No No, No, Sí, Sí -> OK No, No, Sí, No No, No, No, Sí No, No, No, No

O sea, casos posibles: 16; casos favorables: 6. El resultado es 6/16; lo que hace es un 37,5%. El cálculo 1/n o similares es obviamente incorrecto. Este cálculo se llama modelo binomial y se cumple bajo 4 premisas:

  1. Tenemos n experimentos independientes.
  2. Para cada experimento hay sólo 2 sucesos posibles: Sí y No (podemos decir cara o cruz, o como dicen los matemáticos: A y no A).
  3. La probabilidad de A es p=P(A) y la de no A es q=1-P(A) y son constantes (por ejemplo, en una moneda p=q=0,5; pero si es una moneda trucada, podría ser p=0,3 y q=0,7).
  4. x será el número de veces que ocurre A en los n experimentos.

En nuestro segundo caso con 4 personas será n=4; x=2 (que salgan 2 personas que dicen que sí); y como suponemos que las votaciones son aleatorias (suposición que estoy empezando a pensar que es cierta) tenemos que p=0,5.

b(x;n,p)=b(2;4,0’5)

O sea, probabilidad de que 2 personas digan que sí. La binomial está tabulada, no esta, sino otra que se denota con una B mayúscula, pero nos da el resultado de que dos personas o menos digan que sí; así que buscaremos el resultado de dos personas o menos digan que sí y le restaremos una persona o menos diga que sí, con lo que tendremos la probabilidad de que dos personas de forma exacta voten sí:

b(2;4,0’5) = B(2;4,0’5) – B(1;4,0’5)

Vamos a las tablas. Si queréis saber cómo se utilizan tenéis este enlace que lo explica. Las tablas de la binomial las tenéis en muchos sitios, como este por ejemplo. No hace falta que los miréis. Os pongo el resultado remarcado de ambos:

Tabla de la binomial Buscando los valores para x, n y p tenemos:

b(2;4,0’5) = B(2;4,0’5) – B(1;4,0’5) = 0,6875 – 0,3125 = 0,375

Con lo que el resultado es un 37,5% que coincide con el cálculo inicial que habíamos hecho a mano. Estamos en el camino correcto.

Ahora vamos con el problema de las votaciones. Buscamos x=1515 que voten que sí con n=3030 participantes y la probabilidad de sí es 0,5; o sea, b(1515;3030,0’5). Esto no está tabulado y hay que resolverlo con otras fórmulas.

Aquí entra en juego el maravilloso matemático Abraham de Moivre. Parece ser que notó que cada día dormía 15 minutos más que el anterior, así que siguiendo esa serie en unos cuantos días dormiría las 24 horas. Dormir 24 horas al día significa estar muerto con lo que predijo la fecha de su muerte. Y parece que así fue. El mismísimo Newton, cuando le hicieron una pregunta de matemáticas contestó:

Vayan con Abrahám de Moivre a consultar esto. Él sabe mucho más que yo de estas cosas.

Pues bien, aprovechando los trabajos de este hombre calculamos la binomial (es un tanto elaborado porque hay que ajustarlo a una Normal) y sale un 1,44%. Yo he tenido manga ancha con los redondeos y en tablas también redondeando donde tendría que haber interpolado y me ha salido un 1,6%. En este enlace podéis verlo resuelto de otra manera.

Posteriormente, dado que el matemático decía que era imposible y ha salido, rápidamente hay quien ha intentado aprovechar el tirón:

Lotería

Me temo que habría que hacer un cálculo diferente.


89 Comentarios

Participa Suscríbete

ShevekShevek

Todos los que estáis publicando análisis matemáticos al asunto de la CUP estáis cometiendo el mismo error: considerar que cada voto se emite aleatoriamente con probabilidad del 50%.

Nada más lejos de la realidad. En cada individuo el voto está muy sesgado y cada individuo tiene un sesgo imposible de adivinar a priori. Yo puedo proponer otro modelo de sesgo lejos del naïve del 50% (vamos, que cada votante tira una moneda antes de emitir el voto).

Mi modelo es el siguiente: de los 3030 votantes, 1515 tienen el voto 100% sesgado al “sí” y 1515 tienen el voto sesgado 100% al “no”. ¿Cuál es la probabilidad de empate? No hagan las cuentas, ya se lo digo yo: 1 (o 100%).

Mi modelo representa el extremo opuesto al del voto aleatorio. Entre ambos está la verdad.

Offler

Una cosa es el cálculo matemático, y otra cosa es que se trata con personas con opinión.

Uno puede hacer un cálculo matemático de las posibilidades de acertar en una quiniela los 14 resultados, pero evidentemente las probabilidades dependen de muchos conceptos. El último puede ganar al primero, aunque lo normal es que no sea así. Puede haber lesiones, jugadores desmotivados, cambio de entrenador o que hayan jugado otro partido esa semana. Pero el cálculo probabilístico de acertar 14 resultados que se suponen aleatorios será el mismo, si no el autor ganaría la quiniela cada semana

Lo que el autor indica es que es un suceso que dista mucho de ser imposible matemáticamente hablando, en contra de lo que afirmaba el twitter del supuesto matemático

Omalaled

El cálculo está precisamente hecho de esa forma: asumiendo la aleatoriedad del voto. Cuando dices que unos tienen el voto “sesgado” al sí, ¿qué quieres decir? ¿que votarán sí? ¿o que tienen una probabilidad mayor del 50% de votar sí?

Sea como sea, ese sesgo debes cuantificarlo y entonces podremos hacer más cálculos.

La cuestión es que un 1,44% de probabilidades de que salga así está muy lejos del 0,033% que decía el matemático del tweet del principio.

ShevekShevek

Asumir la aleatoriedad del voto al 50% es una barbaridad. ¿O es que no te das cuenta? Es como asumir que cada votante va a tirar una moneda para elegir su voto. Y no es así: son personas que tienen sus ideas y que reaccionan con su voto a una opción ideológica, no aleatoria.

Cuando digo en mi modelo (tan válido como cualquier otro) que un votante tiene el voto 100% sesgado al “sí” estoy diciendo que votará “sí” seguro. Recíprocamente en el caso “no”.

Como ejercicio intelectual está muy bien todo ese desarrollo. Pero primero hay que advertir que el modelo de partida (voto individual aleatorio con probabilidad 1/2 y estadísticamente independiente de los demás) es absolutamente irreal. De lo contrario, nos encontraremos a los cuñaos de la derecha manipulando la información: “hay que ver, con un 1,44% de probabilidad y sale empate; seguro que está manipulado”.

Jesús M. LandartJesús M. Landart

Yo estoy muy de acuerdo con Shevek. Y creo que la hipótesis más falsa es la más crucial para todo esto: la asunción de independencia. Sin embargo, en cuanto nos movemos de las hipótesis simplificatorias que ha manejado Naukas, nos metemos en cálculos imposibles de manejar. Simplemente con asumir (que también sería mucho asumir) que hay una probabilidad o de emitir un SI, una probabilidad q de emitir un NO y una probabilidad 1-p-q de abstenerse, el problema se convierte en ingobernable. Y eso, aceptando que esas probabilidades sean las mismas para todos los electores, que esa es otra…

Y por encima de todo, la independencia. Los electores interactúan entre sí antes de las votaciones: no hay tal independencia.

No obstante, admitidas las hipótesis simplificatorias, el desarrollo binomial expuesto es claro y certero.

MaGaOMaGaO

“Asumir la aleatoriedad del voto al 50% es una barbaridad.”
No, no lo es. Es lo único que se puede hacer cuando no se tiene más información. Y, salvo que puedas proporcionar más información, el 1,44% aproximado que se obtiene aquí es mucho más razonable que el 0,03% propuesto inicialmente. Y ése es el objetivo de este artículo, no otro: explicar por qué el cálculo inicial es totalmente erróneo (algo evidente si se recuerda la combinatoria de instituto, por otro lado).
“Es como asumir que cada votante va a tirar una moneda para elegir su voto. Y no es así: son personas que tienen sus ideas y que reaccionan con su voto a una opción ideológica, no aleatoria.”
¿Sabes cuántas personas reaccionan en un sentido y cuántas reaccionan en sentido opuesto? No ¿verdad? Pues entonces _da igual_ (simplificando mucho, lo sé) que haya un 50% de personas que tiendan a votar en un sentido con p=0.6 y otro con p.04 o que todas voten en un sentido con p=0.5. Porque no hay información sobre la distribución de tendencias entre los votantes.
“Cuando digo en mi modelo (tan válido como cualquier otro) que un votante tiene el voto 100% sesgado al “sí” estoy diciendo que votará “sí” seguro. Recíprocamente en el caso “no”.”
Tu modelo no es “tan válido como cualquier otro”. Tu modelo hace unas suposiciones que tienen un margen de error mayor que la asunción de p=0.5. Y tienen un mayor margen de error porque sigues careciendo de información que justifique un modelo distinto al aleatorio.
“Como ejercicio intelectual está muy bien todo ese desarrollo. Pero primero hay que advertir que el modelo de partida (voto individual aleatorio con probabilidad 1/2 y estadísticamente independiente de los demás) es absolutamente irreal.”
Absolutamente irreales son todos, incluido el tuyo (que no has presentado, por cierto). Pero, relativamente, éste es menos irreal que muchos otros.
” De lo contrario, nos encontraremos a los cuñaos de la derecha manipulando la información: “hay que ver, con un 1,44% de probabilidad y sale empate; seguro que está manipulado”.”
Bah, las manipulaciones van a existir de todos modos. El que sabe estadística las detectará y el que no… bueno, al que no sabe estadística probablemente le darán igual.

manwemanwe

¿No sería mejor simplemente calcular cual es la probabilidad de un suceso concreto sin asumir nada respecto a la probabilidad de voto?

Daniel SanjurjoDaniel Sanjurjo

Creo que es mucho más sencillo que todo eso. Cada posible resultado real tendría la misma probabilidad a priori, así que está claro que el resultado siempre será uno con una probabilidad muy baja, pero >0. Si te pido que elijas un número entre 1 y 1 billón y eliges el siete, sería un poco rídículo que empezara a cuestionarte porqué has elegido ese número en lugar de otro, ya que el 7 solo tenía una probabilidad entre un billón de ser el elegido. La coincidencia está en si elegimos el número antes. Si lo señalamos después, es como dibujar dianas en torno a los tiros que hemos disparado contra la pared.
Eso considerando los números como salidos de una chistera (que es el razonamiento que ha hecho Mario Bilbao. Si tenemos en cuenta que se trata de la tercera votación sobre el mismo tema, eliminando las opciones menos votadas, viendo la evolución de los votos no parece un resultado tan imposible.
PD: la policía debería perseguir a los ganadores del gordo de navidad. Con tantas probabilidades en contra es mucho más factible que lo hayan conseguido haciendo trampas que por el sorteo puro.

GusGus

Deveriais empezar por informaros de que votaciones y como se hicieron. No votaron blanco o negro en primera ronda. Los votos que fueron cambiando en la segunda y tercera ronda son un 10% ya que las opciones blanco y negro se mantuvieron y los poquitos votos de rosa y amarillo tuvieron q cambiarlo por blanco y negro. Asi que el empate fue por unos pocos votos no por tres mil.

Manuel Vilches PachecoManuel Vilches Pacheco

Otro post que comete el mismo error y también faltando al respeto a una persona que dice algo muy razonable, solo por sus ideas políticas. Es inadmisible que un debate científico se plantee en esos términos (que no he advertido solo aquí).

Estas asumiendo binomial equiprobable y eso SÍ es un error.

Puedes verlo como ¿cual es la probabilidad de sacar 3030 bolitas de una bolsa de bolitas blancas y negras y que obtengas 1015 y 1015?… claaaaaro, depende de cuantas haya de cada color en la bolsa (p de binomial). Para estimar con esa info el resultado tienes que promediar sobre todos los valores de p entre 0 y 1. Resultado?… ¡tachán! 1/3031 (3031 resultados posibles, no importa el orden, y solo 1 favorable).

Si tienes info sobre la distribución en la bolsa (no te digo saber p, que no lo sabes ni con las votaciones previas) puedes restringir el intervalo de promedio para hacer una estimación con mayor probabilidad, pero aun así, si calculas a priori, deberás tener en cuenta la probabilidad de que p se restrinja a ese intervalo de valores (a,b) que en general será (b-a)/(1-0). Puedes hacer hipótesis “sociales” sobre la distribución y aumentar la probabilidad a priori, pero eso es harina de otro cantar, no matemáticas, y hay gustos para todo, desde quien dice que debe ser cercano a p=0.5 porque por eso se plantea consulta, hasta quien dice que cercano a los extremos pues por eso son todos de la misma ideología. Imposible decidir, la mejor opción es la de Mario Bilbao, o al menos más razonable que p=0.5 en cualquiera de sus versiones.

Pero si aun así dudas, pregúntate ¿cuantos empates en votaciones de 3000 personas han visto tus ojos? Algo así (pero no del todo correcto) ha hecho @kikollan (he criticado en twitter) para obtener una estimación de 1/300. Su cálculo es erróneo pues considera habitantes, no votantes, y calcula con un solo caso de empate, lo cual tiene muuuucha incertidumbre en la estimación.

En fin. Lo cierto es que todo este “lío” surge en respuesta a un comentario, que no es ningún disparate ni mucho menos, de un hombre de ciencia cuyo único pecado es ser militante del PP ¡y decirlo! Este comportamiento sectario no es de recibo en gente de ciencias, os pongáis como os pongáis, y lo que procede es disculparse con esa persona, que ha mostrado una elegancia infinita soportando la burla de forma, en mi subjetiva opinión, muy paciente.

Manuel Vilches PachecoManuel Vilches Pacheco

Sin más información, sí, por supuesto. Ten en cuenta que no sabes como están distribuidas las bolas del canasto de donde las sacas. El canasto puede, con igual probabilidad a priori, ser de todas negras. O de todas blancas. O todas menos 1 etc…Esto hace que todas las distribuciones de bolas, independientes del orden, sean igualmente probables, por lo que habrá cinco resultados igualmente probables: 4 blancas, 3 blancas, 2 blancas, 1 blanca, ninguna blanca y solo 1 es empate. Ahora puedes hacer hipótesis sobre como deben estar distribuidas las bolas en el canasto… pero ¿mitad blancas y mitad negras? ¿donde lo dice? ¿con qué argumento? Eso no es mínima información, eso es imponer el empate de partida y ¡anda! sale que empatan.

Manuel Vilches PachecoManuel Vilches Pacheco

Lo cierto es que tú mismo habrás experimentado en tu vida más acuerdos por unanimidad que empates, y por supuesto más “no empates” muuuuchos más no empates, que empates, y no 70 veces más (como tirando monedas), no, muuuuuuuchos más no empates.

MaGaOMaGaO

“Sin más información, sí, por supuesto.”
Por supuesto que _no_. Si no tienes información debes considerar que, en cada extracción, la probabilidad de extraer una bola blanca es 0.5.
” Ten en cuenta que no sabes como están distribuidas las bolas del canasto de donde las sacas.”
Y, precisamente por eso, tu cálculo es erróneo. Esto es combinatoria de instituto.
” El canasto puede, con igual probabilidad a priori, ser de todas negras. O de todas blancas. O todas menos 1 etc…”
AQUÍ está tu error. Siendo cuatro bolas, las variaciones son las siguientes:
BBBB, BBBN, BBNB, BBNN,
BNBB, BNBN, BNNB, BNNN,
NBBB, NBBN, NBNB, NBNN,
NNBB, NNBN, NNNB, NNNN
Ahora juntamos las variaciones correspondientes a la misma combinación y…
-0 bolas blancas: 1
-1 bola blanca: 4
-2 bolas blancas: 6
-3 bolas blancas: 4
-4 bolas blancas: 1
“Esto hace que todas las distribuciones de bolas, independientes del orden, sean igualmente probables, por lo que habrá cinco resultados igualmente probables: 4 blancas, 3 blancas, 2 blancas, 1 blanca, ninguna blanca y solo 1 es empate.”
Ver más arriba por qué esto es erróneo.
” Ahora puedes hacer hipótesis sobre como deben estar distribuidas las bolas en el canasto… pero ¿mitad blancas y mitad negras? ¿donde lo dice? ¿con qué argumento? Eso no es mínima información, eso es imponer el empate de partida y ¡anda! sale que empatan.”
El problema es que has entendido mal el cálculo. No se supone que hay un número igual de blancas y negras sino que la probabilidad de que cada bola sea blanca es del 50%. Justo lo que corresponde a una situación en la que no se tiene una estimación fiable de la probabilidad real.
Ahora bien, si puedes proporcionar una información fiable de la probabilidad de votar en un sentido u otro (aunque, como ya se ha indicado, tampoco servirá de mucho porque la votación no se hizo a una vuelta) podemos hacer los cálculos de nuevo.

Manuel Vilches PachecoManuel Vilches Pacheco

por supuesto, los acuerdos por unanimidad son también resultados improbables, el hecho de que aparezcan con cierta frecuencia es debido a las dinámicas sociales de grupo, o de las propias reglas de juego en las relaciones, pero eso es salirnos de la estadística matemática.

DarylDaryl

Lo que es extraordinario es la precisión de los votantes. Más de 3000 votantes Y NI UN SOLO ERROR. Ni un voto en blanco, ni un voto nulo, ni una sola equivocación. O dado el resultado tambien coincidieron las equivocaciones en ambos sentidos compensándose entre ellas. En este caso otra coincidencia maravillosa

Siempre, en toda votación entre humanos, hay alguien que no se entera, que se despista, que marca o mete la papeleta que no debe y aqui de forma quirurgica al final quedaron pares y ni uno se equivocó.

Auténticas máquinas de precisión deben ser estos votantes y además son como los Sith de la guerra de las galaxias o la guardia civil. Siempre van en pareja. Aunque hicieron tres votaciones, con un número diferente de participantes en cada una, este número siempre era par.

carloscarlos

En la ultima votación no se tuvieron en cuenta ni los votos nulos ni las abstenciones ni los votos en blanco aun a pesar de que éstos existieron para que formalmente entre el sí y el no sumaran el 100%

Txema M.Txema M.

Ni un sólo error que provocara voto nulo ni una sola abstención o voto en blanco A LA TERCERA VOTACIÓN. En las otras sí que se dieron. Poniendo por caso que hubiera algún cazurro que metiera la pata dos veces antes, para la tercera tuvo tiempo de aprender.
Daniel Sanjurjo hace el comentario que me parece más comprensible y clarificador para gente como yo, que no domino las matemáticas. Nada más leer el titular pensé: “¡Coño! ¿Y cuál era la posibilidad de que sacaran cualquier otro resultado?” Me imagino que la posibilidad de que todos votaran lo mismo y la del empate probablemente sean iguales. Tal vez me equivoco, pero así me lo parece a primera vista.
Creo que quien se mosquea piensa que sólo había tres posibilidades, dos reales (Sí y No) y una increíble (el empate). Desde luego, tanto el sí como el no tenían más posibilidades de salir, pero mira tú por dónde salió el sol por donde menos se le esperaba.

damk3rdamk3r

Poca información tienes para escribir tanto. En fin, otros ya te han corregido directamente y si te lees otros comentarios, el resto.

Que te disgusten las CUP es una cosa, conspiranoias absurdas otra.

josemijosemi

Unos comentarios respecto al calculo en si.

Al contrario que otras cosas en probabilidad, la distribución binomial tiene una formula con la que podemos hacer el calculo exacto

http://www.mathnstuff.com/math/spoke.../binom1.gif

Donde n=3030, p=0.5 y x=1515

El problema de aplicar esta formula es que en un caso como este hay que calcular el factorial de 3030, que es un numero de 9000 cifras. Por otro lado, 0.5 elevado a 1515 es un numero realmente minúsculo. Sabemos que el producto de los números enormes con los números diminutos milagrosamente va a dar un resultado siempre entre 0 y 1 (es una probabilidad), pero es difícil de calcular.
Es decir, la formula era conocida desde hace lustros pero era poco aplicable, aunque la solución “esta ahí”, no nos sirve. Pero para aplicaciones de ingeniería, es necesario sacar de alguna forma un valor. Cuando había que hacer los cálculos a mano y la formula no era muy útil, se usaban aproximaciones.
Omaled ha usado el método tradicional, el único posible en la practica hasta hace unos años. Si los números eran pequeños, se podía usar tablas (había gente que pasaba su vida entera escribiendo libros de tablas matemáticas). Si los números son grandes, se aproxima a una normal, y se usan las tablas de la normal, con lo que se obtiene un resultado suficientemente exacto en la practica.

Pero resulta que ahora todos tenemos en las manos un supercomputador ¿no se puede hacer mejor? Pues si, ahora se puede calcular el resultado exacto matematicamente.

Usando un lenguaje tipo Java o C la cosa esta fastidiada, ya que sus numeros estan muy limitados, pero usando algo mas orientado a matematicas es perfectamente posible. Solo necesitamos 2 elementos magicos:
1) Aritmetica de precision arbitraria
2) Manejo de fracciones

Ambos elementos los tenemos en pyton, asi que es bastante facil traducir la formula y hacer directamente el calculo

from math import factorial as f
from fractions import Fraction

x = 1515
n = 3030
p = Fraction(1,2) # probabilidad 1/2

comb = Fraction(f(n)//f(x),f(n-x))
resp = comb * (p**x) * ((1-p)**(n-x))
print (resp.numerator,"\n---------------------\n",resp.denominator)
print (round(float(resp) * 100,4),"%")

El primer numero que sacamos es la respuesta exacta. Es una fraccion con números muy grandes tanto en el numerador como en el denominador.
El segundo número es una aproximación de la fracción de arriba, que da mas o menos lo mismo que el método tradicional.
Este calculo que hemos hecho y que era imposible para generaciones anteriores tarda décimas de segundo incluso en un móvil.

dani

No es más fácil pensar que estaba preparado desde el principio para que empataran y que les indicaran lo que tenían que votar mediante la acreditación que llevaban al cuello, por ejemplo?
Este proceso parece promovido más por niños que por gente adulta.

MaGaOMaGaO

Para todo problema hay una solución rápida, elegante… e incorrecta.
Sí, es más fácil pensar así. Pero la realidad no es “fácil”.

dani

Pero es que soy un pelín conspiranoico con estas cosas, sobretodo cuando faltaron 2, uno de ellos Manuel Delgado y otro que estaba en andalucia. Y el tercero que no votó, se fue pensando que no iría de un voto. Esto pasa en la derecha y estamos discutiendo si el Club Bildergerg o los Rotary en vez de probabilidades. Paranoias mias.

AlbertoAlberto

Hombre, creo que este modelo binomial no es muy aplicable. ¿Cuál es la probabilidad de que hubiera habido un resultado unánime? Con este modelo me imagino que casi imposible. Y en la realidad no es así.

Manuel Vilches PachecoManuel Vilches Pacheco

Intentaré hacer un resumen:

Tenemos dos alternativas extremas:

1. – asumir que p (probabilidad de votar si/no) toma valor 0.5 ¡exactamente! (esto es, votar es lanzar una moneda), y entonces P(empate)=1.4%, o

2.- Asumimos que p toma cualquier valor entre 0 y 1 (esto es, no sabemos a priori como se distribuye el voto entre si o no), entonces cualquier resultado final es igualmente posible y P(empate) = 1/3031.

Entre estas “hipótesis extremas” (p=valor exacto 0.5, o p absolutamente desconocido) está la realidad, con una distribución a priori de p que no será ni lanzar una moneda, ni absoluto caos. Pero salvo para distribuciones de p que se encuentren muy restringidas y muy próximas a 0.5, el empate resulta muy improbable (por supuesto más cuanto más ancha asumamos la distribución de p). Si asumimos por ejemplo que p puede ser cualquier valor en el intervalo entre 0.4 y 0.6 (lo cual no me parece nada restrictivo), la probabilidad de empate cae por debajo de 0.2%. Si tomamos entre 0.25 y 0.75, la probabilidad de empate baja a 0.06%

Manuel Vilches PachecoManuel Vilches Pacheco

El valor 1.4 % correspondiente a p=0.5 es el valor máximo de la probabilidad de empatar (salvo, claro, confabulaciones) y corresponde al caso en que la opinión SI/NO está completamente igualada (lo cual es una circunstancia muy particular… e improbable). En cambio, el valor 1/3031 NO es el valor mínimo de la probabilidad de empatar, pues hay distribuciones para las que la probabilidad de empatar es directamente cero o prácticamente cero.

Espero que el autor considere estas observaciones honorables en su subjetiva opinión.

omalaled

Pues no. El autor considera que en una votación de sí o no, sin tener otra información, lo más lógico es dar una probabilidad de 50% para el sí y lo mismo para el no. Así es como se ha planteado el problema y así es como sale el 1,44%. Así funciona la estadística.

No se puede resolver un problema en el que no tienes esa probabilidad que asumimos que es 0,5. Si fuera SI/NO/BLANCO asumiría que cada una de ellas tiene una probabilidad de 1/3; aunque no podria aplicarse entonces la binomial y tendría que hacerse de otro modo.

El problema es equivalente a tirar una moneda 3030 veces. Se ha explicado en el artículo y es la opción más razonable sin tener otra información.

En mi subjetiva opinión :-)

Manuel VilchesManuel Vilches

Bueno, Omamaled. Debo suponer que ya estás más o menos dándote cuenta de tu error. Ante cualquier duda puedes ir al segundo post de Galli https://gallir.wordpress.com/2015/12...mment-30180 y leer allí como, ahora, sí reconoce que “Como no tenemos nada de información previa, la P(A) (o la probabilidad de que haya tantas rojas como azules) es igual a 1/3030 = 0.00033 (aquí sí usamos, correctamente, el principio de indiferencia para Bayes, idéntica probabilidad para las diferentes proporciones posibles).”

La cuestión es que la pregunta a la que el profesor Bilbao respondía es “¿cual era la probabilidad de que el empate se diera… ¡antes de que se diera!??” por supuesto, probabilidad a priori, que es la que realmente lo que nos chocó a todos, mientras que este cálculo tuyo reponde a otra pregunta distinta “¿cual es la probabilidad de que el empate se de… cuando ya se ha dado una vez?”.

Así, con el resultado de la votación, como “primera muestra” (información) estimas p=0.5, ¡no sin información!, con esa información que antes no tenías.

Pero ¿Podemos usar esa información o la “ronda previa”? pues claramente esa no (si tuviéramos otra, procedente de algún tipo de muestreo anterior, una encuesta, un conocimiento de la población etc, tal vez), dado que nos preguntamos por la probabilidad a priori, pero en cualquier caso es esa información la que se pone en duda.

Cuando ocurre algo que sospechamos no ha sido fortuito, no podemos preguntarnos cual es la probabilidad de que ocurra… una vez que ha ocurrido aceptando que ha ocurrido de forma fortuita, pues esa observación única, de ser aceptada, sesgará nuestra evaluación hacia que la mísma no solo es posible, sino máximamente posible.

Esto es lo que deberías, siendo honesto, reconocer sin más para restablecer la honorabilidad (matemática, no la política que ni me va ni me viene aquí) de este profesor de Universidad que a nadie faltó, y de paso, contribuir a la credibilidad de nuestro sistema educativo: El profesor calculó correctamente la probabilidad de que un empate se de en ausencia de información. Basta leer los comentarios en tu post, tu primer post, o las muchas columnas periodísticas relacionadas para entender que en todo momento se hablaba y hablábais de eso cometiendo el error de que “como no tengo info asumo que la probabilidad de sí es igual a la de no” lo cual es ya tener mucha, demasiada información que no tenías antes de que la votación se produjera (y por favor, no sigas con lo de las rondas previas, hablamos de antes de que ocurrieran)

Manuel VilchesManuel Vilches

perdona, para no tener que escribirlo otra vez copie y pegué el comentario que he hecho en el post de Galli, y se me ha colado una referencia a su primer y segundo post. Lo siento.

damk3rdamk3r

Es que la opinión SI/NO está muy igualada. Las CUP són anticapitalistas e independentistas a partes iguales. Y aquí se votaba si poner a la cabeza de la independencia a un capitalista.

Lo cual, en tus palabras, es una circunstancia muy particular.

Ademas ya se puede ver en votaciones anteriores. Así que de circumstancia improbable nada de nada.

El problema esta mal planteado desde el principio ya que de ningún modo hay aleatoriedad en la votación y asumirlo es abusrdo ya que es el único dato que se tiene en cuenta.

Y más aun tu interpretación. La cual da la misma probabilidad para cualquier resultado en concreto, ergo no sirve para analizar nada.

Simplemente no tiene sentido intentar calcular las probabilidades de una votación.

Manuel VilchesManuel Vilches

Ya lo has entendido. Haces lo que yo refería como estimaciones basadas en aegumentos sociales y me parece biem. Pero debe quedar claro: Tu dices p=0.5 no porque no tengas información sino porque sí la tienes. Supongo que tienes amigos de la cup y yo me alegro pues deben ser gente muy divertida, de hecho tengo por mi historia personal, estudié en valencia, muchos y buenos amigos de ese espectro político, y por ese conocimiento puedes hacer esa estimación. Pero el profesor Bilbao, cuya defensa es mi principal motivación aunque no le conozco de nada ni soy del pp sino simplemente porque creo que en el debate científico no es admisible la ofensa personal, no creo que tenga muchos amigos de la cup. Y aunque los tuviera lo que se pretende calcular es la probabilidad de que ocurra sin información previa y menos asignando un valor exacto p=0.5 sin incertidumbre alguna.

jddlopejddlope

Buenos días. Sin entrar en disquisiciones sobre la aleatoriedad de cada voto, me voy a centrar únicamente en el aspecto matemático, otorgando, por tanto equiprobabilidad a cada opción, a falta de mayor información.
En este sentido, creo que los cálculos que se han hecho son erróneos, y que el matemático del que habla el artículo no andaba muy desencaminado. Ahí van mis argumentos.
Este es un problema sencillo en el que basta con contar. Hay tres posibilidades en cada voto: Si (S), No (N) – a los que llamaré votos válidos – e Inválido (I) (abstención, voto nulo, voto blanco). Las diferencias entre los distintos tipos de votos I la consideraré no significativa para el problema entre manos. El voto I puede ir desde 0 hasta 3030. Para cada una de estas posibilidades, el resto de votos serán válidos y se repartirán entre el S y el N. Por ejemplo, con 0 votos I, habrá 3030 válidos y esto implica 3031 posibilidades distintas, que van desde 3030 S y 0 N, hasta 0 S y 3030 N. de estas 3031 posibilidades, sólo 1 de ellas es empate: 1515 S y 1515 N. Con 1 voto I y 3029 votos válidos, no hay ninguna posibilidad de empate. Y así hasta llegar a 3028 votos I y 2 votos válidos, lo que da un posibilidad de empate entre 3 (2 votos S, o dos votos N o un voto de cada), y después 3029 votos I y uno válido, en que de nuevo no caben los empates y, finalmente, los 3030 votos I, que se puede considerar como un empate.
En definitiva, llamando n al número de votos válidos, tendremos 1 empate de entre n+1 posibilidades si n es par, o 0 empates de entre n+1 posibilidades, si n es impar.
Ahora solo resta sumar todos estos posibles casos. El total de casos sería la suma de la progresión aritmética A(n) = 2 + (n-1) desde n = 1 hasta n = 3030, más 1. El total de los casos favorables, sería el número de términos impares de esta progresión entre esos dos valores de n, más 1. En definitiva, la probabilidad de un empate sería P = (1515+1)/(2+3+…+3031+1) = 1516/((3030*((2+3031)/2)+1) = 1516/(1515*3033+1) = 0.033%.

Manuel VilchesManuel Vilches

El autor y otros muchos lo que dicen es: como no tengo información voy a suponer que empatan… anda mira, el empate es lo más probable. Para “no tener” información tu sesgo hacia el empate es considerable. De hecho es máximo. Si no tienes información no puede otorgar ninguna distribución al prior al la proporciones si/no.

omalaled

A ver, Manuel. Este artículo es un artículo matemático. Nada tiene que ver con la política. Es cierto que se deriva de una situación política, pero es un problema matemático. Cierto bloguero que se define matemático y otra cosa afirmó que la probabilidad de empate es 0,00033014, basando el cálculo en 1/n-1; por lo que era IMPOSIBLE.

Ese hombre tenía la misma información que yo (al menos, nada dice más en el tweet) y yo afirmo que si fuera un suceso en votaciones aleatorias no sería 0,00033014, sino 0,0144; con lo que ese matemático se equivocaba en 2 órdenes de magnitud. Que me discutas si ese1,44% es mucho o poco, no tengo nada que decir; pero la matemática del problema es la que es, con sus suposiciones y sus consecuencias.

¿Que no aceptas las suposiciones? Bien, pon las tuyas y cuantifícalas. Pero el problema planteado por el señor del tweet y su solución es incorrecta. Por lo menos, en un examen de estadística suspendería.

Manuel VilchesManuel Vilches

Ni Omalaled, suspenderá tú. En ausencia de información pública no puede considerarse 0.5 sino cualquier valor entre 0 y 1. Hay que calcular probabilidad de empate en cada situación y promediar. Puedes hacer hipótesis razonadas sobre distribución p, nunca valo exacto, haverlo no es no tener información, es tener muuuucha información, informó de infinita precisión . 1.44% es el valor máximo posible de la probabilidad de empate y nunca puede ser el mejor estimador a menos que sepas p es 0.5

Manuel VilchesManuel Vilches

El auto corrector. En ausencia de información p no puede considerarse 0.5

Manuel VilchesManuel Vilches

Joe. Respondo luego desde el ordenador sin auto corrector.

Información de infinita precisión quería decir

0 (0 Votos)
GuillermoGuillermo

Escriban en wolframalpha.com binomial distribution n = 3030 x = 1515 p= 1/2 y recibirán el resultado 0.016 o 1.6%. De hecho es el resultado individual más probable cuando p = 1/2, por eso el resultado es de probabilidad baja pero no muy baja. p = 1/2 es la opción bayesiana más lógica cuando no hay información previa, en este caso la había, la votación previa, y era un valor próximo a p= 1/2. Este es un problema típico de los que se ponen en asignaturas de introducción a la probabilidad. Lo más llamativo es las elucubraciones de sesudos analistas políticos sobre la rareza del resultado. Pues no lo es.

Manuel VilchesManuel Vilches

No tengo ninguna duda de que a estas alturas el autor del blog ya tiene absolutamente claro el error cometido desde el principio y es una cuestión urgente de honestidad intelectual que intervenga para poner fin a la cantinela (no puedo ya darle otro nombre) de que “en ausencia de información debemos asumir que p=0.5″. Por favor, es un tremendo error conceptual que ya ha sido reconocido (aunque de forma sibilinamente disimulada) por los principales defensores de la afirmación.

En ausencia de información no podemos asignar un valor determinado al valor de p en la población, y la probabilidad de empate debe calcularse promediando en todas las situaciones (valores de p) posibles, es decir, con p variando en el intervalo (0,1). Asignar p=0.5 no es solo tener información, es tener muuuucha información a favor del empate, es como afirmar: supongamos que lo más probable es empatar ¿cual será la probabilidad de empatar? ¡anda, el empate es lo más probable! jooooo…r, ¡si lo has establecido como premisa de partida!

No podemos tener en cuenta la info previa por dos razones:

1º, porque la pregunta es ¿que probabilidad había de que empataran… antes de que empataran? probabilidad a priori

2º porque es precisamente ese resultado del que se duda. Si por ejemplo hubieran sido todo “si”, y alguien preguntara ¿que probabilida había de que todo fueran si? no podemos considerar ese resultado previo, pues en cuyo caso solo podremos afirma que p (si) toma valor 1 o cercano a 1 y la probabilidad del resultado (todos si) será muy alta. Cuando dudamos de que una observación sea estadísticamente verosímil no podemos calcular su probabilidad de ocurrencia teniendo en cuenta que ya ha ocurrido, pues actuando así sesgamos el análisis aumentando la probabilidad de que ocurra.

si el autor del post está realmente comprometido con la divulgación de las matemáticas y la ciencia debería aclarar de una vez que en ausencia de información p no toma valor 0.5, sino cualquier valor entre 0 y 1.

.

GuillermoGuillermo

En ausencia de información puede tomar cualquier valor entre 0 y 1 con igual probabilidad, es decir una distribución uniforme cuya media es 1/2.
Realmente sí había información, en la votación previa el resultado fue p casi 0.5, puedes repetir el cálculo de la binomial con p= 0.51 ( no se el valor exacto pero se conoce).

omalaled

Hola Guillermo.

En este enace puedes comprobarlo tú mismo. Para n=3030, p=0.5 sale el 1,45%. Si cambiamos a p=0.51 sale un 0.8%.

Un mínimo cambio en esta probabilidad hace que salgan más síes que no noes y, por tanto, el empate es mucho más improbable. Y es así porque n=3030 es un número muy grande. Si haces el cálculo para n=4 verás que se mueve poco (pero se mueve).

GuillermoGuillermo

Estoy de acuero. En wolframalpha.com (binomial distribution n= 3030 x = 1515 p = 0.5 o 0.51) que hace el cálculo exacto salen los resultados que dices 1.449% y 0.8%. Se trata de valores bajos, pero no extremadamente raros. Naturalmente estamos asumiendo la probabilidad a priori, es decir que se diese un empate antes de que se produjese.

Omalaled

Guillermo, no es exacto lo que dices. Al menos no lo interpreto así. Permíteme puntualizarlo. No estás asumiendo el resultado, sino calculándolo. Preguntamos ¿cuál es la probabilidad de empate si bla bla bla y p=0.5? Estamos imponiendo (eso sí) que la probabilidad de voto SI/NO es 0.5; pero no asumimos que se dé el empate: es lo que esamos calculando.

Sería como preguntar, si tiramos una moneda (no trucada) al aire 3030 veces, ¿cuál es la probabilidad de 1515 caras y 1515 cruces? Lo único que impones es que la probabilidad de cara (y cruz) es 0.5 y calculas que salgan 1515 de cada; pero no “que se dé un empate antes de que se produzca”. El cálculo es tan válido tanto antes como después, sea el resultado que sea.

Creo que me entiendes, ¿no?

0 (0 Votos)
Manuel VilchesManuel Vilches

No. Esa media no aplica pues los casos con sesgo arriba p mayor que 0.5 no se compensan con los p menores 0.5 pues ambos juegan por igual contra el empate.

GuillermoGuillermo

Manuel, lo que indica Omalated es lo el cálculo estándar bayesiana dice. Si tienes en cuenta la penúltima votación el resultado es 0.8% que no es un caso extremadamente raro.

omalaled

Manuel: no estoy de acuerdo contigo y sigo pensando que lo que he escrito en el artículo es lo correcto. Lo de que tengo claro que he cometido un error o que tenga “falta de honestidad” es una opinión tuya que no me voy a entretener ni en comentar.

Ahí quedan tus comentarios para quien los quiera leer y decida por sí mismo.

GuillermoGuillermo

Le he planteado el problema de cuyos conocimientos en esta materia confío totalmente . Os resumo lo que me dice:

Planteamiento del problema: En una votación de la CUP en la que había dos opciones Si (apoyar a MAS como president) o NO (no apoyarlo) el resultado final ha sido : de 3030 votantes 1515 han votado SI y 1515 NO.

Supongamos que todavía no se ha producido la votación y nos planteamos calcular la probabilidad de que se produzca un empate. El problema puede afrontarse de las siguiente manera :

A) Si suponemos que no sabemos nada de lo que puede ocurrir y todo resultado es igualmente probable, entonces la probabilidad media sería: 0.0329924 %
(el cálculo con Mathematica se hace como sigue: NIntegrate[PDF[BinomialDistribution[3030, p], 1515], {p, 0, 1}]*100 “%”
= 0.0329924 %)

B) Si admitimos que la proporción estará en torno al 50 % con un error posible de +/- 20 % entonces la probabilidad media estaría en torno a 0.131082 %
(el cálculo con Mathematica se hace como sigue:
NIntegrate[PDF[NormalDistribution[1/2, 0.1], p]*
PDF[BinomialDistribution[3030, p], 1515], {p, 0, 1}]*100 “%” = 0.131082 %)

[las siguientes asunciones me advierte que son muy fuertes]

C) Suponemos que cada votante tiene exactamente la misma probabilidad de votar Si o NO, es decir: tomamos p= 1/2: en este caso escriban en wolframalpha.com “binomial distribution n = 3030 x = 1515 p= 1/2″ y recibirán el resultado 0.015 o 1.5 %.

D) Conocemos el resultado de la votación previa y en el 0.51 % apoyaron opciones en contra de la investidura de MAS, tomamos p = 0.49 En este caso la solución es : Escriban en wolframalpha.com : “binomial distribution n = 3030 x = 1515 p= 0.49″ y recibirán el resultado 0.008 o 0.8 %.(cercana a la que que si participan en un sorteo con 100 numero y compran 1 les toque)

Bajo las hipótesis que barajamos, todas muy razonables, lo que sí es cierto es que este resultado, el empate, es de los más probables (el más probable si se supone que la proporción estará en torno al 50 %). Cada resultado particular, aunque parezca menos raro, sigue teniendo una probabilidad de ese orden o mucho menor, y alguno tiene que salir.

Manuel VilchesManuel Vilches

Totalmente de acuerdo (aunque no estoy reproduciendo los cálculos de las hipótesis intermedias doy por hecho que tus cálculos son correctos, pero sin duda tus planteamientos lo son.

Por tanto, creo que estamos ya de acuerdo: EN AUSENCIA DE INFORMACIÓN LA RESPUESTA DEL PROFESOR BILBAO ES LA MEJOR ESTIMACIÓN DE LA PROBABILIDAD DE EMPATAR, LA CUAL ES UN IMPROBABLE 0.03%.

Es importante sacar a la audiencia del error de que “en ausencia de información debemos asumir que p=0.5 y que la probabilidad de votar si es igual a la de votar no”

Si asumimos esa igualdad estaríamos diciendo: ¿cual es la probabilidad de empatar si asumimos que el resultado más probable es el empate a 1515 (p=0.5)?

Espero que ya haya quedado definitivamente claro.

GuillermoGuillermo

También debe quedar claro en ausencia de información el empate es el resultado más probable comparado con cualquier evento unico. Es decir es mas probable 1315 Si que 1314, y mucho mas probable que 100 Si. Obviamente si se compara el empate con que se de otro resultado es más probable cualquier otro resultado (1-0.0003), pero una probabilidad de 0.03% es baja pero no remotamente baja, además en vista de que si teníamos información previa y era próxima a 1/2 la probabilidad era mayor, de hecho después de meditar sobre el asunto la hipótesis más razonable es la b, en la que quizás seria bueno suponer un error menor del 20% en cuyo caso la probabilidad de empate aumenta. Con esto no aseguró que haya habido un apañó, pero si que hay sucesos más improbables que se dan rutinariamente. Y olvidemos el tema de honestidad, honradez, de la que estoy seguro que el autor del post y los que hemos escrito tenemos.

Manuel VilchesManuel Vilches

No, Guillermo, no puedes decir que la probabilidad es 0.033 y que es el resultado más probable, pues en ese caso todos los resultados tienen la misma probabilidad, 0.033. El empate solo es el resultado más probable si asumimos que p sigue una distribución centrada, lo cual es obvio, pues eso significa una p centrada, que las alternativas están igualmente ponderadas y por tanto el empate es lo más probable.

Pero llevas sin duda razón en una cosa, mi comentario sobre la honestidad está fuera completamente de lugar, y aquí os pido a todos y especialmente a Omalaled disculpas por haberlo hecho. Ni siquiera los comentarios ridiculizando mis conocimientos pueden justificarlo. Os pido de nuevo perdón por ello, y como diría Juancar I: “no volverá a pasar”

Manuel VilchesManuel Vilches

Han sido días de indignación con los comentarios despectivos recibidos, especialmente dirigidos al profesor Bilbao, al que, repito, no conozco y con el que no guardo relación personal de ningún tipo.

Yo no simpatizo con la CUP, aquí lo digo para que se sepa, pero de mi análisis matemático, correcto y objetivo, nadie puede deducirlo.

El suceso tenía una probabilidad muy baja de ocurrir (0.03% empate, 99.97% no empate, 3000 a 1)

La “info previa” insisto, al menos la de la asamblea, no puede utilizarse, pues es su carácter “fortuito” el que está puesto en duda y debe evaluarse la probabilidad de que ocurra con la info previa. Podemos hacer el paso medio de la primera votación, pero entonces sera ese casi-empate el que debe ser evaluado con ausencia de información, y recuperaremos el 1/3030.

Espero que esto termine de aclarar el asunto.

0 (0 Votos)
Manuel VilchesManuel Vilches

Me refiero a que es obvio que si p está centrada, el empate es lo más probable, no a que sea obvio que p debe estar centrada, pues por muy obvio que esto pueda parecer (nunca p=0.5, solo p centrada) no era la cuestión planteada, que era “probabilidad de empatar, en ausencia de información”, es decir, antes de conocer o estimar el resultado. Podemos aceptar hipótesis de centralidad basadas en conocimiento de la población, pero no podemos decir que p=0.5 en ausencia de información, solo manejando determinada y muy concreta información podemos decir que p es centrada, y solo con una información infinitamente precisa (sin incertidumbre) podemos decir p=0.5.

GuillermoGuillermo

Creo que estamos diciendo lo mismo bajo distintas asunciones. La a) es académicamente correcta en ausencia de información, que no es el caso. En mi respuesta me refiero a la hipotesis de que no está manipulado el resultado, y las votaciones previas muestran que p es próximo a 1/2, —con los datos reales, que no conozco, creó que están cerca de p,= 0.49– como en varias votaciones daban cerca de este valor es una p con una incertidumbre pequeña, en el caso extremo cero y estaríamos en los casos b o c. En esas condicines el resultado no es tan raro. Por mi parte el tema está suficientemente debatido.

Manuel VilchesManuel Vilches

El evento aleatorio cuya probabilidad hemos de establecer es que 3030 electores elegidos para ir a votar queden exactamente repartidos entre sí y no. Sólo información previa sobre la población puedo ayudarnos a evaluar cuan probable era el empate. Yo no la tengo. Supongo que alguien que conozca las interioridades ideológicas de la CUP sí, pero aún así decir que el intervalo de p sería 0.49 0.51 es afinar demasiado. De hecho la probabilidad de que, observado un empate p No valga 0.5 o ni siquiera esté en intervalo .49 .51 está lejos de ser pequeña.
Pero creo que el asunto está ya más que aclarado. La respuesta del profesor Bilbao era, como dices, correcta y no mereció las descalificaciones recibidas, que lo fueron por sus ideas políticas como prueba el arranque de este post.

GuillermoGuillermo

Prometo que es mi última respuesta:

El profesor de Bilbao (o lo que dicen que ha dicho), da una probabilidad de empate asumiendo ningún conocimiento previo de
1/3029
Esto no es correcto. Lo correcto es 1/3031.

Eventos posibles 3031: {3030 SI -0 No,….,0 Si – 3030 No]
En general: 1/(n+1)

Esto puede demostrarse en Mathematica que da la solución analítica exacta haciendo:

Integrate[PDF[BinomialDistribution[n, p], n/2], {p, 0, 1}] que 1/(n+1) para n>= 0.

Buen año y hasta otra.

Manuel VilchesManuel Vilches

Corrigió ese desliz en minutos. Pero siguieron descalificándole

David

Y se sigue erre que erre con que la ausencia de informacion se representa con un p = 0.5 en este caso? A ver, copio de la wikipedia a ver si queda mas claro:

“In probability theory and statistics, the beta-binomial distribution is a family of discrete probability distributions on a finite support of non-negative integers arising when the probability of success in each of a fixed or known number of Bernoulli trials is either unknown or random. ”

Palabra clave, _unknown_. Cuando no sabemos nada acerca de p, que en este caso representa nuestro conocimiento sobre la votacion, usamos un prior no informativo, que suele ser el uniforme B(1, 1). Otra cosa totalmente distinta es que tengamos informacion que favorezca ciertos valores de p, en cuyo caso usaremos un prior que represente ese conocimiento.

Si no queda claro, consideremos la informacion minima consistente con el problema.

Tenemos una votacion. Las votaciones pueden salir de muchas maneras, victorias abrumadores, empates etc. SI no sabemos nada acerca de la votacion, no podemos favorecer ningun tipo de estas votaciones por encima de otras. Si asignamos mas masa a determinado valor de p, es porque estamos considerando que la votacion se parecer mas a un tipo que a otro.

Parece que la blogosfera española no esta familiarizada con la probabilidad bayesiana como mecanismo para tratar informacion previa, incluido el dificil problema de representar la ignorancia.

GuillermoGuillermo

David, al menos yo he presentado varios casos, en el caso de ausencia total estoy de acuerdo contigo y el resultado es 1/3031 (ver mi respuesta anterior=,
Pero sí habia información previa y eso son los otros casos considerados

David

De acuerdo. Lo bueno del modelo beta-binomial es que permite tratar de manera unificada y precisa tanto los casos sin informacion como los que si la tienen, y ver su relacion de una manera natural. (En concreto, como el valor p=0.5 responde a una beta con certeza infinita)

Manuel VilchesManuel Vilches

El resultado de la asamblea es lo que se pone en duda. Ninguna información de esa muestra de votantes pueden ser considerada. Es su aleatoriedad lo que está en entredicho. Si tiro una moneda con dos caras y observo doce caras seguidas tengo puedo dudar de su equilibrado. Para evaluar mi duda solo tengo que evsluar como de probable era esa serie a priori y no puedo tener en cuenta la “evidente” alta probabilidad de caras que esa moneda presenta pues es la “trampa” q sospecho.

MaGaOMaGaO

Se puede poner en duda todo lo que quieras, pero es lo que salió (sobre todo cuando se introduce la información de las votaciones previas).
El problema de considerar todos los resultados equiprobables es que TODOS son igualmente susceptibles de sospecha.
Con ese razonamiento, si un tercio hubiera votado a favor y dos tercios en contra (1010 contra 2020) se podría decir exactamente lo mismo y poner en duda el resultado. La afirmación de que la probabilidad de un empate es 1/3031 no da información alguna en absoluto. En el peor de los casos, es conspiranoia pura.

Manuel VilchesManuel Vilches

Pregunta: en ausencia de información previa ¿cual es la probabilidad de un empate ante 1515? Respuesta correcta 0.03%. Respuesta equivocada 1.44%. A partir de aquí que se emparanoie quien quiera. Yo en todo momento hablé de matemáticas y llevaba razón. No he criticado a nadie por sus ideas políticas ni reflejado prejuicios. Otros si me habéis prejuiciado a mi.

0 (0 Votos)
Manuel VilchesManuel Vilches

Si digo que se pone en duda el resultado es para exponer por qué no puede usarse el resultado en la evaluación. El evento era sin información, altamente improbable. Decir que se dio Sí que es no decir nada. Y sí, otros resultados eran igual de improbables pero no pata era 3000 veces más probable.

0 (0 Votos)
Manuel VilchesManuel Vilches

no empatar era 3000 veces más probable

No necesito que te disculpes. Me doy por satisfecho con que lo hayas entendido.

0 (0 Votos)
jddlopejddlope

Buenas tardes, me temo que me voy a quedar con la duda de saber si el razonamiento que dí el día 31 es válido. A mi salía una probabilidad del 0.033%, y no soy capaz de ver dónde me haya podido equivocar, si es que lo he hecho. Las premisas de mi razonamiento son análogas al siguiente supuesto. Si en una bolsa tenemos 3030 bolas de 3 colores (Blanco, Rojo y Azul), de las que sabemos que puede haber desde 0 hasta 3030 de cada color, ¿de cuántas formas es posible que haya el mismo número de bolas Rojas que Azules? Lo que a mi me sale es que sólo el 0.033% de las configuraciones posibles son de empate entre bolas Rojas y Azules. Luego, a priori, y sin saber nada más que lo dicho sobre las cantidades de bolas que puede haber, esto es lo esperable respecto a un empate. Es decir, una probabilidad a priori bajísima, contra la que apostaría todo mi dinero. Si luego se abriese la bolsa y comprobase que hay el mismo número de bolas Rojas que Azules, me llevaría la sorpresa más grande de mi vida. Matemáticamente el problema de la CUP es similar, para los que no sabíamos nada de intención de voto de sus miembros: en principio todas las configuraciones de votos Si, No e Inválidos (blancos, nulos, abstenciones) nos parecían igual de probables, por lo que las de empate constituirían el 0.033% de las posibles.
En definitiva, creo que de lo que se trata es de analizar si la sorpresa por el empate está jusitificada o no. Si el el empate a priori hubiera tenido una probabilidad más alta, seguro que no hubiera habido tanta sorpresa.

omalaled

Creo que en este comentario da un ejemplo en el que te puede aclarar algo.

Hay 2 diferencias: que no considera las abstenciones (yo tampoco lo he hecho) y que es con n=4 en lugar de 3030; pero creo que se ve claro.

jddlopejddlope

Gracias, pero me parece que no habéis leido mi primer post. El problema es tan sencillo como contar, que al fin y al cabo es la base de la probabilidad. Os describo mi método, pero con 10 votantes, para que podías ver dónde pueda estar mi error de concepto o cálculo, si es que lo hay.
Si hay 0 abstenciones, votos blancos o similares (los llamaré “votos I”), es decir si hay 10 votos válidos (S+N), entonces hay 11 configuraciones posibles de síes y noes, y solo una de ellas es empate: 5 a 5.
Si hay 1 voto I, entonces hay 9 votos válidos que dan lugar a 10 configuraciones posibles de votos S y N, y ninguna es empate.

Si hay 8 votos I, entonces hay 2 votos válidos ergo 3 configuraciones posibles de votos S y N, y solo una de ellas es empate: 1 a 1.
Si hay 9 votos I, solo hay un voto válido, y no cabe el empate.
Si todos los 10 votos son I, hay empate a 0.

En total, en los 11 casos vistos, hemos obtenido:
1 empate entre 11 configuraciones +
0 empates entre 10 configuraciones +
1 empate entre 9 configuraciones +

1 empate entre 3 configuraciones +
0 empates entre 2 configuraciones +
1 empate en la configuración de todos los votos I

Es decir, 6 empates en 11+10+9+…+3+2+1 = 66 configuraciones, lo que, en este caso, da una probabilidad del 9.1%.
La fórmula a aplicar es P = (n/2 + 1)/(1+2+…+(n+1)) que tras oportunas simplificaciones es P = 1/(n+1), por lo que para n = 3030 sale una probabilidad del 0.033%.
Esto es lo que sale sin ninguna información previa sobre el sentido del voto.
Ahora bien, si se sabe previamente que, por ejemplo 1400 personas van a votar no y otras 1400 van a votar sí, entonces la cuestión queda entre los 230 indecisos restantes y al aplicarles la fórmula a ellos sale una probabilidad de empate de 1/230 = 0.43%, que es un pelín mayor. Y así se podrían estudiar todas las posibilidades en función de los datos conocidos.

omalaled

En el post no se han tenido en cuenta las abstenciones. No obstante, esta frase la que considero errónea.

si hay 10 votos válidos (S+N), entonces hay 11 configuraciones posibles de síes y noes, y solo una de ellas es empate: 5 a 5.

Si hay 10 votos no hay sólo 11 formas posibles. Fíjate en el ejemplo de los 4 votos. En este caso afirmarías que hay 5 configuraciones posibles; y no es así, sino que salen 6 sobre 16.

Este último punto es el de discrepancia.

Manuel VilchesManuel Vilches

Veo Omalaled que realmente aun no lo entiendes. Hago un último intento. Toda esa combinatoria de bolas que tu llamas casos tiene un “pecado original” y es considerar que todas esas combinaciones son igualmente posibles, cuando en realidad solo lo son si en el saco hay tantas bolas blancas como negras, lo cual no puede asegurarse a priori. No conociendo el reparto de bolas en el cesto (es decir, la tendencia a si o no de los electores) la probabilidad de empate no puede calcularse asumiendo que esas combinaciones on equiprobables, pues no lo serán en general.

Algunos, equivocadamente, pensarán: bueno, pero incluso aceptando esto,como decía el humorista aquel, “las que entran por las que salen”, y los casos con p0.5. Pero esto es un error. Asumir la p media puede servir para estimar algunos indicadores estadísticos de un número infinito de extracciones, pero no para el cálculo del empate, pues todas esas opciones con p no igual a 0.5 juegan contra el empate. Da igual que p sea 0.3 o 0.7, la probabilidad de empate se reduce a cero en ambos casos, no se “equilibra”. “Condensar” la distribución uniforme de p en su valor central (como en otras distribuciones) puede servir para algunos cálculos, no para todos, y debemos ser conscientes de ello para no meter la pata, como ha ocurrido en este post.

Si quieres usar p = 0.5 no puede ser como “promedio por falta de información” sino porque dispongas de información (por supuesto distinta a la propia ocurrencia del evento cuya aleatoriedad está puesta en duda, y este evento es la secuencia de 3 votaciones, es la elección de votantes, no su voto concreto, la elección aleatoria). Aun así, esa información deberá ser tan precisa como para centrar p en un intervalo tan pequeño (infinitamente precisa si tomas p=0.5 exactamente).

Por favor, la próxima vez, pregunta concretamente qué parte del razonamiento es la que no entiendes, porque esto es una panzá de escribir que me empieza a parecer improductiva.

Manuel VilchesManuel Vilches

Se borró parte del texto anterior.

Los casos con p>0.5 compensarán los de p <0.5.

0 (0 Votos)
jddlopejddlope

Omalaled, en el caso de que los 10 votos fueran válidos (ningún blanco, nulo o abstención), las 11 configuraciones posibles son:
10 S y 0 N
9 S y 1 N
8 S y 2 N

1 S y 9 N
0 S y 10 N
son 11 configuraciones y la única con empate es 5 S y 5 N.
Lo que afirmas de 6 sobre 16 con 4 votos (válidos, quiero suponer) no sé de dónde lo sacas.
Creo que estás empeñado en algo que no se sostiene. Yo te lo he demostrado desgranando el problema matemático en todos los casos posibles, incluyendo una mayor riqueza de posibilidades, como es la de los votos no válidos (no S o N), que refelja mejor la realidad de una votación.

Manuel VilchesManuel Vilches

Por supuesto, jddlope, tus cálculos (perdona que te tutee) son correctos, y ambas expresiones, la que tú calculas, sin duda más completa al incluir los votos I, y la simplificada sin incluir los I coinciden de forma exacta. Y te reconozco que me ha sorprendido (no me pareció intuitivo) y he tenido que comprobarlo, pero es así, la probabilidad de empate para 3030 votos vale 0.03% ¡con o sin votos inválidos!. Gracias por la aportación.

El único problema de tu razonamiento, para aquellos que aun no lo entienden, es que aun habría que justificar la razón por la que todas las proporciones de voto son igualmente probables. En el caso sin votos I esta demostración es posible y la razón, que para muchos es casi intuitiva al aceptar que desconocemos a priori la intención de voto, no es más que el hecho de que ese desconocimiento implica no poder asumir un valor concreto de p para la distribución binomial (al contrario de lo que hace el autor, que asume p=0.5 ¡sin incertidumbre alguna, y llamar a esa elección tan precisa desconocimiento es cuando menos un error), por lo que debemos calcular la probabilidad de empate para cada valor de p asumido (entre 0 y 1) y promediar. En definitiva es promediar la función P(empate) frente a p, en el intervalo p entre 0 y 1. Siendo P(0.5) =1.4%, teniendo esta función una forma cuasi-triangular (acampanada) y siendo el intervalo donde la función toma valores significativos solo de una anchura 0.05, habrá al menos que dividir ese 1.4 entre 2, para promediar en la región de significación y entre 20, para promediar en todo el intervalo 0-1, lo que resulta 0.03.

Realizar los cálculos detalladas que demuestran que desconocer p hace todas las proporciones si/no equiprobables no es sencillo (como casi ninguna demostración rigurosa en matemáticas). Si te interesa puedes leer la aportación de Alejandro Rivero http://a.rivero.nom.es/binomiales-y-disculpas/ o la que ya ha puesto aquí David Ruescas. Los cálculos del profesor Bilbao son correctos, por supuesto, como corresponde a un catedrático de matemáticas, incluso siendo afiliado del PP (hablemos ya en plata, porque ese es el asunto).

Aceptada (demostrada) esa equiprobabilidad de proporciones (que considerando votos I resultan mucho más complicada y de hecho no puedo asegurar que se cumpla) tus cálculos son correctos.

Gracias de nuevo por tu meritoria aportación.

jddlopejddlope

Muchas gracias Manuel, y por favor tuteémosnos. Reconcozco que me he perdido un poco en lo último que has dicho (hace años que no toco esa pasión dormida que son las matemáticas para mi), pero yo creo que el planteamiento de mi segundo post podría valer: “Si en una bolsa tenemos 3030 bolas de 3 colores (Blanco, Rojo y Azul), de las que sabemos que puede haber desde 0 hasta 3030 de cada color, ¿de cuántas formas es posible que haya el mismo número de bolas Rojas que Azules?” A esto es a lo que yo he respondido porque he visto que Omalaled en el fondo estaba argumentando con los mismos supuestos (ninguna otra información a priori), sólo que incorrectamente.
Por supuesto, no tengo el gusto de conocer a Mario Bilbao, ni me interesa mezclar aquí la política. Para mi es como si fuera un ejercicio que pudieran poner en algún libro de texto sobre probabilidad en el futuro.
Un abrazo a todos

jddlopejddlope

En definitiva, los cálculos de Mario Bilbao me parecen más correctos que los aquí propuestos basados en la binomial, por la sencilla razón de que aquí no se ha tenido en cuenta algo a priori posible y realista: que la suma de los votos Si y No no tiene por qué ser 3030, debido a votos en blanco, nulos o abstenciones. Al tener en cuenta lo que le falte a esa suma S+N para llegar a los 3030 votantes, las cuentas de Mario Bilbao me parecen más exactas que las de Omalaled (y las mías un poco más que las de Mario Bilbao)

Alejandro Rivero

Hola, he añadido en mi blog un post nuevo donde recomiendo hacer el calculo integrando y no intentar demostrar verbalmente, para ello pongo el siguiente “contraejemplo”

la probabilibad de ganar en la apuesta de sacar cara tirando una moneda, de equilibrio desconocido, como máximo dos veces. Los distintos posibles lances del juego son 1) saco cara y gano, 2) saco cruz pero luego cara, 3) saco cruz y cruz. Como tengo tres casos, y dos de ellos me son favorables, la probabilidad de ganar es de 2/3.

El resultado es correcto, el argumento no, porque los casos 1,2,3 no son equiprobables.

Manuel VilchesManuel Vilches

Hombre, Alejandro. Existen muchas situaciones en las que los eventos posibles no son equiprobables, por supuesto… Pero no es este caso. En ausencia de información, e integrando para todo valor de p entre 0 y 1, todos los posibles resultados SI/NO son equiprobables, y por eso la probabilidad del resultado EMPATE es de 1/3031, pues hay 3031 resultados posibles igualmente probables.

Tu post es una magnífica contribución, pero como ya te comenté deja en el aire cierta duda al respecto. Hay que dejarlo claro: el “supuesto matemático” hizo una estimación correcta, con un juicio correcto (casos equiprobables) aunque, como ves, el personal insiste en poner en duda su profesionalidad. Esto es cualquier cosa menos ciencia y divulgación.

omalaled

Manuel, ya has dejado varias veces clara tu opinión. Tú piensas que yo estoy equivocado y yo que lo estás tú.

Ahora, por favor, para ya de escribir comentarios repitiendo lo mismo: repetirlo no hace que tengas más o menos razón.

Alejandro Rivero

Ah, mi debate con Manuel es un poco diferente: yo le acepto el 1/n+1 pero le digo que hay que demostrarlo y no afirmarlo verbalmente, que eso es gratuito,. Asi que en mis posts le ofrezco dos demostraciones, una por particiones y otra por integrales, en la confianza de que las disputas matematicas se resuelven via demostracion, como decia no se quien. Pero como él cree que su afirmacion verbal es una demostracion valida, ¡me sigue erre que erre diciendo que no dejo claras las cosas! No tiene arreglo.

Manuel VilchesManuel Vilches

Pero Alejandro ¿por qué dices eso de “no tiene arreglo” después del largo intercambio de mensajes amistosos que hemos mantenido? ¿qué demostración verbal, hombre? La demostración por integrales o particiones está OK, por supuesto, pero lo que con ellas demuestras es que, aceptado que p debe tomar cualquier valor entre 0 y 1, todas las combinaciones SI/NO son equiprobables. Pero es que lo que el autor del post y otros discuten es que p deba tomar cualquier valor entre 0 y 1 y abogan porque en ausencia de información debemos asumir p = 0.5 Ese es el punto central del debate. Aceptada ese desconocimiento de p, las combinaciones son equiprobables, como decía el profesor Bilbao (sin demostrar) y demuestras en tu post. Puedes volver a resolver la integral si quieres, y me parece bien, pero el asunto que se debate no es resolver la integral, sino el mismo hecho de plantearla. Este post es buen ejemplo de que así es. Mi único reproche a tu post (sabes que es un reproche leve, pues he alabado el post, lo he compartido y difundido, y he contribuido a enriquecerlo, creo, con mis comentarios públicos y “privados”) es que utilices el que Bilbao se limitara a enunciar el hecho/resultado en un tuit (sin hacer la integral) como “prueba” de que se equivocaba. Mi empeño es defender que no se equivocaba: si p es uniforme entre 0 y 1, los sucesos son equiprobables y aplica la regla de Laplace.

0 (0 Votos)
Alejandro Rivero

Dejadme añadir, es de hecho muy elegante en mi opinion ver como la integral entre 0 y 1 de todas las posibles distribuciones binomiales compensa exactamente el numero de combinaciones (N m), en este caso el (3030 1515) pero en general. Esto ocurre porque al integrar por partes p^m (1-p)^(N-m) la evaluacion entre cero y uno anula siempre el termino integrado de las partes, y solo nos queda ir iterando de “u dv” a “v du”, con lo cual el primer termino va creando la secuencia (m+1)(m+2)…(N-1)(N) y el segundo termino, derivandose, va creando el factorial (N-m)!.

Javier MendozaJavier Mendoza

Yo no soy matemático, pero aficionado a estas cosillas, y diría que basados en lo básico: casos favorables /casos posibles; los casos favorables serían todas las combinaciones de 1505 síes ( o noes) de entre 3010 experimentos. Las combinaciones (creo que serían variaciones) de 3010 experimentos tomados de 1505 en 1505 . Esto es el binomio de newton ( 3010 sobre 1505) que sería : 3010! / (1505! (3010!-1505!)
Los casos posibles: 2 elevado a 3010
Si haceis la operación con una calcuadora científica vereis que efectivamente sale: 0,01454 es decir un 1,45 % de probabilidad matemática de que salgan igual número de sies que de noes. Ahora bien esto significaría que estadísticamente todos los votantes han emitido el voto tirando una moneda al aire, como alguien ha comentado antes, cosa que no creo que fuera lo que pasó.

Alejandro RiveroAlejandro Rivero

Javier, en efecto es el termino que calculas del binomio de newton, pero el argumento del debate es que contar los casos posibles como 2^3010 equivale a estar haciendo 3010! / (1505! (3010-1505)!) * 1/2^(1505+1505) y por tanto se esta usando la formula con una probabilidad p=1/2. Como tu dices, “significaria que han emitido el voto tirando una moneda al aire”. La solucion que se propone es en vez de conocer la moneda integrar para todo p entre cero y uno, entonces tendriamos
\int 3010! / (1505! (3010-1505)!) p^1505 (1-p)^1505 dp, y el resultado de esa integral es que se cancelan los factoriales. La sencillez de la expresion resultante tiene la culpa de toda la confusion, ya que incluso muchos de los que llegan a ese resultado afirman obtenerlo “intuitivamente” en vez de integrando, y eso es casi en todos los casos pura chiripa.

Héctor Valero SenentHéctor Valero Senent

Yo creo que lo que más debemos de tener en cuenta es que el valor central de la binomial también es el valor central de la normal; lo único que hay que hacer es calcular el área para conocer la probabilidad y esto se hace con la normal, no la binomial. La probabilidad es más alta cuando estás en valores intermedios, y aunque la normal, usualmente indica cuánta gente queda por debajo, también aquí nos indica la probabilidad relativa de un suceso, es como una dimensión más de ella¿no? Al menos parece que adquiere esta tendencia para valores continuos. La probabilidad de empate es la que más se da, en es estamos de acuerdo todos, creo. ¿ Por qué no pensamos en cuál es la desviación típica que nos lleva desde el empate hasta la unanimidad ( que voten lo mismo los 3030 participantes)?
Perdónenme si digo una barbaridad.

Manuel VilchesManuel Vilches

Pues no, Hector, como puedes ver si lees todos los comentarios, no estamos de acuerdo en que el empate sea lo más probable, y no lo estamos porque es sencillamente falso. La probabilidad de empate es la más alta… solo si consideramos que p=0.5. Suponer que en ausencia de información debemos asumir que p=0.5 es el error que muchos tuiteros, blogueros (el autor de este post, por ejemplo) y comentaristas cometieron desde el primer momento (incluidos los que ahora siguen asegurando que el profesor acertó de chiripa). No, en ausencia total de información no podemos asumir que p=0.5, sino que deberemos aceptar que cualquier valor de p es igualmente probable, pues en una votación el valor p=1 o p=0 es en principio probable, basta con hacer la pregunta adecuada, Y ausencia de información es el caso que nos ocupa, salvo que volvamos con aquello de que en realidad las rondas anteriores blablabla… cuando por supuesto que nadie estaba preguntando cual era la probabilidad de empatar después de que en una ronda casi empataran, sino cual era la probabilidad de empatar, a priori.

Manuel VilchesManuel Vilches

Puntualizo mi comentario cuando digo “La probabilidad de empate es la más alta… solo si p=0.5″. Lo correcto es decir que la probabilidad de empate “toma su valor más alto” (que es este que algunos, como el autor del post, proponen como correcto), cuando p=0.5. Pero este es su valor extremo y no puede ser el más significativo. En cambio 1/3030 no es el valor mínimo extremo.

Deja un comentario

Tu email nunca será mostrado o compartido. No olvides rellenar los campos obligatorios.

Obligatorio
Obligatorio
Obligatorio

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>