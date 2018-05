Cito textualmente a continuación una nota que recibí por Internet y que ha circulado ya profusamente:

“En el portal del INE se puede descargar la base de datos de la última encuesta de reforma que publica tener AMLO 48%, Anaya 26%, Meade 18%, Zavala 5% y el Bronco 3% de preferencias. “Esta base tiene hasta hace 2 horas 26 descargas, es decir que 25 personas además de quien escribe tuvimos la curiosidad de descargar los datos y no sólo ver la gráfica de Reforma sino los datos con que armaron esa gráfica.

“Son 1,200 entrevistas, de ellas 180 se hicieron en el Estado de México, 108 en la CDMX, 84 en Jalisco, 72 en Veracruz, 60 en Chiapas, 60 en Puebla y en las demás entidades hicieron entre 12 y 36 entrevistas. Muestras extremadamente pequeñas para tener representatividad.

En la CDMX las entrevistas fueron en 5 delegaciones: 11 en Iztapalapa, 5 en Álvaro Obregón, 5 en Cuauhtémoc, 5 en Xochimilco y 2 en Tlalpan”.

Llama la atención del autor de la nota, la mía desde luego y espero que también la del lector “que no haya una sola encuesta de las delegaciones Miguel Hidalgo o Benito Juárez gobernadas por el PAN o de Milpa Alta, Magdalena Contreras o Cuajimalpa gobernadas por el PRI. Y dado que mi suspicacia estadística es grande, se me ocurre revisar los “factores de expansión”, que son números por los que se multiplica cada respuesta para que represente al total, por ejemplo un hombre de 39 años de la sección 3557 de Álvaro Obregón en la CDMX que declara votaría por AMLO se multiplica por 80,295.52, es decir que en el acumulado la respuesta de este hombre contará como la respuesta de 80,295 personas, mientras que un hombre de 44 en la misma sección que declara votaría por Anaya su respuesta contará por la de 68,787.17 personas”.

Digámoslo más sencillo, si alguien dice ‘voto por AMLO’ su respuesta se multiplica 80 mil veces y si alguien dice ‘voto por Anaya’ su respuesta se multiplica por 68 mil, ¿de dónde salen y cómo calculan esos “factores de expansión”? es un misterio.

Al excluir de la muestra a las delegaciones Benito Juárez con un altísimo voto panista, o Milpa Alta con un altísimo voto priísta, la muestra del estudio tiene un sesgo insalvable, y además con los factores de expansión los datos cambian mucho, subiendo la preferencia de AMLO en 17 puntos, bajando la de Anaya en 4 puntos y la de Meade baja 11 puntos, pero los datos originales no reflejan alguna ventaja para alguien, ya que quedan 31 para AMLO, 30 para Anaya y 29 para Meade, cifras que con el error de muestreo se convierten en lo que se conoce como empate técnico.

A mi juicio esta nota es de la mayor importancia porque aclara de manera muy precisa y oportuna el panorama electoral. Sin duda, las tendencias que supuestamente reflejan las encuestas tienen una gran influencia en el comportamiento del electorado, de los analistas y líderes de opinión y quizá hasta de los propios candidatos y sus partidos.

Y ciertamente no es lo mismo, en el box, en el hipódromo o en las elecciones, declarar un empate técnico a tercios, donde la posibilidad de triunfo sigue abierta para los tres principales contendientes, que proclamar de antemano la victoria de uno de los participantes por un margen que resulta imposible de remontar para los demás en los poco más de cincuenta días que aún faltan para las elecciones.

Sobre todo si la supuesta enorme ventaja que muestran las encuestas es el resultado de sesgos técnicos, quizá no mal intencionados, pero sin embargo influyentes, en el manejo del levantamiento de las encuestas, el diseño de las muestras o el formato en que se reportan y publican los resultados.

A mi paso por la Universidad de Harvard estudié intensamente estadística y luego la enseñé, además de haberla utilizado copiosamente en el trabajo econométrico que es el sustento de mi tesis doctoral “The Political Economy of Growth in Modern Mexico 1894 – 1994” ( La Economía Política del Crecimiento en el México Moderno 1894 -1994).

En ese proceso pasó por mis manos un famoso panfleto titulado “How To Lie With Statistics” (Cómo Mentir Con Las Estadísticas). Por eso puedo ver el fondo dónde los legos sólo ven las burbujas. Y en ese contexto me atrevo a decir que el resultado del 1 de julio no está escrito todavía.

Y no lo estará sino hasta que el INE emita su veredicto oficial. Y aun así los inconformes podrán ejercer los recursos que les otorga la Ley.

Por eso concluyo esta reflexión citando a Sócrates: A estas alturas “sólo sé que nada sé”.

[email protected]