Inicio > Artículos, Científicos, Opinión > Mentiras, pecados y abusos estadísticos.

Mentiras, pecados y abusos estadísticos.

No es de extrañar que, con las manipulaciones y los malos usos estadísticos, el público en general acabe navegando entre la fascinación y la repudia por las cifras. “Existen medias mentiras, mentiras y estadísticas”, oímos con frecuencia decir satisfecho al tertuliano de turno. La frase correcta debería ser: “Existen medios mentirosos, mentirosos y estadísticos embaucadores”.  (Bartolo Luque)

La estadística no es ni torpe ni taimada. Lo son aquellos que la usan ignorando sus supuestos más sencillos o con anhelo de que sirvan a sus intereses particulares. Como apunta el estadístico Stephen K. Campbell, esta continua perversión de la estadística hace que el ciudadano “en un principio acepte las conclusiones estadísticas sin ejercer crítica alguna, por suponer que las cifras no mienten. A veces nos desalentamos con el solo hecho de que se nos ofrezcan afirmaciones que empiecen “según las estadísticas …” o “las estadísticas demuestran que …” Pero conforme maduramos pasamos al extremo opuesto. Ya nos han engañado demasiadas veces publicistas, políticos, ciudadanos prominentes que tratan de darnos gato por liebre, periodistas que buscan el sensacionalismo, etc. Por lo que tendemos a creer que con las estadísticas se puede probar cualquier cosa, y por lo tanto no prueban nada. Mientras que en un momento creímos que las cifras no podían mentir, ahora se deduce que lo único que pueden hacer es engañar”.

Muchos malos usos estadísticos son pequeños pecados. Por ejemplo, cuando un medio de comunicación quiere impresionar a su audiencia con la gravedad de una situación, que puede afectar a gran parte de la población, suele emplear números absolutos en vez de porcentajes. Así leemos en un titular: “50 muertos en el puente de cuatro días.” Si la noticia se acompañara de las estadísticas de muertes por accidente de tráfico, observaríamos que se trata de aproximadamente el mismo valor que el número de víctimas por accidente de tráfico en cualquier periodo de cuatro días. Pero entonces el titular no sería noticia … Se trata de lo que los matemáticos llaman falacia de “base extensa”. La argucia se suele emplear en forma inversa. Por ejemplo: “El número de asesinatos en la ciudad tal aumentan un 60% respecto al pasado año.” Si el periodista o el político nos dijeran que el año pasado se cometieron 5 homicidios y éste 8, probablemente el dato no nos impactaría de la misma manera. Y sin embargo, en ninguno de los dos ejemplos podemos decir que el periodista o el político hayan mentido.

Pero en otras cuestiones, el pecado puede ser mayor. Para determinar el número de pobres de un país, la tasa de desempleo o el índice de precios al consumo (IPC), se debe acordar una definición de pobreza, desempleo o consumo. El término apalancamiento estadístico hace referencia al grado en que puede cambiar el conteo en cuanto se altera un poco la definición de aquello que estamos contando. Nuestro ejemplo más cercano es la disociación entre el IPC presentado por el gobierno y la sensibilidad popular respecto al impacto en los precios con la entrada del euro.

“Los periódicos no se atreven a publicar los datos estadísticos de forma más correcta. La formación estadística de los periodistas es nula” (José Olarrea)

Una redefinición del IPC puede cambiar las cifras apalancándolas a la baja. No nos ha de extrañar que varias instituciones de prestigio puedan ofrecer cifras verdaderamente dispares sobre la misma cuestión. Todo depende de la definición y métodos de conteo que cada institución haya empleado. Sin esas definiciones y métodos presentados de forma explícita, los datos deberían levantar nuestra suspicacia. Sobretodo teniendo en cuenta que, la mayoría de las veces, los resultados están asombrosamente adecuados a la ideología o intereses particulares de las instituciones.

A propósito de la polémica por la disparidad de cifras ofrecidas por el gobierno y los sindicatos, en referencia al seguimiento de la última huelga general, ¿recuerdan si gobierno, sindicatos o algún medio de comunicación dio explicaciones de los métodos por los que se determinaron las cifras? Tal vez, si el ciudadano hubiera sido informado en estos términos, su juicio hubiera sido más claro.

El quid de la estadística consiste en deducir opiniones, propiedades, cualidades, etc. del conjunto de una población, a partir de informaciones de una muestra. Estimar el tanto por ciento de población que prefiere a cierto candidato político, parece, en principio, simple. Se encuesta a una muestra de la población seleccionada al azar y se determina qué porcentaje de la muestra prefiere al candidato. De ahí hemos de estimar qué porcentaje de toda la población prefiere al candidato. Lamentablemente, no es tan fácil: tanto el tamaño de la muestra, como la forma de seleccionarla, pueden conducirnos a engaños. Es evidente que el tamaño de la muestra es determinante a la hora de sacar conclusiones. Cuanto mayor sea la muestra, mejor serán nuestros datos. De hecho, lo ideal sería conocer la opinión de toda la población …

INTERVALOS DE CONFIANZA

Para controlar el efecto del tamaño de la muestra los estadísticos usan intervalos de confianza y niveles de significación. Una frase estadísticamente más correcta que: “El 66% de los ciudadanos prefieren al candidato X”, sería: “Con un nivel de significación del 95%, el 66% más/menos el 6% de los ciudadanos prefirieren al candidato X”. Quiere decir que con una seguridad del 95%, entre el 60% y el 72% de la población (el intervalo de confianza) prefiere al candidato X.

“Sin una teoría del por qué, que sustente una correlación, debemos levantar las defensas. O podemos acabar estableciendo conclusiones absurdas, a partir de hechos estadísticamente fiables”

Lamentablemente si queremos afinar la estimación, reducir el intervalo de confianza, perdemos seguridad, disminuimos el nivel de significación. La única manera de aumentarla es aumentando el tamaño de la muestra encuestada, pero eso es caro. Como nos comenta el profesor de estadística de la Universidad Politécnica de Madrid, José Olarrea: “Los periódicos no se atreven a publicar los datos estadísticos de forma más correcta. La formación estadística de los periodistas es nula. Probablemente piensen que si ellos no lo entienden, exponerlos sería apabullar al lector. Pero en el fondo le hacen un flaco favor. Por ejemplo, es común que una compañía contrate los servicios de varias empresas de estadística para analizar su posición en el mercado respecto a sus competidores. Una vez la compañía dispone de los resultados de varias encuestas, puede escoger aquella que más apoye sus intereses jugando con los intervalos de confianza y los niveles de significación. Puesto que finalmente sólo nos ofrecen un porcentaje sin ninguna referencia más, probablemente no podemos decir que mientan, pero el dato así presentado carece de toda credibilidad”.

Si una noticia nos dice que el desempleo ha cambiado del 9,1 al 8,9% de la población activa, parece claro que se trata de una buena noticia. Pero si resulta que el intervalo de confianza es de más/menos 1%, el error asociado al muestreo nos está diciendo que esa aparente disminución puede ser inexistente. Es más: ¡es posible que el paro haya aumentado!

La segunda cuestión importante, después del tamaño, a la hora de realizar estadísticas fiables es escoger una muestra representativa de la población. Para que así fuera, deberíamos escoger al azar. Pero eso es mucho más difícil de lo que parece. Verbigracia: si la encuesta es telefónica, dejaremos fuera a aquellos que no tienen teléfono. Si pedimos a los lectores de una publicación, ya sea en papel o electrónica, que den su opinión, estaremos construyendo una muestra autoseleccionada. Sólo los lectores de esa publicación, y entre ellos los verdaderamente comprometidos con la cuestión, perderán su tiempo. ¿Qué validez tiene entonces una información tan sesgada?

La bis cómica de la selección la sufrimos diariamente en los programas televisivos. Cuando el presentador dice: “escuchemos la opinión del hombre de la calle”, significa que el reportero ha molestado a los viandantes hasta que puede obsequiarnos con una declaración a favor y otra en contra. Pero el premio se lo llevan los anuncios publicitarios donde un famoso nos aconseja tal o cual producto. ¡En ese caso la estadística se reduce a un solo individuo y desde luego no escogido al azar!

“Somos víctimas del abuso estadístico por nuestro analfabetismo numérico, por nuestro anumerismo” (Douglas Hofstadter)

CORREACIONES ESPÚREAS

Si obtener las cifras estadísticas ya es un problema, inferir de ellas conclusiones parece haberse convertido en el todo vale. Para demostrar que un hecho es causa de otro, no basta con establecer que tienden a producirse de forma simultánea. Si razonamos de forma tan cándida, seremos víctimas de lo que los estadísticos llaman correlaciones espúreas. Por ejemplo: una serie de tests sobre 1.000 niños demuestra sin ambages que los que poseen los pies más grandes, son capaces de sumar mejor. Estamos correlacionando la habilidad para sumar con el tamaño del pie. ¡Y la correlación es positiva! ¿Cómo es posible? Sencillamente los niños de mayor edad suman mejor que los más pequeños. Y por supuesto tienen los pies más grandes … Es una correlación espúrea.

Sin una teoría del por qué, que sustente una correlación, debemos levantar las defensas. O podemos acabar estableciendo conclusiones absurdas, a partir de hechos estadísticamente fiables. Todas las estadísticas nos dicen que la mayor parte de los accidentes de tráfico se producen a menos de 40 km del lugar de residencia y por debajo de los 80 km por hora. De aquí podríamos deducir que para conducir, es conveniente hacerlo lo más alejado posible de nuestra casa y a grandes velocidades. Un absurdo.

Somos víctimas del abuso estadístico por nuestro analfabetismo numérico, por nuestro “anumerismo”, como gusta decir al lógico Douglas Hofstadter. La brecha entre las dos culturas, las humanidades y las ciencias, nos ha conducido a situaciones tan paradójicas como que el ciudadano medio se jacte de su analfabetismo matemático: “Yo de números no entiendo …” y sin embargo le parezca signo de profunda incultura el desconocimiento de quién era Cervantes. Ambas negligencias son incultura. Y la ignorancia siempre ha sido la puerta de entrada para las injusticias, los atropellos y el engaño.

Como escribe el matemático A. K. Dewdeney: “Aquellos que abusan de las matemáticas también abusan de nosotros. Nos convertimos en presas de las triquiñuelas comerciales, las estafas financieras, la charlatanería médica y el terrorismo numérico de los grupos de presión, todo porque somos incapaces (o no estamos dispuestos) a pensar con claridad durante unos momentos.”

Bartolo Luque Serrano

CopyLeft
Permitida la reproducción total o parcial con la única condición
de que figure el nombre del autor/es.
Todas las copias deben llevar esta nota de CopyLeft.
En el caso de usos comerciales, por favor, póngase en contacto con el autor/es.

Categorías:Artículos, Científicos, Opinión Etiquetas:
  1. Aún no hay comentarios.
  1. No trackbacks yet.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

A %d blogueros les gusta esto: