Matemática y Ciudadanía: porque correlación no implica causalidad

La estadística es una de las ramas de la matemática que más aplicaciones tiene en campos científicos externos al propio. Por ese motivo, su enseñanza en la escuela debería ser uno de los temas más desarrollados y discutidos con los alumnos aunque la realidad de las aulas nos muestre lo contrario.

Pero, ¿por qué es importante estudiarla y por qué es tan difícil enseñarla? Como ciudadanos, es fundamental que manipulemos algunas nociones básicas del discurso estadístico ya que es uno de los disfraces más frecuentes a la hora de presentar información sesgada, falaz o tendenciosa. El principal problema que entraña la enseñanza de la estadística es que cualquier desarrollo teórico -por más sencillo que parezca- exige una complejidad notable que excede el nivel promedio de la escuela. Por ello, el acento educativo no puede estar puesto allí ya que, de serlo, sería imposible enseñarla en niveles que no sean específicos y afines a la matemática.

El acento debe estar puesto, entonces, en otros aspectos como la discusión sobre la pertinencia (o no) de los estimadores, la validez (o no) de ciertos resultados, la posibilidad (o imposibilidad) de realizar inferencias o predicciones, entre otras. Como bien sabemos, aun hasta el cálculo más elemental que exige el estudio estadístico es, por lo menos, tedioso. ¿Tiene algún sentido, entonces, que nuestros estudiantes dediquen casi todo el curso al cálculo manual de medias, desviaciones, covarianzas y otras? ¿Qué pensamiento crítico podemos estar desarrollando si dedicamos cursos enteros al cálculo de medias, cuartiles y desvíos despojando del sentido último a la tarea estadística?

Para reflexionar sobre estos temas compartimos en este artículo una afirmación que no pasa de moda: cum hoc ergo propter hoc -es decir- correlación no implica causalidad. ¿Y esto…?

Algunos ejemplos de correlaciones espurias

Veamos: la estadística brinda ejemplos de lo más atractivos porque basta con abrir un diario, ojear la cuenta del banco, leer una nota o sólo poner el noticiero a la noche para ver que somos constantemente bombardeados por información estadística y, en nuestro país, especialmente, sabemos que no es un tema menor en la agenda política.

La pregunta que debemos hacernos como ciudadanos es ¿estamos preparados para entender esta información, para aceptarla o para refutarla? Y más aún, como docentes de nivel medio ¿estamos preparando a nuestros estudiantes para la lectura crítica de la información estadística? ¿O sólo estamos enseñando fórmulas y evaluando cálculo? La adquisición de técnicas y algoritmos es necesaria, por supuesto, pero no constituyen por sí sola la base para la resolución de problemas y mucho menos para la formación del espíritu crítico -aquél que todos soñamos alcanzar con nuestros estudiantes.

Los gráficos tienen un poder de persuasión enorme en cualquier audiencia -sea letrada o no- y esto se debe al enorme impacto visual que causan para mostrar proporciones, tendencias y relaciones. Veamos un ejemplo de esto en la Figura 1 donde se muestra la evolución desde 2007 de los fallecimientos y las tasas de mortalidad en un pequeño pueblo de Córdoba.

Figura 1. Tasa de mortalidad y número de fallecidos en un pueblo de Córdoba desde 2007 a la fecha.

¿Qué conclusión podemos sacar al respecto? El gráfico es contundente en cuanto a la descripción del comportamiento de ambos fenómenos. A tal punto que uno podría preguntarse, ¿estarán relacionados? ¿de qué modo? Cualquier ciudadano, independientemente de sus conocimientos estadísticos, es capaz de observar la regularidad de los fenómenos: cuando uno aumenta, el otro también; cuando uno disminuye, el otro también (y hasta parecería que lo hacen en la misma proporción). Entonces nos preguntamos, ¿qué miden estas variables aleatorias?: miden “número de fallecidos” y “tasa de mortalidad” de un pueblo. Es evidente que están relacionadas y hasta podemos señalar algún tipo de relación causal, ¿no?

Muy bien, veamos otro gráfico a ver si opinamos lo mismo. En la Figura 2 se muestra un gráfico con la evolución de la inversión en tecnología en EE.UU. en billones de dólares y la cantidad de suicidios de los últimos 10 años.

Figura 2. Billones de USD invertidos en ciencia y número de suicidios en EE.UU. desde 2006 a la fecha.

 

Si seguimos la misma lógica que usamos para el gráfico anterior, entonces, la relación entre el presupuesto invertido en ciencia y la cantidad de suicidios en EE.UU. es evidente. Nadie puede cuestionar la forma semejante que guardan ambas trayectorias. No obstante, suponemos que cualquier ciudadano estará de acuerdo en que es imposible afirmar desde el llano que existe una relación causal y directa entre inversión en ciencia y suicidios ¿o acaso creemos que a causa de que se invierta más en ciencia es que aumentará el número de suicidios?

El problema es que lo que no suele quedarle claro a cualquier ciudadano es si hay o no hay relación ya que en el primer gráfico la relación parece evidente pero no así en el segundo (o al menos suena más disparatado) aun cuando las gráficas se comportan casi de idéntica forma. La respuesta es que sí, posiblemente haya algún tipo de relación entre las variables aleatorias (y de hecho podemos y las estudiamos en la escuela media) pero lo que no podemos afirmar estadísticamente en ningún caso es que haya una relación causal que atribuya el acontecimiento de un fenómeno al otro. Y ésa es, precisamente, una de las diferencias que parece algo sutil pero no lo es: que exista correlación entre fenómenos no implica que exista necesariamente una relación causal, una relación de causa-efecto. Tal vez la haya (o no), pero eso es objeto de discusión de otras disciplinas. Como dijimos al comienzo: cum hoc ergo propter hoc.

Pero, ¿qué es la correlación?

La correlación alude a la correspondencia entre dos o más fenómenos y, desde el punto de vista estadístico, muestra la existencia de mayor o menor dependencia entre dos variables aleatorias que, habitualmente, se mide con un número real. En estadística, todo esto puede sintetizarse dentro del análisis de la regresión donde se estudia la relación entre una variable dependiente y una (o más) variables independientes (también llamadas predictoras). Existen diversas funciones de regresión que caracterizan esas relaciones y su tratamiento matemático y estadístico se complejiza a medida que se gana precisión.

En la escuela media, es frecuente que se enseñe el modelo lineal de regresión que evalúa la posibilidad de que haya una relación lineal entre dos variables: por ejemplo, “número de fallecidos” y “tasa de mortalidad” o bien “inversión en ciencia” y “número de suicidios”. La existencia de un buen ajuste del modelo (un número de correlación cercano a uno) nos permite identificar con bastante precisión lo que puede pasar con la variable “dependiente” si se modifica la variable “independiente”. Pero esto no quiere decir que una sea la causa para la otra: no hay, necesariamente, relación de causa-efecto y si la hubiera, no es desde la estadística que podrá mostrarse. Por ejemplo, la relación entre las variables de la Figura 1 es muy fuerte: basta con cargar los datos en una calculadora científica y buscar el modelo de regresión lineal para verificarlo.

Figura 3. Cálculo de la regresión lineal con la función STATISTICS y gráfico de la recta de regresión con la opción del QR en fx-991LAX.

 

¿Qué quiere decir esto? Que más del 95% de los valores de la variable aleatoria para el número de muertos puede explicarse a través de una relación lineal con la tasa de mortalidad. Esto no quiere decir que haya una relación de causa-efecto necesariamente pero sí nos sirve como una relación útil par la predicción. Algo semejante sucede con el ejemplo de la Figura 2.

Figura 4. Cálculo de la regresión lineal con la función STATISTICS y gráfico de la recta de regresión con la opción del QR en fx-991LAX.

Como esperábamos, cerca del 99% de los valores de la variable aleatoria para el número de muertos por suicidio puede explicarse a través de una relación con la inversión de EE.UU. en ciencia. Existe una fuerte correlación estocástica de tipo lineal y podemos predecir, de acuerdo la cantidad de una a partir de la otra para el 2017, por ejemplo.

Ahora bien, en cualquiera de los casos ¿esa fuerte correlación implicará causalidad? Desde luego que no: sería disparatado afirmar que el incremento del presupuesto en ciencia es la causa para el aumento de los suicidios ¿no? Pero sucede que otros ejemplos que no son no tan groseros (o espurios) como este pueden tomarnos algo desprevenidos si no tenemos afianzados los conceptos estadísticos.

Matemática y Ciudadanía

En el discurso político abundan los ejemplos de correlaciones espurias o groseras y de confusiones (o manipulaciones) que muestran correlaciones a partir de las cuales pretenden deducirse relaciones causales. Estos son los temas de discusión que debemos poner sobre la mesa de nuestros estudiantes. Veamos un ejemplo algo conocido o, al menos, que vigente en la actualidad política de nuestro país.

En un seminario en 1959, el sociólogo Seymour Lipset señalaba que algunos requisitos sociales para el crecimiento y fortalecimiento de la democracia son el desarrollo económico y el desarrollo político de las naciones. Lipset fue uno de los primeros en mostrar la correlación entre desarrollo y democracia hace más de medio siglo y aún sigue siendo un resultado válido pues señala que existe una lista de factores que, podemos decir, constituyen las condiciones para la democracia (como el desarrollo, la industrialización, la riqueza, la educación, entre otros) pero no sus causas. En la mala interpretación de los resultados de Lipset es donde radica el problema: hay correlación entre democracia y desarrollo, sí, pero esto no garantiza que la relación sea causal. Es decir, no hay forma de afirmar que la razón del fortalecimiento de la democracia sea el desarrollo (o al menos no desde los estudios de Lipset). Si así fuera el caso, entonces, el desarrollo económico e industrial de la República Popular de China deberían conducir indefectiblemente a una reforma política y a alcanzar el fortalecimiento democrático e institucional (y bien sabemos que no es el caso).

Aun cuando tratamos variables estocásticas o aleatorias, necesitamos hallar relaciones que puedan explicar algún tipo de relación entre ellas y poder -en el mejor de los escenarios- realizar inferencias. Gran parte de la comunidad le demanda a la Matemática la construcción de modelos para explicar fenómenos reales y, lo que es más complejo, para predecir. El problema viene cuando, con o sin intención, se pretende alcanzar un nivel de determinismo, de explicación y de generalidad que excede al campo de la disciplina. Entonces, la estadística (que es una voz autorizada con mucha aceptación frente a cualquier tipo de audiencia) se transforma en una herramienta popular para mostrar todo tipo de correlaciones sean válidas o falaces y para tratar de mostrar relaciones de causa-efecto de muchos fenómenos porque, en última instancia, los humanos queremos poder entender qué sucede con lo que nos rodea y cómo intervenir eficientemente.

Para debatir y reflexionar

A modo de cierre, queremos compartir una nota del diario español El País, publicada el 1 de enero de este año (disponible en: http://internacional.elpais.com/internacional/2017/01/01/america/1483309917_658461.html).

Invitamos a los docentes de cualquier disciplina a leerla y a reflexionar, con alguna de las herramientas estadísticas que comentamos en el artículo, acerca del núcleo que comenta la noticia. Una de las afirmaciones que se pone en tela de juicio es que la educación sea hoy el motor central de la participación política y la democracia. Al respecto, se afirma:

Tampoco esta correlación [años de educación obligatoria – participación política y democrática] parece ser ya automática. Por ejemplo, en diversos países [como] Argentina, Chile o México los años de escolaridad han ido en aumento pero esto no se ha traducido en niveles mayores de participación político-electoral, de valoración democrática o de cultura cívica. (…) Pero aún en países con escolaridad alta también hay declive o bien, en otros, una grave distorsión de la noción clásica de democracia. (…) En cualquier escenario, lo que antes se daba por sentado, que con solo escolarizar mejora la calidad de la ciudadanía, la democracia y la política, ahora tiene que ser abordado tomando en cuenta otros factores psicológicos, mediáticos, sociales y culturales sin cuya comprensión fina será imposible construir una vida pública razonablemente coherente e inteligente.

Dejamos abiertas algunas preguntas para orientar las reflexiones.

  • ¿Podés identificar las variables que el artículo relaciona? ¿Cómo creés que se “miden” esas variables?
  • ¿Por qué se habla de correlación automática entre ellas? Es decir, ¿existe o existió -en algún momento- alguna relación entre esas variables? En tal caso, ¿qué tipo de relación podría haber entre ambas?
  • Según el articulo, esa relación ¿se modificó con los años? ¿Por qué?
  • ¿Hay o hubo relación causal entre las variables?
  • ¿Por qué se habla de correlación? ¿Es correcto usar ese término en un sentido técnico?
Acerca de Daniela Laura Parada 4 Articles
Mi nombre es Daniela Parada, tengo 28 años y soy porteña. Soy Profesora de Matemática y estudiante de posgrado de la Universidad de Buenos Aires. Docente de vocación y desde muy temprana edad. Comencé a trabajar en la Universidad a dos semanas de haber finalizado la carrera de grado y ya nunca más me fui. Desde entonces, me he especializado en Didáctica de la Matemática y en Docencia Superior, campo en el que he escrito la tesis sobre la Profesión Académica de los Matemáticos en la Universidad. El mundo del libro me condujo, asimismo, hacia otro nuevo mundo donde conjugué mi vocación como capacitadora con mi pasión por la tecnología educativa: y fue allí donde redescubrí el universo Casio. Desde entonces, junto con el equipo de Casio Educación en Latinoamérica, nos ocupamos del dictado de workshops y talleres para docentes acerca de Educación Matemática y Tecnología, Resolución de Problemas y Matemática Recreativa, entre otras «hierbas». Soy amante de la lectura y de la escritura, de la educación y de la matemática, por igual y por espero poder contribuir con artículos que incluyan problemas novedosos, atractivos y de interés para toda la comunidad lectora de la Revista.
Contacto: Sitio web

Se el primero en comentar

Deja un Comentario

Tu dirección de correo no será publicada.


*