La ciencia que viene

Teorema Central del Límite: orden a partir del desorden

Publicado el 24 de marzo de 2026

Javier Arricibita Innerarity

Ejemplo de Distribución Normal. Elaborada por Javier Arricibita.

No sería una exageración decir que el Teorema Central del Límite es uno de los principios más importantes de las matemáticas. Todo aquel que en algún momento haya hecho algún análisis estadístico, con toda probabilidad lo habrá necesitado. Los intervalos de confianza, los modelos lineales o las pruebas de hipótesis, entre otros, se apoyan en gran medida en este resultado.

Es probable que el nombre de este teorema no te suene pero, ¿a que sí te suenan los conceptos de Distribución Normal o Campana de Gauss? Esta famosa distribución se caracteriza por un valor central más probable que el resto, y por valores menos probables a medida que se alejan de este valor central.

Esta distribución es muy frecuente en prácticamente cualquier campo de estudio. Para explicarlo de manera sencilla veamos el ejemplo clásico de la altura de personas adultas. Al seguir una distribución normal el valor más probable será el valor central, digamos 170 cm. A medida que nos alejamos de este valor central será más difícil conocer a alguien de dicha estatura. Todos conocemos a adultos que miden 160 o 180 cm, pero a menos que midan 150 o 190 cm, y puede ser que ni siquiera conozcas a alguien que mida 140 o 200 cm.

Tal es la importancia y la frecuencia con la que aparece esta distribución en la naturaleza que muchos de los análisis estadísticos se basan, precisamente, en asumir que los datos siguen esta distribución. Sin embargo, los datos muchas veces son caprichosos y no cumplen estos supuestos. En la siguiente imagen tenemos otros ejemplos de distribuciones muy comunes.

Ejemplos de distribución uniforme, bimodal o exponencial. Elaboradas por Javier Arricibita.

Distribución uniforme: se caracteriza porque todos los valores son igual de probables. Pensemos en un dado: todas las tiradas son igual de probables (aunque a veces el azar se empeñe en sacar justo la tirada que no nos interesa).
Distribución bimodal: presenta dos poblaciones distintas. Si preguntamos a un camarero del Casco Viejo cuál es el consumo medio de cerveza por persona, una respuesta posible sería: “entre semana entre 1 y 2 cervezas, pero los fines de semana entre 3 y 4”. Son dos poblaciones con estadísticas diferentes.
Distribución exponencial: modula el tiempo necesario hasta que sucede un evento de probabilidad por unidad de tiempo constante. Pongamos por ejemplo el trabajo de un operador telefónico. Si entra a trabajar a las 9:00 y cada día apunta la hora a la que recibe la primera llamada del día, lo más probable es que la reciba a tiempos cortos y no tenga que esperar hasta las 14:00 para recibir su primera llamada.

Entonces, ¿no hay nada que podamos hacer si nuestros datos no son normales y en cambio siguen una de estas distribuciones? Aquí es donde entra el Teorema Central del Límite para ayudarnos. Volvamos con el ejemplo de los dados que, recordemos, siguen una distribución uniforme. En el parchís es igual de probable sacar un 5 que el resto de los números. Ahora bien, ¿y si estamos jugando al Catan? Para quien no lo conozca (para mi gusto el mejor juego de mesa, por cierto), en este caso se tiran dos dados. Ahora ya no son igual de probables todas las tiradas, es mucho más probable sacar un 7 (con 1 y 6, 2 y 5, o 3 y 4), que un 12 (únicamente con doble 6). Es decir, ¡nuestra distribución ya no es uniforme! Aunque los dados por separado sí sean uniformes, al agruparlos dejan de serlo ¿Y qué pasa entonces si en vez de dos dados, tiramos tres? ¿Y cuatro? ¿E infinitos?

En la imagen de abajo podemos comparar las distribuciones de las medias para diferentes tiradas de uno, dos y tres dados. Si sacamos un 2 y un 6, la media es 4 y ese es el valor que representamos. La primera distribución sí es uniforme, ya que estamos tirando los dados de uno en uno. Sin embargo, ¿qué le pasa a nuestro gráfico a medida que aumentamos el número de dados tirados (es decir, el tamaño muestral)? ¿Te recuerda a algo la forma que se obtiene?

Resultados teóricos para la distribución de medias muestrales con tamaños de muestra 1, 2 y 3 para un dado equilibrado de 6 caras. Elaboradas por Javier Arricibita.

¡Efectivamente! ¡La distribución obtenida se parece mucho a una distribución normal! En esto consiste el Teorema Central del Límite: con un tamaño de muestra (número de dados tirados a la vez) lo suficientemente grande, las medias muestrales se aproximarán a una distribución normal independientemente de la distribución original¹. En las siguientes animaciones podemos ver en los tres casos que hemos presentado antes (uniforme, bimodal y exponencial) cómo la distribución de las medias muestrales converge a la distribución normal a medida que aumenta el tamaño de las muestras.

¹En realidad las distribuciones originales tienen que cumplir una serie de requisitos, aunque bastante generales. En algunos casos en los que no se cumplen todos, el Teorema no se puede aplicar. La distribución de Cauchy por ejemplo, al no tener varianza finita, no cumple las condiciones necesarias para poder aplicar el Teorema Central del Límite.

Elaboradas por Javier Arricibita.

En estos gráficos se están simulando miles de datos (por ejemplo, un millón de dados tirados a la vez) y calculando cómo se distribuyen las medias en función de si agrupamos los dados de uno en uno, de dos en dos o hasta de cien en cien. La curva roja representa la distribución normal teórica para ese tamaño de muestra (n).

¿Y por qué es tan importante este resultado? Pues déjame decirte que te ha salvado de muchos apuros en análisis estadísticos. Si alguna vez has usado una prueba t de Student, un análisis ANOVA o un modelo de regresión lineal, dale las gracias a este teorema, sin él no sería posible (o tendrías que recurrir a análisis menos potentes). Nos permite hacer inferencias y predicciones sobre toda la población a partir de muestras, como en sondeos, encuestas o ensayos clínicos, casos en los que la población no es siempre normal.

Sobre este teorema se sustenta gran parte de la estadística actual. Es el puente que conecta los datos experimentales con los métodos de análisis. Se trata de la herramienta que permite, aunque los datos no sean normales, tratarlos como si lo fueran, lo que a muchos estadísticos les gusta definir como “la capacidad de sacar orden a partir del desorden”.

Bibliografía

[1] Kwak SG, Kim JH. Central limit theorem: the cornerstone of modern statistics. Korean J Anesthesiol. 2017; 70(2):144-56. Disponible en: https://pubmed.ncbi.nlm.nih.gov/28367284/