3. Construir un índice

Los contenidos de esta obra forman parte de un encargo de autoría de la Universitat Oberta de Catalunya (Mas 2020) y están sujetos a la licencia de Creative Commons CC BY-SA 3.0.

En las secciones anteriores hemos descubierto que el IDH se construye a partir de tres dimensiones. Ya podemos intuir que unos valores altos en ingresos, educación y salud llevan a un IDH alto y que unos valores bajos en ingresos, educación y salud llevan a un IDH bajo. Sin embargo, aún desconocemos la forma como estas cifras se transforman en los valores finales del índice. Para poder hacer la correspondiente transformación y convertir los cuatro indicadores en una única medida, deberemos seguir los tres procedimientos principales de construcción de un índice compuesto:

En este apartado los paquetes que utilizaremos son los mismos que en el apartado anterior:

library(dplyr)
library(tidyr)
library(ggplot2)
library(countrycode)
library(readxl)
library(janitor)

Normalización

Siempre nos dicen que no podemos mezclar peras y manzanas. Esta es una expresión que se utiliza para ilustrar que no se pueden comparar cosas diferentes. Las peras se pueden comparar solo con peras y las manzanas solo con manzanas. Lo mismo pasa con los indicadores. Mezclar variables que representan unidades diferentes nos lleva a problemas de comparabilidad. Veamos un ejemplo en la Tabla 1, donde hemos sumado los diferentes indicadores que conforman el IDH en una variable que hemos denominado IDH_sum. La Suma es una de las maneras de combinar variables que hemos visto en un apartado anterior. IDH_sum es la suma de los valores GNI + E1 + E2 + LE para cada país. Según este procedimiento, el país con mejor IDH (bajo los parámetros de la variable IDH_sum) sería Catar, a pesar de tener cifras más bien discretas en educación. Brunéi y Kuwait tampoco tienen ni una educación ni una esperanza de vida altas, pero ocuparían los primeros lugares de la tabla. Esto se debe a que los valores del GNI son muy elevados en comparación con la educación o la esperanza de vida. El GNI está medido en dólares y la mayoría de los países se mueven entre varios miles. En cambio, la educación se mueve en cifras inferiores a los veinte años de escolarización y la esperanza de vida se mueve entre intervalos de varias decenas. Acabamos de mezclar peras y manzanas. Esto hace que el peso del GNI sea desproporcionado en relación con los otros indicadores, por el simple hecho de estar medido con unidades más grandes.

Table 1: IDH según la suma dels sus componentes
PcountryIDHGNIE1E2LEIDH_sum
1Catar0.85611681813.49.878.3116919.5
2Liechtenstein0.9169733614.712.580.497443.6
3Singapur0.9328250316.211.583.282613.9
4Brunéi0.8537642714.59.177.476528.0
5Kuwait0.8037052413.67.374.870619.7

Es evidente que el IDH no está construido con una simple suma de sus componentes. Tampoco las otras formas de combinar indicadores que hemos aprendido hasta ahora nos darían resultados satisfactorios. El ejemplo de la tabla 2 es todavía más claro. Arabia Saudí e Islandia son dos países con un nivel de ingresos per cápita muy parecido. Los habitantes de las dos poblaciones ganan más o menos lo mismo de media. En cambio, en educación y salud, Islandia tiene unas cifras bastante más elevadas en términos relativos que Arabia Saudí. Los islandeses han tenido más años de formación y han vivido ocho años más que los saudíes. Esto se refleja en que Islandia ocupa el sexto lugar en el ranking de 2017 si ordenamos los resultados por el IDH (columna IDH), mientras que Arabia Saudí ocupa el lugar 40. Si utilizáramos una simple suma, como vemos en IDH_sum, Arabia Saudí estaría mejor clasificada que Islandia.

Table 2: Comparación entre Islandia i Arabia Saudí
PcountryIDHGNIE1E2LEIDH_sum
6Islandia0.9354581019.312.482.945924.6
40Arabia Saudí0.8534968016.99.574.749781.1

Las cifras medidas en unidades grandes tienen mucha más fuerza en el total del índice que las cifras medidas en unidades más pequeñas. Para evitar que esto pase, tendremos que normalizar los indicadores y hacer que las variables se muevan en parámetros parecidos. La normalización convierte variables de parámetros diferentes en medidas de escala parecida, para hacerlas comparables entre ellas y poder agregarlas a un índice final. Principalmente, existen tres métodos de normalización:

MinMax

El IDH utiliza el método MinMax, que consiste en convertir los parámetros de la distribución en una escala de 0 a 1 asignando un valor mínimo y un valor máximo. Esta es la fórmula mediante la que se obtienen los valores con el método MinMax:

\[MinMax = \frac{valor - valor.minimo}{valor.maximo - valor.minimo}\]

Intentaremos ahora aplicar el método MinMax a la esperanza de vida (columna LE), de la forma como lo ha hecho el PNUD en sus notas técnicas. En la página 2 se justifica una normalización teórica de los valores, por los que se establece 85 como valor máximo de la distribución y 20 como valor mínimo. Aplicamos el método MinMax según esta información:

\[MinMax(LE) = \frac{valor(LE) - 20}{85 - 20}\]

Practica 5. Normalización de la esperanza de vida: examinad las notas técnicas del IDH y responded:

  1. ¿Cómo se justifica el máximo de esperanza de vida de 85? ¿Y el mínimo de 20?
  2. ¿Qué pasaría si un país superara la media de 85 años de esperanza de vida?

Ahora podemos aplicar esta fórmula a todos los países de la base de datos, de forma que, si un país se acerca al máximo de 85, tendrá un valor próximo a 1, mientras que, si un país se acerca al mínimo de 20, tendrá un valor próximo a 0. En la siguiente Tabla 3, hemos aplicado la fórmula en unos cuantos países de la muestra. Japón tiene un valor próximo a 1 porque tiene una esperanza de vida de 83.9, muy cerca del máximo, que es 85. Por el contrario, Sierra Leona tiene una esperanza de vida de 52.2 y recibe un índice de 0.495.

Table 3: Esperanza de vida en algunos países
countryLEMinMax_LE
Japón83.90.983
Estados Unidos79.50.915
Argentina76.70.872
República Democrática del Congo60.00.615
Sierra Leona52.20.495

Ejercicio 5. Normalización de los indicadores: buscad cuál es el valor máximo y el valor mínimo de los demás indicadores en las notas técnicas del IDH. Responded a las siguientes preguntas:

  1. ¿Cómo se justifica el mínimo y el máximo en el caso del GNI?
  2. ¿Por qué se utiliza el logaritmo neperiano en el GNI? Intentad relacionar la respuesta con la forma que toma la distribución y con la teoría utilitarista (encontraréis más información en UNDP 1990: 12; Haq 1999: 49).
  3. ¿Cómo se justifica el mínimo y el máximo en el caso de la media de años en la escuela para adultos de 25 años o más?
  4. ¿Y cómo se justifica en el caso de los años esperados de educación para niños en edad de entrar a la escuela?

Con el mínimo y el máximo que el PNUD establece para cada indicador, ya podemos normalizarlos aplicando a cada uno de ellos la fórmula que les corresponde. En el caso del GNI, el valor máximo son 75.000 dólares, y el valor mínimo 100 dólares. Por lo tanto, si un país es muy pobre y de media sus habitantes ganan 100 dólares al año, le asignaremos un valor 0, y si un país es muy rico y de media sus habitantes ganan 75.000 dólares al año, le asignaremos un valor 1. El resto de los países oscilarán entre 0 a 1 en función de estos valores mínimo y máximo. El cálculo del GNI se hace mediante el logaritmo neperiano, de forma que los incrementos de renta en valores bajos son más sensibles al índice que los incrementos de renta en valores altos. En la dimensión de la educación, debemos tener presente que hay dos variables: la media de años de escolarización y la escolarización esperada.

La Tabla 4 representa el resultado de aplicar el código que encontramos a continuación en el objeto hdi_t. Hemos repetido los países seleccionados en la tabla anterior y hemos aplicado el método MinMax a los cuatro indicadores. Podéis observar también que hemos mantenido una columna con el IDH original (columna IDH) y hemos creado nuestro propio IDH (le llamamos IDH2) a partir de la media de los indicadores normalizados1. Tendríamos que esperar que los valores de la columna IDH coincidan con la columna IDH2 que hemos creado nosotros (aviso: veréis que no coinciden). Para ser fieles al sistema IDH, también hemos redondeado las cifras resultantes a tres decimales con la función round().

hdi_t <- hdi %>%
  mutate(GNI_MM = if_else(GNI > 75000, 1, round((log(GNI) - log(100)) / (log(75000) - log(100)), 3)),
         E1_MM = if_else(E1 > 18, 1, round(((E1 - 0) / (18 - 0)), 3)),
         E2_MM = if_else(E2 > 15, 1, round((E2 - 0) / (15 - 0), 3)),
         LE_MM = round((LE - 20) / (85 - 20), 3),
         IDH2 = round((GNI_MM + E1_MM + E2_MM + LE_MM) / 4, 3))
hdi_t %>%
  select(country, GNI_MM, E1_MM, E2_MM, LE_MM, IDH2, IDH) %>%
  filter(country %in% c("Estados Unidos", "Argentina", "República Democrática del Congo", "Japón", "Sierra Leona")) %>%
  arrange(desc(IDH2))
Table 4: Esperanza de vida y esperanza de vida normalizada con MinMax
countryGNI_MME1_MME2_MMLE_MMIDH2IDH
Estados Unidos0.9530.9170.8930.9150.9190.924
Japón0.9010.8440.8530.9830.8950.909
Argentina0.7880.9670.6600.8720.8220.825
República Democrática del Congo0.3130.5440.4530.6150.4810.457
Sierra Leona0.3800.5440.2330.4950.4130.419

Las columnas GNI_MM, E1_MM, E2_MM i LE_MM nos muestran los indicadores normalizados de cada uno de los países de nuestra selección. La normalización permite convertir magnitudes diferentes en parámetros que se mueven en la misma escala. Con el método MinMax, los indicadores se mueven en escala de 0 a 1, de forma que nos resulta más fácil compararlos entre ellos y mezclar peras y manzanas. En la columna IDH2 se muestra la media de los cuatro indicadores2. Si la comparamos con el IDH real (columna IDH), vemos que los valores son parecidos entre columnas pero no coinciden exactamente. Esto quiere decir que todavía nos falta algún procedimiento más por hacer. En concreto, todavía tenemos que ver cómo se ponderan y se agregan las variables del índice.

Practica 6. Cambio de mínimos y máximos: observad atentamente el código que hemos generado para crear el objeto hdi_t. Veréis que dentro de la función mutate() hemos establecido las normalizaciones para cada indicador:

  1. Cambiad el GNI_MM a un mínimo de 250 y un máximo de 100000.
  2. Cambiad LE_MM a un mínimo de 35 y un máximo de 90.
  3. Observad los resultados para los mismos países. Cómo han cambiado los valores?

Antes de seguir con los pasos de construcción de un índice con los métodos de ponderación y agregación, veremos otras maneras de establecer los valores mínimo y máximo con el método MinMax y también veremos otros métodos de normalización diferentes al MinMax. Hasta ahora os hemos explicado que el PNUD ha utilizado una normalización teórica. Cuando normalizamos teóricamente, estamos usando alguna razón concreta basada en supuestos teóricos para justificar los valores mínimos y máximos de los indicadores. Establecemos que un número concreto será el mínimo y otro número será el valor máximo y les asignamos los valores 0 y 1.

La otra opción que tenemos es la normalización empírica. Cuando normalizamos empíricamente, cogemos el mínimo y el máximo de los valores que tenemos en nuestra distribución para normalizar. No establecemos ningún valor a priori, sino que simplemente tomamos como referencia el valor máximo y el mínimo de nuestros datos y les asignamos los valores 0 y 1. El resto de los valores se moverán entre estos intervalos.

En la siguiente Tabla 5, hemos normalizado empíricamente los cuatro indicadores del IDH y hemos seleccionado los países que tienen el valor máximo y el valor mínimo de cada indicador, así como los que tienen el valor máximo y el valor mínimo en el IDH2t que anteriormente hemos normalizado teóricamente y el IDHe que acabamos de normalizar empíricamente.

Table 5: Normalización empírica del IDH
countryGNI_MMeE1_MMeE2_MMeLE_MMeIDH2tIDH2e
Australia0.8091.0000.9050.9690.9370.921
Noruega0.8950.7220.8810.9440.9440.861
Alemania0.8200.6721.0000.9090.9380.850
RAE de Hong Kong (China)0.8660.6330.8331.0000.9130.833
Catar1.0000.4720.6590.8180.8240.737
Burkina Faso0.1760.2000.0000.2700.4060.162
Sierra Leona0.1210.2720.1590.0000.4130.138
Sudán del Sur0.0720.0000.2620.1600.3770.124
Níger0.0600.0280.0400.2570.3470.096
República Centroafricana0.0000.1280.2220.0220.3700.093

Practica 7. Diferencias entre normalización teórica y empírica: fijaos en la Tabla 5 y comparad los resultados con las tablas que hemos visto anteriormente. Responded a las siguientes preguntas:

  1. ¿Por qué Catar tiene asignado el valor 1 en la columna GNI_MMe? ¿Por qué la República Centroafricana tiene asignado el valor 0?

Ejercicio 6. Diferencias entre normalización teórica y empírica: fijaos en la Tabla 5 y comparad los resultados con las tablas que hemos visto anteriormente. Responded a las siguientes preguntas:

  1. Buscad los valores máximo y mínimo de los indicadores E1_MMe, E2_MMe y LE_MMe e intentad encontrar su valor antes de normalizar. ¿Cuál es la diferencia entre el máximo y mínimo teórico y empírico en cada caso?
  2. En las dos últimas columnas (IDH2t e IDH2e), podemos observar la diferencia entre el resultado de normalizar teóricamente y normalizar empíricamente. Veréis que hay países donde la diferencia entre el IDH2t y el IDH2e es muy pequeña. En cambio, en otros países la diferencia es muy grande. ¿Por qué creéis que existen estas diferencias entre IDH2t e IDH2e?

En código de R, para establecer un método MinMax empírico se haría lo siguiente: (x - min(x)) / (max(x) - min(x)). Esta función localiza el valor mínimo y el valor máximo de la distribución, de forma que todos los valores oscilarán entre estos dos extremos. Por ejemplo, si el valor máximo fuera 50 y el mínimo 10, el valor 25 se normalizaría de la siguiente forma: (25 - 10) / (50 - 10) = 15 / 40 = 0.375. Para un MinMax teórico, tienen que sustituirse los máximos y los mínimos por los valores que establezcamos teóricamente.

Ejercicio 7. MinMax empírico: probad a hacer un MinMax empírico de una variable incluida en el marco de datos hddata_tidy que no hayamos usado para construir el IDH.

  1. Consultad la lista de variables con names(hddata_tidy).
  2. En el siguiente código, sustituye todos los lugares donde aparece la x por el nombre de la variable y crea el marco de datos minmax:
minmax <- hddata_tidy %>%
  filter(!is.na(x)) %>% #eliminamos datos perdidos
  mutate(indice = round((x - min(x)) / (max(x) - min(x)), 3)) %>%
  select(country_name, year, indice) %>%
  arrange(desc(indice))
head(minmax)
tail(minmax)
  1. Haced una descripción de los valores más altos y los valores más bajos con head() y tail().

ZScores

El método ZScores tiene una lógica diferente al MinMax, puesto que los puntos de referencia clave para construir el indicador no son el valor máximo y el valor mínimo, sino la media y la desviación típica de la distribución3. Este método de normalización establece como valor 0 la media de nuestra muestra, mientras que todos los casos varían en función de su posición respecto a la media, teniendo en cuenta la desviación típica.

\[ZScores = \frac{valor - media}{desviacion.tipica}\]

Practica 8. Prueba con ZScores: para ver cómo funciona el numerador de ZScores, crearemos el vector ex1 con el código: ex1 <- sample(10, replace = TRUE). Este código genera una distribución aleatoria de valores comprendidos entre 1 y 10.

  1. Una vez hayáis creado el vector, en primer lugar, visualizad el vector tecleando ex1 y observad cuál es la media con mean(ex1).
  2. A continuación, aplicad al vector la fórmula ex1 - mean(ex1), que restará cada valor de ex1 por la media de la distribución. Comparad los valores de ex1 con los de la fórmula y decid cuáles tienen signo negativo y cuáles lo tienen positivo. Sacad las conclusiones pertinentes.

El siguiente paso para normalizar con ZScores será dividir cada valor por la desviación típica de la distribución. La desviación típica nos dice cuán dispersos están los valores respecto a la media según las unidades con las que están medidos los valores de la distribución. Es decir, ZScores divide el numerador por un denominador pequeño (la desviación típica) si los valores de la distribución están muy cerca de la media o tienen valores pequeños, mientras que dividirá el numerador por un denominador mayor si los valores de la distribución están más alejados de la media o tienen valores mayores.

Practica 9. Comprender la desviación típica: en este ejercicio hemos creado dos distribuciones, displ y closel, que tienen el mismo rango; el valor más pequeño es 1 y el mayor es 20.

  1. Aplicad la función mean() y observaréis cómo las dos distribuciones tienen la misma media. ¿Sabríais decir cuál es?
displ <- c(1,2,3,10,15,19,20)
closel <- c(1,7,9,10,11,12,20)
  1. Fijaos, sin embargo, que una distribución tiene valores más próximos a la media que la otra. Esto lo veréis más claramente si aplicáis la función plot() como se muestra en el código siguiente (tendréis que seleccionar a la vez la línea de código de plot y la de points para visualizarlo correctamente).
plot(displ, closel)
points(mean(displ), mean(closel), col = "red")
  1. Esta diferencia de distancias con la media se traduce con una desviación típica diferente: la distribución con los números más alejados tendrá una desviación típica más alta y la distribución con los números más próximos tendrá una desviación típica más baja.
  2. Probad a completar la normalización de displ y closel con ZScores, como indicamos a continuación. ¿Sabríais interpretar por qué los valores extremos (1 y 20) quedan más reducidos en displ que en closel?
(displ - mean(displ))/sd(displ) 
(closel - mean(closel))/sd(closel) 
  1. Cread ahora los objetos displb y closeb, en los que multiplicáis por 10 cada valor del objeto anterior y repetid todo el procedimiento del ejercicio. ¿Sabríais interpretar los resultados?
displb <- displ * 10
closelb <- closel * 10

En el siguiente código, hemos aplicado la normalización de los indicadores del IDH con ZScores (x - mean(x)) /sd(x)) para crear el marco de datos hdi_ZS. En la siguiente Tabla 6, observamos los países que tienen los valores más extremos de cada indicador, así como el país que tiene el IDH más próximo a la media.

hdi_ZS <- hdi_t %>%
  mutate(GNI_ZS = round((log(GNI) - mean(log(GNI))) /sd(log(GNI)), 3),
         E1_ZS = round((E1 - mean(E1)) / (sd(E1)), 3),
         E2_ZS = round((E2 - mean(E2)) / (sd(E2)), 3),
         LE_ZS = round((LE - mean(LE)) / (sd(LE)), 3),
         IDHZS = round((GNI_ZS + E1_ZS + E2_ZS + LE_ZS) / 4, 3)) %>%
  select(country, GNI_ZS, E1_ZS, E2_ZS, LE_ZS, IDHZS)
Table 6: Países con indicadores más extremos con ZScores
countryGNI_ZSE1_ZSE2_ZSLE_ZSIDHZS
Australia1.2383.2831.4031.4331.839
Alemania1.2861.2751.7901.1841.384
RAE de Hong Kong (China)1.4831.0361.1131.5641.299
Catar2.0590.0490.4030.8040.829
Belice-0.263-0.1550.629-0.2040.002
Burkina Faso-1.485-1.619-2.276-1.487-1.717
Sierra Leona-1.723-1.177-1.630-2.614-1.786
Sudán del Sur-1.934-2.845-1.211-1.946-1.984
República Centroafricana-2.244-2.062-1.372-2.522-2.050
Níger-1.984-2.674-2.115-1.540-2.078

Practica 10. Máximos y mínimos con ZScores: identificad cuál es la media de cada columna con summary(hdi_ZS) (el resultado tendría que ser obvio). Fijaos en la Tabla 6 e identificad:

  1. El país que se encuentra más próximo a la media en cada indicador.
  2. Los países que se encuentran por encima de la media en cada indicador.
  3. Los países que se encuentran por debajo de la media en cada indicador.
  4. Los países que tienen un valor máximo y un valor mínimo en cada indicador.
  5. El país que se encuentra más alejado de la media.

Fijaos que la normalización con ZScores solo puede ser empírica, puesto que los dos puntos de la distribución que necesitamos para normalizar (la media y la desviación típica) vienen marcados por los datos, no por la teoría. Esto quiere decir que no elegimos cómo normalizar a partir de ningún razonamiento conceptual o teórico, sino que lo hacemos a partir de la sustancia empírica que tenemos disponible.

Escala

El método Escala consiste en ordenar los valores de la distribución en un ranking. Al valor más alto se le asignará el valor 1, mientras que al valor más bajo se le asignará el valor 0. El resto de los valores variarán entre 1 y 0 y se normalizarán en función de la posición que ocupan en el ranking. A diferencia del MinMax, el método Escala no tiene en cuenta la distancia de un determinado valor respecto al valor máximo y el valor mínimo, sino que solo tiene en cuenta cuál es la posición que ocupa cada valor en la distribución ordenada. Así, en una distribución con 5 casos, el valor más alto recibiría el valor 1, el segundo valor más alto 0.75, el tercero 0.50, el cuarto 0.25 y el valor más bajo 0. Todos los valores normalizados tienen la misma distancia entre sí independientemente de cuán cerca o lejos estuvieran los valores en la distribución original. El método Escala divide el intervalo entre 0 y 1 con tantas partes como observaciones tengamos a nuestra distribución y asigna a cada observación un lugar en función de su posición en el ranking. Esto quiere decir que una observación tendrá la misma distancia con la observación de delante y la observación de detrás.

\[Escala = \frac{puesto.ranking}{num.paises}\] Trasladado a código R, la forma para normalizar según el método de Escala es percent_rank(). También existen funciones que aplican algunas variantes. Podéis consultarlas con ?ranking.

Practica 11. Normalización con Escala: normalizad las distribuciones del siguiente código aplicando el método Escala con percent_rank() (ejemplo: percent_rank(one)):

  1. ¿Cómo se normaliza cuando tenemos 11 valores? ¿Y cuando tenemos 2?
  2. ¿Cuál es el problema lógico que surge cuando tenemos varios valores iguales en una misma variable? ¿Cómo lo resuelve R por defecto?
  3. Observad la normalización en los objetos four y five. ¿El cambio de magnitud de uno de los valores altera la normalización en Escala? ¿Lo haría en la normalización en MinMax? Haced la prueba con los dos métodos.
one <- c(0, 10, 20, 30, 40, 50, 60, 70, 80, 90, 100)
two <- c(0, 1, 2, 3, 5, 5, 5, 7, 8, 9, 10)
three <- c(1, 2)
four <- c(1, 2, 3, 4, 5, 6)
five <- c(1, 2, 3, 4, 5, 60000)

En el siguiente código, hemos normalizado los valores originales del IDH con el método Escala y hemos creado el objeto hdi_ES. A continuación, hemos generado la Tabla 7 con las primeras diez observaciones del marco de datos. Fijaos que el país con los valores más altos de cada columna tiene asignado el valor 1, el segundo el valor 0.995, el tercero el valor 0.989, el cuarto el valor 0.984, y así sucesivamente. Esto significa que, en este caso, el intervalo que separa cada una de las posiciones del ranking es de entre 0.005 y 0.006.

hdi_ES <- hdi_t %>%
  mutate(GNI_ES = round((percent_rank(log(GNI))), 3),
         E1_ES = round((percent_rank(E1)), 3),
         E2_ES = round((percent_rank(E2)), 3),
         LE_ES = round((percent_rank(LE)), 3),
         IDHES = round((GNI_ES + E1_ES + E2_ES + LE_ES) / 4, 3)) %>%
  select(P, country, GNI_ES, E1_ES, E2_ES, LE_ES, IDHES) %>%
  arrange(desc(IDHES)) %>%
  mutate(P = 1:n(),
         IDHES = round((percent_rank(IDHES)), 3))
Table 7: Primeras observaciones del IDH según la normalización con Escala
PcountryGNI_ESE1_ESE2_ESLE_ESIDHES
1Australia0.8941.0000.9630.9681.000
2Noruega0.9730.9570.9260.9310.995
3Suiza0.9520.8460.9890.9890.989
4Islandia0.9040.9840.8880.9630.984
5Irlanda0.9410.9890.9040.8940.979
6Suecia0.9200.9470.8880.9470.973
7Alemania0.9100.9201.0000.8670.968
8Dinamarca0.9310.9790.9260.8510.963
9Canadá0.8880.8720.9840.9410.957
10Países Bajos0.9260.9680.8620.9150.952

Ejercicio 8. El top 10 del ranking con Escala: observad atentamente la Tabla 7 y responded a las siguientes preguntas:

  1. ¿Qué valor normalizado recibe el país mejor clasificado? ¿Y el segundo? Haced una lista de los quince primeros valores que reciben los países mejor clasificados. Es posible que algunos valores no figuren en la tabla y tengáis que deducirlo.
  2. ¿Cuál es exactamente el intervalo que separa cada observación en el ranking de Escala? Podéis calcularlo con una división.
Por último, comprobaremos cómo cambia de índice según los diferentes métodos de normalización que hemos aprendido. En la Tabla 8, podemos observar la posición que ocupan los países con un IDH más elevado según los diferentes métodos de normalización que hemos visto (MinMax teórico, MinMax empírico, ZScores y Escala). Vemos que Noruega ocuparía el primer lugar si normalizáramos según los procedimientos del PNUD (que utiliza MinMax y decide los mínimos y los máximos de forma teórica), mientras que ocuparía entre el segundo y el cuarto lugar según los otros métodos de normalización. Australia, en cambio, tercera en la columna IDH2t, ocuparía el primer lugar en los demás.
Table 8: Puesto del ranking del IDH según los tres tipos de normalización
countryIDH2tIDH2eIDHZSIDHES
Noruega1442
Alemania2777
Australia3111
Irlanda4225
Suiza5583
Islandia6334
Dinamarca7658
Países Bajos8111110
Suecia99106
Reino Unido10151211

Esta última tabla nos ayuda a reflexionar sobre la conclusión más importante de este apartado: la posición que ocupa cada una de las observaciones ordenadas en un ranking es sensible al método de normalización escogido. Normalizar es un paso necesario en la construcción de un índice, pero también distorsiona el valor que recibirá cada observación. Es importante, entonces, que justifiquemos muy bien los motivos por los que elegimos un método de normalización y no otro.4

Ponderación

Una vez hemos visto todas las diferentes técnicas de normalización, tenemos que avanzar al próximo paso, que es la ponderación. Anteriormente, ya hemos comprobado que con la normalización no tenemos suficiente para saber cómo el PNUD ha calculado el IDH. Esto puede ser debido a que no todas las variables tienen el mismo peso en la confección del índice. Cuando ponderamos, asignamos pesos diferentes a los indicadores que conforman el índice. Hasta ahora hemos considerado que las cuatro variables tenían la misma importancia, de forma que cada indicador valía un 25 % en el cálculo del índice final. Alternativamente, podemos considerar que algunos indicadores son más importantes que otros y por eso deben tener más peso. A la hora de decidir qué ponderación aplicamos a los indicadores, acostumbramos a utilizar dos criterios:

  • Ponderación teórica: ligado a la conceptualización, puesto que, según cómo hayamos definido el objeto en cuestión, podemos pensar que hay partes que valen más que otras.
  • Ponderación empírica: ligado al significado empírico de los datos de los que disponemos.

Ponderación teórica

La ponderación teórica de los indicadores se fundamenta a partir de la conceptualización que hemos hecho de aquello que estamos midiendo. En la conceptualización del IDH, por ejemplo, se argumenta que el desarrollo humano está formado por tres dimensiones principales: la educación, los ingresos y la salud. Además, también dice que no hay ninguna parte que sea más importante que la otra. Esto significa que, a la hora de establecer pesos, cada dimensión valdrá lo mismo.

El IDH está ponderado con cimientos teóricos. Si repasamos algunas de las teorizaciones principales sobre el desarrollo humano, encontraremos páginas y páginas justificando, en primer lugar, qué entienden por desarrollo humano y, en segundo lugar, cuáles pueden ser unas buenas medidas del desarrollo humano (Sen 1981; UNDP 1990; Haq 1999). En su teoría de las capacidades, Sen explicaba que las personas no solo deben tener capacidad económica, sino también la capacidad de transformar recursos en actividades valiosas (esto nos lo puede facilitar la educación), así como la capacidad de hacer cosas con su tiempo libre (por lo tanto, tendrán que disfrutar de buena salud).

Así pues, el IDH tendría que constar de tres dimensiones que a priori deberían tener el mismo peso entre ellas: ingresos, educación y salud. Por lo tanto, deberemos ponderar los cuatro indicadores que tenemos para obtener tres dimensiones con el mismo peso cada una. Hasta ahora hemos hecho una simple suma y, como teníamos cuatro indicadores, cada indicador representaba un 25 % del valor total del IDH. Como resulta que cada dimensión representa un tercio del índice, la ponderación teórica tendría que ser de la siguiente manera:

  • Ingresos: la dimensión valdrá un tercio del índice y estará formada por el indicador GNI per cápita.
  • Educación: la dimensión valdrá un tercio del índice y estará formada por los indicadores educación esperada y educación media. Por lo tanto, cada uno de estos indicadores valdrá una sexta parte del índice final.
  • Sanidad: la dimensión valdrá un tercio del índice y estará formada por la variable esperanza de vida.
IngresosEducaciónSalud
GNIEd. esperada — Ed. mediaEsperanza vida
Sin ponderación25%25 % —— 25 %25 %
Con ponderación33.3%16.6 % —— 16.6 %33.3 %

Con esta información, ya podemos ponderar las variables del IDH para que todas las dimensiones cuenten un tercio sobre el índice final. Si lo miramos desde la perspectiva de las variables, la variable que conforma la dimensión de ingresos contará un tercio sobre el índice final, las dos variables de educación contarán una sexta parte del índice final y la variable que conforma la dimensión de sanidad contará un tercio sobre el índice final. En la siguiente Tabla 9, vemos el resultado, donde observamos los cinco países mejor puntuados y los cinco peor puntuados. Hemos creado la columna E_MM, que es la media de las dos variables de educación ((E1_MM+E2_MM)/2). La columna IDHp nos muestra la ponderación que hemos aplicado, mientras que la columna IDH nos muestra el IDH tal como está calculado por el PNUD (aviso: veréis que no coinciden).

Table 9: IDH con MinMax y ponderación teórica
PcountryGNI_MME_MMLE_MMIDHpIDH
1Noruega0.9850.9170.9580.9530.953
2Suiza0.9600.8970.9770.9450.944
3Australia0.9180.9300.9710.9400.939
4Irlanda0.9500.9160.9480.9380.938
5Alemania0.9270.9420.9420.9370.936
184Sierra Leona0.3800.3880.4950.4210.419
185Burundi0.2940.4250.5830.4340.417
186Chad0.4320.2980.5110.4140.404
187Sudán del Sur0.3420.2960.5740.4040.388
188República Centroafricana0.2860.3440.5060.3790.367
189Níger0.3330.2160.6220.3900.354

Ejercicio 9. Ponderación teórica: observad las columnas IDH e IDHp de la Tabla 9. Veréis que nuestro cálculo del IDH no es exactamente igual que el cálculo del PNUD.

  1. Fijaos que estas diferencias obedecen a ciertos patrones en las variables. Un patrón sería, por ejemplo, que «cuando la variable X es muy baja la columna IDH siempre es inferior a la columna IDHp».
  2. ¿Sabríais encontrar patrones comunes que os ayuden a identificar el porqué de estas diferencias? Pista: se pueden establecer hasta tres patrones.

Como veis, después de normalizar los indicadores del IDH y ponderarlos con los métodos apropiados, todavía no hemos conseguido replicar los valores finales del índice. Esto se debe a que el IDH tiene algún otro mecanismo por el que penaliza los valores bajos. Este efecto se nota menos en los países mejor clasificados en la tabla, puesto que tienen valores muy parecidos en las tres dimensiones. En cambio, es más frecuente encontrar valores dispares entre los países clasificados en la parte media y baja del ranking del IDH. Estos son los más penalizados en el índice final. Cuando estudiemos el último paso, la agregación, veremos cuál es este mecanismo de penalización y por qué se aplica así.

Ponderación empírica

La ponderación teórica que hemos visto hasta ahora va de la teoría a los datos: hacemos un razonamiento teórico y pensamos qué tiene sentido desde un punto de vista conceptual, establecemos las dimensiones del concepto y lo trasladamos a los datos, como lo hemos hecho en el apartado anterior. La ponderación empírica, en cambio, obvia el ejercicio teórico y se mueve solo en el terreno de los datos. En otras palabras, deja que los datos hablen y nos digan qué tiene sentido desde el punto de vista empírico.

La ponderación empírica requiere normalmente utilizar algunos procedimientos estadísticos más sofisticados, que escapan al objetivo de esta obra. Por lo tanto, no los entraremos a analizar con mucho detalle. La idea clave de este tipo de ponderación está asociada con el significado empírico de sus indicadores: dos variables tienen el mismo significado empírico cuando los valores de una variable varían exactamente igual que los valores de la otra. Desde este punto de vista, parece razonable que, si nos están diciendo exactamente lo mismo, no tenga demasiado sentido que formen parte de dimensiones diferentes.

Ejemplo: el índice FIIEI Imaginémonos que estamos creando un «índice de aprovechamiento de la asignatura de Fuentes de información e indicadores para estudios internacionales» y seleccionamos tres indicadores: nota obtenida en la asignatura, horas dedicadas y consultas hechas en el foro. Podemos pensar que cuanto más elevada sea la nota obtenida, más horas se hayan dedicado y más consultas se hayan hecho en el foro, más se habrá aprovechado la asignatura por parte del estudiante y más alto será el índice. Cuando miramos los datos de cada estudiante, resulta que encontramos una relación perfecta entre nota obtenida y horas dedicadas: los estudiantes que han dedicado 10 horas han sacado un 10, los que han dedicado 9 horas han sacado un 9, etc. Esto debe de querer decir que empíricamente los dos indicadores nos están diciendo lo mismo: nos indican con la misma exactitud una dimensión del concepto. Esta dimensión subyacente podría ser, por ejemplo, el esfuerzo.

En cambio, es posible que las consultas hechas al foro tengan una correlación más débil con la primera dimensión. Suponemos que el estudiante que mejor nota ha sacado ha hecho cinco consultas al foro, mientras otros estudiantes han hecho las mismas consultas y han sacado menos nota. Es evidente que la participación en la asignatura es un aspecto importante del «aprovechamiento» de esta. Pero también es evidente que los datos nos dicen que no estamos midiendo el mismo fenómeno. Podemos considerar, por tanto, que tenemos dimensiones empíricas diferentes y que no deben tener el mismo peso en el índice final.

La forma como atribuimos los pesos puede variar según el criterio que utilicemos. Por ejemplo, podemos considerar que los dos primeros indicadores formarán parte de una misma dimensión, que contará la mitad del índice. El otro indicador formará parte de una dimensión diferente y será la otra mitad del valor del índice.

El IDH no utiliza la ponderación empírica, y los procedimientos para ponderar empíricamente escapan a los objetivos de esta obra. Si queréis saber más, podéis consultar técnicas como el análisis factorial (en inglés, factor analysis) y el análisis de los componentes principales (en inglés, Principal Components Analysis, o PCA)5. Estas técnicas utilizan la varianza de las combinaciones lineales de los diferentes indicadores para determinar los pesos, a partir de la extracción de los factores o componentes subyacentes6. En el manual de construcción de indicadores de la OCDE, podemos encontrar un buen ejemplo de cómo se construye un índice mediante el PCA (OECD 2008: 63-72).

Agregación

La agregación es el método que usamos para combinar las variables en el índice final. Las dos maneras más comunes son con una simple suma o, como hemos hecho hasta ahora, con la media aritmética de sus valores. Veámoslo en el siguiente código, donde hemos creado el marco de datos df_agr de cuatro observaciones y tres variables: los indicadores indicador1, indicador2 e indicador3. A partir de este marco de datos, hemos creado la Tabla 10.

df_agr <- data.frame(obs = c("A", "B", "C", "D"),
           indicador1 = c(0.95, 0.2, 0.5, 1),
           indicador2 = c(0, 0.7, 0.5, 0.85),
           indicador3 = c(0.8, 0.75, 0.5, 0.70))
Table 10: Tres indicadores
obsindicador1indicador2indicador3
A0.950.000.80
B0.200.700.75
C0.500.500.50
D1.000.850.70

¿Cómo agregamos los tres indicadores? Estudiaremos tres maneras de agregación: la suma, la media aritmética y la media geométrica.

  • La suma es la simple suma de sus valores. Raramente utilizaremos este método, porque perderemos la escala de los valores (ya no estamos entre 0 y 1).

\[Suma = V1 + V2 + V3 + ... Vn\]

  • La media aritmética es la media que conocemos, que suma los valores de cada indicador y divide el resultado por el número de indicadores.

\[Media.aritmética = \frac{V1 + V2 + V3 + ... Vn}{N}\]

  • La media geométrica multiplica los valores de cada indicador y aplica la raíz del número de casos al resultado final.

\[Media.geométrica = \sqrt[n]{V1 * V2 * V3 *... Vn}\]

En el siguiente código, hemos aplicado las tres agregaciones diferentes a los indicadores del marco de datos df_agr. El resultado es la Tabla 11.

df_agr %>%
  mutate(Sum = round(indicador1 + indicador2 + indicador3, 2),
         ArMean = round((indicador1 + indicador2 + indicador3)/3, 2),
         GeoMean = round((indicador1 * indicador2 * indicador3)^(1/3), 2))
Table 11: Diferentes agregaciones con tres indicadores normalizados
obsindicador1indicador2indicador3SumArMeanGeoMean
A0.950.000.801.750.580.00
B0.200.700.751.650.550.47
C0.500.500.501.500.500.50
D1.000.850.702.550.850.84

Como podéis comprobar, la observación D es la que tiene un valor más alto en el índice final, sea cual sea el tipo de agregación. Ahora bien, en las otras observaciones hay más discrepancias. Ya os avanzamos que la suma es una operación que haremos en raras ocasiones. Por lo tanto, nos centraremos en observar las diferencias entre la media aritmética y geométrica:

  • Lo que más llama la atención es que, según la media aritmética, el segundo valor más alto sería A, seguido de B y C. En cambio, según la media geométrica, el segundo valor más alto sería C, seguido de B y A.

  • Esto se debe a que la media geométrica penaliza los valores bajos. En la observación B, el valor 0.20 penaliza de forma importante la media geométrica en relación con la aritmética. El caso extremo es cuando hay presencia del valor cero, que hará que el índice final también sea cero.

  • La media geométrica es problemática cuando tenemos valores cero o números negativos. Por lo tanto, si queremos aplicar la media geométrica, la normalización tendrá que ser muy probablemente teórica con el método MinMax, parecida a la del IDH, porque así podremos evitar valores cero y valores negativos.

Practica 12. Media geométrica: para ver las diferencias entre la media geométrica y la media aritmética, realizad los siguientes ejercicios:

  1. Ejecutad este código para tener el resultado de aplicar la media aritmética y la media geométrica a los valores 100, 100 y 100. Probad a realizar las mismas operaciones con los valores 50, 100 y 150.
(100 + 100 + 100) / 3
(100 * 100 * 100)^(1/3)
  1. Ejecutad este código para tener el resultado de aplicar la media aritmética y la media geométrica a los valores 40, 100 y -20.
(40 + 100 + -20) / 3
(40 * 100 * -20)^(1/3)

El IDH agrega sus indicadores utilizando la media geométrica. Los constructores del índice creyeron oportuno penalizar intencionadamente los valores bajos, de forma que, si un país tiene alguna dimensión muy baja, quedará fuertemente perjudicado en su IDH final. Para observar qué efecto tiene esta circunstancia en varios países del ranking, en la Tabla 12 hemos seleccionado los países que tienen menos variación entre los indicadores que conforman el IDH y los que tienen más variación, calculados a partir de la desviación típica. También hemos incluido la posición que ocupan en el ranking de 2018. Los diez primeros países de la tabla son los que tienen menos diferencia numérica entre las dimensiones, y esto se traduce en una penalización prácticamente imperceptible en su IDH. En cambio, los diez últimos países tienen, como mínimo, un valor bajo, que penaliza considerablemente su índice.

Table 12: Pérdida de IDH con media geométrica
PcountryGNILEEDIDH
5Alemania0.9270.9420.9420.936
11Dinamarca0.9320.9370.9200.929
159Lesoto0.5260.5320.5040.520
30Estonia0.8560.8880.8710.871
41Letonia0.8340.8420.8660.847
4Irlanda0.9500.9480.9170.938
36Lituania0.8530.8430.8810.858
27Chequia0.8650.9060.8930.888
38Eslovaquia0.8590.8770.8330.855
10Países Bajos0.9320.9540.9070.931
167Sudán0.5620.6880.3290.502
164Senegal0.4790.7310.3690.505
56Kuwait0.9910.8430.6210.803
181Liberia0.2870.6620.4340.435
152Islas Salomón0.4430.7850.4670.546
178Yemen0.3800.6950.3500.452
173Etiopía0.4300.7060.3260.463
155Siria0.4760.7850.4140.536
189Níger0.3330.6220.2170.354
179Eritrea0.4320.7000.2830.440

En la tabla 13, hemos querido hacer una operación parecida a la anterior, pero comparando los valores obtenidos según la media aritmética (IDH_aritm) y según la media geométrica (IDH_geom). La última columna muestra la diferencia entre el valor final del IDH calculado por una media y por la otra.

Table 13: Diferencia entre media geométrica y aritmética
PcountryGNILEEDIDH_aritmIDH_geomdiff
1Noruega0.9850.9580.9170.9530.9530.000
4Irlanda0.9500.9480.9170.9380.9380.000
5Alemania0.9270.9420.9420.9370.9370.000
8Suecia0.9320.9630.9020.9320.9320.000
10Países Bajos0.9320.9540.9070.9310.9310.000
11Dinamarca0.9320.9370.9200.9300.9300.000
12Canadá0.9170.9620.8990.9260.9260.000
13Estados Unidos0.9530.9150.9050.9240.9240.000
14Reino Unido0.9020.9490.9130.9210.9210.000
15Finlandia0.9090.9460.9020.9190.9190.000
164Senegal0.4790.7310.3690.5260.506-0.020
155Siria0.4760.7850.4140.5580.537-0.021
183Burkina Faso0.4230.6280.2860.4460.424-0.022
178Yemen0.3800.6950.3500.4750.452-0.023
167Sudán0.5620.6880.3290.5260.503-0.023
172Yibuti0.5320.6550.3090.4990.476-0.023
173Etiopía0.4300.7060.3260.4870.463-0.024
181Liberia0.2870.6620.4340.4610.435-0.026
179Eritrea0.4320.7000.2830.4720.441-0.031
189Níger0.3330.6220.2170.3910.356-0.035

Los tres procedimientos unidos

El resumen de todo este apartado lo encontramos en el siguiente código, que sirve para generar la Tabla 14. El código muestra cómo calculamos el IDH a partir de las variables originales del marco de datos hdi. Observad que con pocas líneas de código podemos normalizar, ponderar y agregar los datos iniciales para generar el nuevo marco de datos del IDH, que hemos denominado hdi17:

  1. Normalizamos las variables GNI, E1, E2 y LE.
  2. En la normalización de la educación, aprovechamos para agregar las variables E1 y E2 a la dimensión ED, de forma que nos quedamos con las tres dimensiones: GNI, ED y LE.
  3. Agregamos los indicadores GNI, ED y LE con media geométrica para crear la variable IDH2.
  4. Guardamos los resultados como el objeto hdi17, puesto que los resultados corresponden al año 2017, y pedimos las diez primeras filas.
hdi17 <- hdi %>%
  mutate(GNI = if_else(GNI > 75000, 1, round((log(GNI) - log(100)) / (log(75000) - log(100)), 3)), #normalizamos el GNI
         ED = round((if_else(E1 > 18, 1, E1 / 18) + #normalizamos y agregamos/ponderamos ED (suma E1 y E2)
              if_else(E2 > 15, 1, E2 / 15)) / 2, 3),   
         LE = round((LE - 20) / (85 - 20), 3), #normalizamos LE
         IDH2 = round((GNI * ED * LE)^(1/3), 3)) %>% #agregación
  select(P, country, IDH, GNI, LE, ED, IDH) #seleccionamos les columnas que queremos mostrar

head(hdi17, 10) #pedimos las primeras 10 filas
Table 14: Índice de desarrollo humano 2018
PcountryIDHGNILEED
1Noruega0.9530.9850.9580.917
2Suiza0.9440.9600.9770.897
3Australia0.9390.9180.9710.930
4Irlanda0.9380.9500.9480.917
5Alemania0.9360.9270.9420.942
6Islandia0.9350.9260.9680.913
7RAE de Hong Kong (China)0.9330.9620.9860.853
8Suecia0.9330.9320.9630.902
9Singapur0.9321.0000.9720.833
10Países Bajos0.9310.9320.9540.907

Pueden ponderarse variables y pedir a la vez la media geométrica, aunque requiere una fórmula más sofisticada. La media geométrica ponderada (MGP) es la suma del logaritmo neperiano de cada variable (\(V\)) multiplicado por su ponderación (\(P\)). De este resultado, se calcula el exponencial (\(\exp\)) y se divide por la suma de las ponderaciones (\(\sum(Pn)\)):

\[MGP = \frac{\exp(\sum(log(V_1) * P_1 + log(V_2) * P_2 + ... log(V_n) * P_n))}{\sum(Pn)}\] La fórmula puede parecer complicada, pero aplicarla a R no es difícil, en especial si ya tenemos las variables normalizadas, como es el caso del marco de datos hdi17. Imaginémonos que queremos calcular la media geométrica ponderada de la siguiente manera:

  • daremos un 20 % de importancia a los ingresos (GNI),
  • daremos un 50 % de importancia a la educación (ED),
  • daremos un 30 % de importancia a la esperanza de vida (LE),
  • también tenemos que añadir la función round() para añadir tres decimales al resultado.
hdi17 %>%
  mutate(IDH_MGP = round(exp(log(GNI)*0.2 + log(ED)*0.5 + log(LE)*0.3) / 1, 3))

Tened en cuenta que en el divisor (\(\sum(Pn)\)) deberá figurar la suma de las ponderaciones. En nuestro ejemplo es 1, puesto que 0.2 + 0.5 + 0.3 = 1.

Referencias

Haq, Muhbub ul. 1999. Reflections on Human Development. Dehli: Oxford University Press.
Mas, Jordi. 2020. Les mesures compostes.” Barcelona: FUOC.
OECD. 2008. Handbook on Constructing Composite Indicators - Methodology and User Guide.”
Sen, Amartya. 1981. Public Action and the Quality of Life in Developing Countries.” Oxford Bulletin of Economics and Statistics 43 (4): 287–319.
Stanton, Elizabeth A. 2007. The Human Development Index: A History.” PERI Working Papers. Political Economy Research Institute.
UNDP. 1990. Human Development Report.” New York: United Nations Development Programme.

  1. Obtenemos la media sumando el valor de cada indicador y dividiendo el resultado por cuatro, que equivale al número de casos.↩︎

  2. También tendría sentido ser una suma, como veníamos mostrando en los últimos ejemplos, puesto que tanto la media como la suma tienen el mismo efecto aritmético sobre la agrupación de las variables.↩︎

  3. Este método de normalización es probablemente el más completo de todos los existentes, pero tiene dos problemas principales. El primero es que los resultados son menos intuitivos y a un público menos especializado puede costarle más interpretarlos. A simple vista puede ser mucho más fácil observar unos resultados que oscilan entre 1 y 0 que con positivos y negativos como hace Z-Scores. El segundo problema es que ZScores utiliza números negativos, lo que complica realizar algunas operaciones como las agregaciones geométricas.↩︎

  4. Algunos de los motivos podrían ser que MinMax o ZScores facilitan la comparabilidad entre años, que ZScores se adapta mejor a la presencia de valores extremos o que MinMax y Escala no trabajan con números negativos, por lo que serán preferibles si tenemos la necesidad de lograr alguna de las variables o queremos utilizar la agregación geométrica (algunas de estas discusiones están recogidas brevemente en (OECD 2008: 83-88)).↩︎

  5. Para saber cómo se utiliza el PCA, leed este tutorial de Luke Hayden.↩︎

  6. De hecho, el PNUD ya estudió durante los primeros años la posibilidad de ponderar empíricamente las variables, pero después de la publicación de varios estudios, en el informe de 1993 se descartó la idea (Stanton 2007).↩︎

Previous
Next