L'elefant de Milanovic

Branko Milanovic i Simon Kuznets són dos dels acadèmics més coneguts en els estudis de la desigualtat. A cada un d’ells se’l coneix per identificar una determinada trajectòria de la desigualtat en un període de temps determinat:

  • L’elefant de Milanovic: La diferencia en percentatge de guany entre la distribució per nivell d’ingressos l’any 2008 i l’any 1988 fa forma d’elefant.
  • La corba de Kuznets: A mesura que la riquesa d’un país creix amb el procés d’industrialització, en una primera fase les desigualtats creixen i en una segona fase decreixen, de manera que la relació entre creixement econòmic i desigualtats té forma de U invertida.

En aquesta pràctica observarem les trajectòries que descriu Milanovic1. En primer lloc, carregarem els paquets que necessitem.

#recordeu que els paquets han d'estar prèviament instal·lats 
library(tidyr)
library(dplyr)
library(ggplot2)

L’elefant de Milanovic

L’elefant de Milanovic és una visualització recent que descriu com ha evolucionat la desigualtat mundial en les darreres dècades. Els exercicis d’aquest apartat s’han de complementar amb el capítol 1 del llibre Global Inequality (Milanovic 2016). Per crear una reproducció semblant a la de l’elefant, en primer lloc hem de descarregar la base de dades All Ginis i observar el seu contingut. A la Taula 1 podeu consultar les primeres observacions del marc de dades all_ginis.

download.file("https://www.gc.cuny.edu/getmedia/514d5ba9-74ed-4007-a3fe-02b079705c91/LM_WPID_web_2",
              "all_ginis.dta")

#descàrrega amb el paquet foreign
library(foreign) #caldrà instal·lar el paquet foreign
all_ginis <- as_tibble(read.dta("all_ginis.dta"))

#descàrrega amb el paquet haven
library(haven) #caldrà instal·lar el paquet haven
all_ginis <- read_dta("all_ginis.dta")

DESCÀRREGA: Si no us funciona el codi de descàrrega, descarregueu l’arxiu .dta manualment, ubiqueu-lo al vostre directori de treball i canvieu-li el nom per all_ginis.dta. A continuació, utilitzeu la versió foreign o haven per convertir l’arxiu en objecte d’R.

Table 1: All ginis dataset
contcod country region year inc_con source mysample bin_year group pop RRinc RRmean cons_2005ppp_pc gdp_2005ppp_pc totpop Dno_china ventile_n RRmean_ventile_n pop_ventile_n nvals
BGD Bangladesh Other Asia 1988 C povcal 1 1988 1 10.0062320 185 444 637.7204 723.0073 100.062320 1 1 188.2125 158.266 1
IND-U India India 1987 C povcal 1 1988 1 20.9592464 210 611 NA NA 209.592464 1 1 188.2125 158.266 0
UZB Uzbekistan Russia, C. Asia, SE Europe 1988 I wyd 1 1988 1 1.9561180 203 402 NA 2004.3074 19.561180 1 1 188.2125 158.266 0
UGA Uganda Sub-Saharan Africa 1989 C povcal 1 1988 2 1.6482365 133 441 394.4634 547.3591 16.482365 1 1 188.2125 158.266 0
MRT Mauritania Sub-Saharan Africa 1987 C povcal 1 1988 2 0.1892328 205 732 1392.1792 1822.7952 1.892328 1 1 188.2125 158.266 0
PAK Pakistan Other Asia 1987 C povcal 1 1988 1 10.5332464 165 453 1038.4399 1505.3386 105.332464 1 1 188.2125 158.266 0
HND Honduras L. America & Carib. 1989 I povcal 1 1988 2 0.4618245 196 1142 1717.3328 2731.6196 4.618245 1 1 188.2125 158.266 0
GHA Ghana Sub-Saharan Africa 1988 C povcal 1 1988 1 1.4010951 166 578 598.9019 882.0447 14.010951 1 1 188.2125 158.266 0
UGA Uganda Sub-Saharan Africa 1989 C povcal 1 1988 3 1.6482365 180 441 394.4634 547.3591 16.482365 1 1 188.2125 158.266 0
HND Honduras L. America & Carib. 1989 I povcal 1 1988 1 0.4618245 119 1142 1717.3328 2731.6196 4.618245 1 1 188.2125 158.266 0

Exercici 1: Fes una exploració general del marc de dades i les seves variables. Ajuda’t del llibre de codis de la base de dades que trobaràs a All Ginis Dataset:

  • Per consultar el marc de dades només has de teclejar el seu nom (all_ginis). Et serà molt útil la funció glimpse(all_ginis).
  • Per consultar una variable pots teclejar el nom del marc de dades, seguit de $ i el nom de la variable (all_ginis$nom_variable) o bé aplicar la funció que necessitis a la variable. Per exemple: funcio(all_ginis$nom_variable).

Respon a les següents preguntes:

  1. D’acord amb el que has après a Normes ISO, quina(es) variable(s) podríem utilitzar per unir les dades de All Ginis amb les d’un altre marc de dades?
  2. Per realitzar el seu estudi, els autors Lakner i Milanovic van agrupar les dades de desigualtat en uns pocs anys, agrupats a la variable bin_year. Quins són aquests anys? Utilitza unique() per saber-ho. Esbrina la diferència entre year i bin_year.
  3. Com justifica Milanovic en el seu llibre que és rellevant observar l’evolució de la desigualtat global en el període 1988 i 2008?
  4. Amb unique() també pots saber quins valors pot prendre la variable inc_con. Què signifiquen aquests valors? Quina implicació té per conèixer les desigualtats d’un país saber si les dades prenen un valor o un altre?
  5. Busca quina variable indica la font amb què s’han obtingut les dades. Quantes fonts secundàries diferents hi ha? Trobaràs una descripció d’aquestes fonts al llibre de codis. Quin és la principal font d’informació primària que utilitzen? Comenta els aspectes positius i negatius d’obtenir dades de desigualtat a partir d’aquest tipus de font primària que s’utilitza.
  6. Identifica el significat de les variables pop, totpop, RRinc, RRmean i ventile_n.

Un cop ja hem conegut més a fons les dades amb les que treballarem, ja podem generar l’elefant, que trobem representat a la Figura 1. Veureu que és un gràfic molt semblant al que descriu Milanovic en el seu llibre2.

all_ginis %>%
  filter(bin_year %in% c(1988, 2008), #filtrem només els anys 1988 i 2008
         !is.na(RRinc)) %>% #eliminem NA
  group_by(ventile_n, bin_year, RRmean_ventile_n) %>% #agrupem per ventil, any i ingrés real
  summarize() %>% #simplifiquem el marc de dades
  spread(bin_year, RRmean_ventile_n) %>% #posem un any a cada columna
  mutate(diff = (`2008` - `1988`) / `1988`) %>% #creem una nova columna amb la diferència d'ingrés real entre 2008 i 1988
  ggplot(aes(x = ventile_n, y = diff)) +
  geom_line() + 
  scale_y_continuous(labels = scales::percent_format(accuracy = 1)) +
  labs(x = "Income group (ventile)", y = "Real income growth (%)") +
  theme_bw()
L'Elefant de Milanovic (1988 - 2008)

Figure 1: L’Elefant de Milanovic (1988 - 2008)

Exercici 2: A partir del que descriu Milanovic a les primeres pàgines de Global Inequality (Milanovic 2016) i del que observes en el gràfic de la Figura 1, fes els següents exercicis:

  1. Descriu el que observes al gràfic: Què ens ensenya? Què ens indica l’eix de les x? I l’eix de les y?
  2. Interpreta el què observes en el primer, cinquè, quinzè i vintè vintil del gràfic.
  3. Què significa l’ingrés real? Què ens permet calcular que no ens permet l’ingrés nominal?

La desigualtat a dins dels països

Un cop ja coneixem l’evolució de la desigualtat global, podem centrar-nos a observar de més de prop l’evolució de la desigualtat en un país determinat. Podeu consultar la llista de països que tenim a la base de dades amb unique (all_ginis$country).

##   [1] "Bangladesh"               "India"                   
##   [3] "Uzbekistan"               "Uganda"                  
##   [5] "Mauritania"               "Pakistan"                
##   [7] "Honduras"                 "Ghana"                   
##   [9] "Guatemala"                "Nigeria"                 
##  [11] "Lesotho"                  "Costa Rica"              
##  [13] "Brazil"                   "Indonesia"               
##  [15] "El Salvador"              "Gambia, The"             
##  [17] "Central African Republic" "Burundi"                 
##  [19] "Madagascar"               "Swaziland"               
##  [21] "Angola"                   "Burkina Faso"            
##  [23] "Nicaragua"                "Kyrgyz Republic"         
##  [25] "Peru"                     "Mali"                    
##  [27] "Niger"                    "Zambia"                  
##  [29] "Guinea-Bissau"            "Comoros"                 
##  [31] "Botswana"                 "Panama"                  
##  [33] "Zimbabwe"                 "Senegal"                 
##  [35] "Ecuador"                  "Guinea"                  
##  [37] "Namibia"                  "Vietnam"                 
##  [39] "Ethiopia"                 "Kenya"                   
##  [41] "Lao PDR"                  "Malawi"                  
##  [43] "Mozambique"               "Tajikistan"              
##  [45] "Cambodia"                 "South Africa"            
##  [47] "Rwanda"                   "Nepal"                   
##  [49] "Colombia"                 "Venezuela, RB"           
##  [51] "Papua New Guinea"         "Maldives"                
##  [53] "Paraguay"                 "Mexico"                  
##  [55] "Moldova"                  "Micronesia, Fed. Sts."   
##  [57] "Bolivia"                  "Congo, Dem. Rep."        
##  [59] "Benin"                    "Tanzania"                
##  [61] "Sierra Leone"             "Fiji"                    
##  [63] "Congo, Rep."              "Chad"                    
##  [65] "Haiti"                    "Cote d'Ivoire"           
##  [67] "Timor-Leste"              "Liberia"                 
##  [69] "Togo"                     "Yemen, Rep."             
##  [71] "Dominican Republic"       "Philippines"             
##  [73] "Belize"                   "New Zealand"             
##  [75] "St. Lucia"                "Suriname"                
##  [77] "Sao Tome and Principe"    "Turkmenistan"            
##  [79] "Guyana"                   "Cameroon"                
##  [81] "Cape Verde"               "Argentina"               
##  [83] "Djibouti"                 "Georgia"                 
##  [85] "Bhutan"                   "Sudan"                   
##  [87] "Azerbaijan"               "Sri Lanka"               
##  [89] "Armenia"                  "Mongolia"                
##  [91] "Thailand"                 "Chile"                   
##  [93] "Algeria"                  "Tunisia"                 
##  [95] "Jamaica"                  "Morocco"                 
##  [97] "Kazakhstan"               "Gabon"                   
##  [99] "Iraq"                     "Romania"                 
## [101] "Egypt, Arab Rep."         "Lithuania"               
## [103] "Trinidad and Tobago"      "Poland"                  
## [105] "Iran, Islamic Rep."       "Jordan"                  
## [107] "Turkey"                   "Russian Federation"      
## [109] "Malaysia"                 "Syrian Arab Republic"    
## [111] "Kosovo"                   "Ukraine"                 
## [113] "Albania"                  "Belarus"                 
## [115] "Latvia"                   "Macedonia, FYR"          
## [117] "Uruguay"                  "Estonia"                 
## [119] "Bulgaria"                 "Seychelles"              
## [121] "Hungary"                  "Ireland"                 
## [123] "Montenegro"               "Serbia"                  
## [125] "West Bank and Gaza"       "Israel"                  
## [127] "United Kingdom"           "Portugal"                
## [129] "Slovak Republic"          "Bosnia and Herzegovina"  
## [131] "Cyprus"                   "United States"           
## [133] "Italy"                    "France"                  
## [135] "Greece"                   "Korea, Rep."             
## [137] "Netherlands"              "Spain"                   
## [139] "Australia"                "Singapore"               
## [141] "Slovenia"                 "Belgium"                 
## [143] "Czech Republic"           "Canada"                  
## [145] "Hong Kong SAR, China"     "Croatia"                 
## [147] "Japan"                    "Finland"                 
## [149] "Germany"                  "Denmark"                 
## [151] "Switzerland"              "Taiwan"                  
## [153] "Austria"                  "Sweden"                  
## [155] "Barbados"                 "Norway"                  
## [157] "Iceland"                  "Luxembourg"              
## [159] "China"

En aquest apartat ens centrarem en el cas d’un estat concret, Espanya, i mirarem de respondre aquestes dues preguntes:

Per poder-les respondre haurem de preparar un marc de dades a partir de la base de dades All Ginis que inclogui només les observacions del país que volem analitzar. Hem de tenir en compte que fins ara hem vist la distribució mundial de la renda en vintils (cada grup és una vintena part de la població total), però que la distribució per països es troba agrupada en decils (es divideix la població en deu grups iguals). Hem seguit el següent procediment que ha donat com a resultat la Taula 2:

  • Hem filtrat les dades de all_ginis pel país que ens interessa i pels anys 1988 i 2008. D’aquí n’ha sortit el marc de dades gini_spain.
  • Hem creat les columnes RRinc_cum i RRmean_cum. Aquestes dues columnes ens serviran per calcular més endavant l’Índex de Gini.
gini_spain <- all_ginis %>%
  filter(country == "Spain", #seleccionem el país
         bin_year %in% c(1988, 2008)) %>% #seleccionem els dos anys d'interès
  select(bin_year, group, RRinc, RRmean) %>%
  arrange(bin_year, RRinc) %>%
  group_by(bin_year) %>%
  mutate(RRinc_cum = cumsum(RRinc),
         RRmean_cum = cumsum(RRmean))
Table 2: Ingrés real a Espanya (1988 - 2008)
bin_year group RRinc RRmean RRinc_cum RRmean_cum
1988 1 1989 7030 1989 7030
1988 2 3320 7030 5309 14060
1988 3 4090 7030 9399 21090
1988 4 4768 7030 14167 28120
1988 5 5534 7030 19701 35150
1988 6 6382 7030 26083 42180
1988 7 7340 7030 33423 49210
1988 8 8566 7030 41989 56240
1988 9 10586 7030 52575 63270
1988 10 17723 7030 70298 70300
2008 1 2966 10725 2966 10725
2008 2 5078 10725 8044 21450
2008 3 6442 10725 14486 32175
2008 4 7638 10725 22124 42900
2008 5 8816 10725 30940 53625
2008 6 10130 10725 41070 64350
2008 7 11642 10725 52712 75075
2008 8 13458 10725 66170 85800
2008 9 16225 10725 82395 96525
2008 10 24857 10725 107252 107250

Exercici 3: Examina la Taula 2 i respon a les preguntes següents:

  1. Quant guanyava un ciutadà de l’estat espanyol, de mitjana, el 1988?
  2. Quina era la mediana d’ingressos a Espanya l’any 1988?
  3. Si sabem el valor que pren la mitjana i la mediana, podem intuir quina forma pren la distribució. Serà una distribució positiva o negativa? Això significa que la major part de la població té uns ingressos inferiors o superiors a la mitjana?
  4. Explica, a partir de les dades de la taula, el significat de les columnes RRinc_cum i RRmean_cum.

Canvi de la distribució de la renda en un país

Per saber com ha canviat la distribució de la renda a Espanya de 1988 a 2008 hem de fer una operació molt semblant a la que hem realitzat per crear l’elefant. En el cas anterior, però, hem volgut visualitzar la distribució de la renda mundial i ara observarem un cas en concret.

gini_spain %>%
  select(group, bin_year, RRinc) %>%
  spread(bin_year, RRinc) %>%
  mutate(diff = (`2008` - `1988`) / `1988`) %>%
  ggplot(aes(x = group, y = diff)) +
  geom_line() + 
  scale_x_continuous(breaks = 1:10) +
  scale_y_continuous(labels = scales::percent_format(accuracy = 1)) +
  labs(x = "Income group (decile)", y = "Real income growth (%)") +
  theme_bw() +
  theme(panel.grid.minor.x = element_blank())
Evolució de la distribució de la renda a Espanya (1988-2008)

Figure 2: Evolució de la distribució de la renda a Espanya (1988-2008)

Exercici 4: Observa la Figura 2 i el codi utilitzat per reproduir-la i fes les activitats següents:

  1. Com ha evolucionat la renda a Espanya entre 1988 i 2008? Fes una descripció del gràfic.
  2. La renda real del decil més alt ha augmentat relativament menys que la resta de decils. Significa això que les desigualtats han disminuït a Espanya?
  3. Quines limitacions tenen els gràfics que representen les dades per decils? Podem saber la variació en l’ingrés real de les rendes més altes? (per exemple, el Top 1%)
  4. Escull un període i un altre país a partir de les dades disponibles i modifica el codi per obtenir una taula i un gràfic amb l’evolució de la desigualtat d’ingressos. Busca un país on el canvi en la desigualtat d’ingressos per al període seleccionat et cridi l’atenció. Explica’n el motiu i comenta la taula i el gràfic resultant.

Canvi en termes de l’Índex de Gini

La segona pregunta que ens fèiem anteriorment és com havia canviat la desigualtat mesurada en termes de l’índex de Gini. Hi ha diverses formes numèriques de calcular les desigualtats en una població. L’índex de Gini és una d’elles. En aquest curs només us demanem saber que un índex de Gini proper a 1 significa molta desigualtat mentre que un índex proper a 0 significa poca desigualtat, però si voleu saber com es calcula teniu aquest tutorial per fer el càlcul en Excel.

Font: Youtube

L’índex de Gini es calcula a partir de la corba de Lorenz, que veieu a la següent Figura 3. Per crear la figura hem utilitzat les columnes RRinc_cum i RRmean_cum, que hem creat anteriorment i que en un exercici us demanàvem que examinéssiu el seu significat. El gràfic està creat a partir d’aquestes dues variables.

  • La línia blava representa RRinc_cum.
  • La línia taronja representa RRmean_cum.
  • L’índex de Gini és la proporció que ocupa l’àrea entre la línia blava i la línia taronja (àrea A) respecte tota l’àrea del triangle inferior dret del gràfic (àrea A + B).
zeros <- tribble(~bin_year, ~group, ~RRinc, ~RRmean, ~RRinc_cum, ~RRmean_cum,
                 1988,0,0,0,0,0,
                 2008,0,0,0,0,0)
gini_spain %>%
  bind_rows(zeros) %>% #afegim el grup 0 de cada any
  ggplot(aes(x = group)) +
  geom_line(aes(y = RRinc_cum), col = "blue", lty = 2, size = 1) +
  geom_line(aes(y = RRmean_cum), col = "orange", size = 1) +
  scale_x_continuous(breaks = 0:10) +
  facet_wrap(~bin_year, scales = "free")
Corba de Lorenz a Espanya (1988, 2008)

Figure 3: Corba de Lorenz a Espanya (1988, 2008)

Exercici 5: A la Figura 3 observem la corba de Lorenz d’Espanya els anys 1988 i 2008. Respon a les següents preguntes:

  1. Observem gaires diferències entre la corba de Lorenz l’any 1988 i l’any 2008? A quin any diries, a simple vista, que hi havia més desigualtat a Espanya?
  2. Comenta el gràfic a partir de comparar el tercer, el cinquè i el novè decil de la distribució de la renda a Espanya en els dos anys.
  3. Què significaria que la línia blava i la línia taronja coincidissin?
  4. Si la línia blava fes un cercle més pronunciat (més allunyat de la línia taronja) tindríem més o menys desigualtat?

El càlcul de l’índex de Gini, doncs, parteix de la corba de Lorenz. Per obtenir-lo hem de calcular la proporció de l’àrea que es troba entre la línia blava i la línia taronja sobre l’àrea en forma de triangle entre la línia taronja i l’extrem inferior dret del gràfic. Per això farem les operacions següents:

  • Calculem B: l’àrea que forma RRinc_cum (línia blava) i l’extrem inferior dret del gràfic.
  • Calculem A: l’àrea que forma RRmean_cum (línia taronja) i l’extrem inferior dret del gràfic.
  • L’índex de Gini s’obté amb la fórmula:

\[Gini = \frac{A}{A + B} * 100\]

gini_spain %>%
  mutate(base = group - lag(group, default = 0),
         quadre = lag(RRinc_cum, default = 0) * base,
         triangle = (RRinc_cum - lag(RRinc_cum, default = 0)) / 2,
         area = quadre + triangle) %>%
  summarize(B = sum(area), #calculem B
            `A+B` = max(RRmean_cum) * max(group) / 2, #calculem A + B
            A = `A+B` - B, #calculem A
            Gini = round(A / `A+B` * 100, 1)) %>% #obtenim l'índex de Gini
  transmute(Any = bin_year, A, B, `A+B`, Gini)
Table 3: Índex de Gini a Espanya 1988-2008
Any A B A+B Gini
1988 111716 239784 351500 31.8
2008 161717 374533 536250 30.2

EXERCICI FINAL: El codi anterior ens ha generat la Taula 3, on podem veure l’extensió de les àrees A i B i l’índex de Gini d’Espanya en els anys seleccionats.

  1. Interpreta l’índex de Gini d’Espanya. Les desigualtats han disminuït o han augmentat en el període 1988-2008?
  2. Podríem dir que l’índex de Gini és alt a Espanya en comparació als altres països del món?
  3. Quina seria l’àrea total de tot el gràfic? (pista: fa forma de quadrat)
  4. Escull un altre país en dos anys que seleccionis entre els que tens disponibles a la variable bin_year. Visualitza la corba de Lorenz i calcula l’índex de Gini. Fes un breu comentari dels resultats.

Referències

Milanovic, Branko. 2016. Global Inequality: A New Approach for the Age of. Globalization. Cambridge, MA: Harvard University Press.


  1. Aquesta activitat està elaborada amb propòsits estrictament docents. Les operacions que es realitzen no pretenen tenir cap validesa des d’un punt de vista acadèmic. Podeu ajudar-vos d’aquest RMarkdown↩︎

  2. L’única diferència és que a Global Inequalities observem el guany relatiu per vintils entre 1988 i 2008, mentre que en aquest gràfic observem el canvi relatiu en l’ingrés real per vintils entre 1988 i 2008.↩︎

Previous
Next