Open INESEM

Investigación

Imagen con letras Big Data

Competitividad & Desarrollo (Perspectiva Descriptiva & De Correlación)

Daniel Roldán López

1. Introducción

En un mundo globalizado no podemos permanecer ajenos a la problemática derivada de las políticas económicas adoptadas por los países y que marcan el devenir de sus habitantes. Los diferentes planes de inversión condicionan los resultados a medio y largo plazo. La estructura económica determina la capacidad competitiva de las naciones y con ello su prosperidad.

 A pesar de que existe abundante literatura al respecto, no se ha determinado con rotundidad que el crecimiento económico sea sinónimo de bienestar social aunque todo indica que están estrechamente relacionados. La renta per cápita podría tomarse como variable referente para explicar el desarrollo social y las diferentes condiciones de vida que ostentan unos ciudadanos frente a otros. En este contexto la productividad de una economía es un factor clave y el perfil de las inversiones cobra una importancia mayúscula.

Aquellos países que logren superar las barreras de los rendimientos decrecientes del capital conseguirán ventaja competitiva. Solo mediante el incremento de la calidad del mismo, pueden superarse dichas barreras. Tanto el capital humano como el capital físico, es decir, tecnología y conocimiento, guiarán a los países hacia el aumento de la productividad, la competitividad, el crecimiento económico y el bienestar social.

 

2. Metodología

  • Descarga de módulos openpyxl y pandas para lectura de datos. Con openpyxl se puede ver un ejemplo en el archivo países_desarrollo_económico.py, en el que se crea un objeto lectura con openpyxl.load_workbook. Seguidamente se crean listas que llenan con loops for columna a columna. Con las listas se crean diccionarios y con ellos dataframe.  Con pandas se leen los datos mediante pd.ExcelFile(). En el archivo gdp_base_2010.py hay un ejemplo. Se crea un dataframe con pd.ExcelFile() y se accede a la información de la hoja con parse.().  Se pueden apreciar otras operaciones como objeto.replace() para cambiar nombres con el propósito de homogeneizar listas e índices. Se borran columnas también con dataframe.drop().  En definitiva, se manipulan los dataframe con dataframe.set_index(), ...index.name, accediendo a las filas y columnas con .iloc[] y loc[], para modificar y borrar información en caso de no ser necesaria o reemplazar las celdas vacías con replace.([], np.nan).
  • Se van leyendo los archivos y creando dataframes con cada uno de ellos. Creando un dataframe para cada variable además de otros adjuntos que contienen clasificaciones de países y de productos que se han considerado interesantes.
  • Para que los países sean las mismos en cada uno de ellos se han cruzado listas con .isin(). También se han utilizado set() & set() para ver los elementos comunes. Para que los años coincidan se han borrado columnas o se han añadido otras.
  • Los dataframe en bruto están en el archivo dataframes.py
  • El siguiente paso ha sido estimar los datos NaN mediante interpolate(). Se ha hecho en modo linear y en ambas direcciones. En esta tarea se han utilizado las funciones isna(), sum() o dropna().
  • Una vez en posesión de todos los dataframes, con los mismos países, los mismos periodos y sin missing data, se ha procedido a realizar la correlación mediante la función corr() cada variable independiente con la variable dependiente renta per cápita. En el archivo análisi.py se puede ver como se crea el dataframe corr_percap de correlaciones aglutinando las  de cada variable con la función pd.concat().
  • En los archivos plotting.py y plotting_2.py se ha importado el módulo matplotlib.pyplot para graficar accediendo al dataframe de correlaciones corr_percap creado en análisis.py. En plotting.py se grafica por cada país mediante una función mediante parámetro graf(z). El número del menú de cada país entra por z que es aplicado como z-1 para coincidir con los valores del índice que comienzan en 0. Seguidamente se utiliza un loop condicional para introducir datos en el dataframe  con la condición de que otro dato se encuentre en otro dataframe, con in. Después se grafica creando los objetos de matplotlib; plt.figure y plt.subplots. Se aplican márgenes, leyendas, labels y demás como muestra el contenido. Los datos se han ordenado mediante sort_values() de mayor a menor o de menor (en la correlación lineal también es mayor) a mayor con los coeficientes negativos. En  plotting_2.py se grafica por variables creando una función para cada una.
  • Los archivos resultados.py muestran una serie de funciones que filtran la información con el propósito de desagregarla. Aparecen de nuevo loops condicionales para añadir información a los dataframes tanto con in como con booleanos. También la función sort_values(), filtros de valores negativos y positivos, es decir, se divide el dataframe en otros dos.  Uno de coeficientes negativos y otros positivos. Se sacan los valores máximos y mínimos con max() y min(). Sus índices con idxmax() e idxmin(). Se redondean con round(4) a cuatro decimales. Se muestran en pantalla con print(' ... '.format()). Etc...

2.1 Guía de navegación:

  • Entrar en el archivo COMPETITIVIDAD_DESARROLLO.py y pulsar F5.    
  • En el menú dataframes, para visualizar el 3.2.1., introducir 3.2.1 sin el último punto. El 4.1. pulsar 4.1 y el 5., 5 por ejemplo. En este archivo encontrará los dataframe en bruto que se han utilizado para configurar las variables y otros con información relevante.
  • En el apartado 2, Análisis por países se encuentran todas las naciones graficadas y se puede observar la incidencia de las distintas variables en cada uno de ellos.
  • En el apartado 3, Análisis por variables se hace lo propio pero por cada variable de la muestra.
  • En el apartado 4 se despliegan las listas de coeficientes ordenados de mayor a menor.
  • En el número 5 se hace una clasificación del coeficiente en 4 tramos: relevante (1/0.75), moderado (0.749/0.5), leve (0.49/0.25) e irrelevante (0.25/0). Se obtienen para cada uno de ellos el número y el tipo de países según su estatus económico así como otros apuntes. Todo ello cruzando los distintos dataframes.

3. Resultados

En total son 13 variables independientes que se han correlacionado con una variable dependiente, la renta per cápita con base en 2010. El objetivo es calcular su relación lineal por lo que se ha optado por el Coeficiente de Correlación de Pearson.

Las variables seleccionadas reflejan diversos perfiles productivos y se han agrupado por:

  1. Especialización comercial y 'reindustrialización':
    • Exportaciones de manufacturas según nivel tecnológico incorporado: manufacturas tecnología baja, media-baja, media-alta y alta
    • Empleo en el sector industrial como porcentaje del empleo total: empleo industria
    • Exportaciones de bienes y servicios TIC
  2. Capital tecnológico:
    • Gasto estatal en I+D como porcentaje del PIB
    • Porcentaje de investigadores en I+D por millón de habitantes
  3. Capital humano:
    • Gasto en educación superior
    • Gasto estatal total en educación
    • Ratio estudiantes/profesor
  4. Dependencia energética:
    • Importación de energía como porcentaje de su uso

El censo de países ha sido obtenido del UNCTAD después de cruzarlos con el índice del World Bank. Un total de 77 forman parte de la muestra:

Países Desarrollados 31 (57% del total): 'Austria', 'Belgium', 'Bulgaria', 'Canada', 'Croatia', 'Cyprus', 'Denmark', 'Estonia', 'Finland', 'France', 'Germany', 'Greece', 'Hungary', 'Iceland', 'Ireland', 'Italy', 'Latvia', 'Lithuania', 'Luxembourg', 'Malta', 'Netherlands', 'New Zealand', 'Norway','Poland', 'Portugal', 'Romania', 'Slovenia', 'Spain', 'Sweden', 'United Kingdom', 'United States of America'.

Países en Transición 6 (30% del total): 'Albania', 'Georgia', 'Kazakhstan', 'Russian Federation', 'Serbia', 'Ukraine'.

Países en Desarrollo 40 (22% del total): 'Argentina', 'Bahrain', 'Botswana', 'Brazil', 'Brunei Darussalam', 'Cambodia', 'Chile', 'China', 'Colombia', 'Ecuador',  'El Salvador', 'Ethiopia', 'Ghana', 'Guatemala', 'Honduras', 'India', 'Indonesia', 'Jordan', 'Kenya', 'Kuwait', 'Malaysia', 'Mauritius', 'Mexico', 'Morocco', 'Mozambique', 'Myanmar', 'Namibia', 'Nepal', 'Oman', 'Pakistan', 'Panama', 'Philippines', 'Senegal', 'Singapore', 'Sri Lanka', 'Thailand', 'Togo', 'Tunisia', 'Turkey', 'Uruguay'.

Por motivos de eficiencia nos centramos en los coeficientes clasificados como relevantes (1/0.75) y en su tramo positivo ya que el negativo, aunque contiene algunos valores, está más alejado del objetivo del presente trabajo que los primeros. Aplicando funciones como describe(), median() o mode(), los resultados de las variables en el susodicho tramo son los siguientes:

3.1 Exportaciones de manufacturas con baja tecnología incorporada

Nº Países: 46 (60% de la muestra)

Desarrollados: 18 (58% de su clase)

Transición: 3 (50% de su clase)

En Desarrollo: 25 (62% de su clase)

Máximo =  0.9835 (Camboya)

Mínimo =  0.7531 (Brasil)

25% = 0.861248

50% = 0.918240

75% = 0.958210

Media = 0.9042

Mediana = 0.9182

Moda = 0

Desviación Típica = 0.0642

La mediana se encuentra entre las posiciones 22/23 de la lista ordenada de países. La desviación típica indica poca dispersión por lo que la media refleja el centro de gravedad de la distribución con bastante exactitud. Moda igual a cero significa que no se repite ningún valor. Los resultados de los percentiles junto con los máximos y los mínimos confirman también una distribución bastante uniforme por lo que la media aritmética es representativa.

 

Exportaciones

Todas las variables que siguen presentan un perfil similar al anterior y por lo tanto poseen una distribución uniforme y una media aritmética representativa.

 

3.2 Exportaciones de manufacturas con media-baja tecnología incorporada

Nº Países: 51 (66% de la muestra)

Desarrollados: 20 (65% de su clase)

Transición: 4 (66'6% de su clase)

En Desarrollo: 27 (67'5% de su clase)

Máximo = 0.983 (Guatemala)

Mínimo = 0.7565 (Croacia)

25% = 0.8495

50% = 0.8844

75% = 0.9213

Media = 0.8797

Mediana = 0.8844

Moda = 0

Desviación Típica = 0.0569

 

3.3 Exportaciones manufacturas con tecnología media-alta incorporada

Nº Países: 60 (78% de la muestra)

Desarrollados: 25 (80% de su clase)

Transición: 3 (50% de su clase)

En Desarrollo: 32 (80% de su clase)

Máximo = 0.9915 (El Salvador)

Mínimo = 0.7635 (Albania)

25% = 0.861463

50% = 0.9070

75% = 0.9511

Media = 0.8976

Mediana = 0.9070

Moda = 0

Desviación Típica = 0.0649

 

3.4 Exportaciones manufacturas con alta tecnología incorporada

Nº Países: 53 (68% de la muestra)

Desarrollados: 22 (71% de su clase)

Transición: 3 (50% de su clase)

En Desarrollo: 1 (2'5% de su clase)

Máximo =  0.9777 (Poland)

Mínimo = 0.7635 (Jordan)

25% = 0.8717

50% = 0.9031

75% = 0.9444

Media = 0.8992

Mediana = 0.9031

Moda = 0

Desviación Típica = 0.0536

 

3.5 Exportaciones de bienes sector TIC

Nº Países: 5 (6'5% de la muestra)

Desarrollados: 3 (9'6% de su clase)

Transición: 0 (0% de su clase)

En Desarrollo: 2 (5% de su clase)

Máximo =  0.9351 (Bulgaria)

Mínimo = 0.7768 (El Salvador)

25% = 0.8076

50% = 0.8564

75% = 0.8923

Media = 0.8536

Mediana = 0.8564

Moda = 0

Desviación Típica = 0.0635

 

3.6 Gasto gubernamental en I+D

Nº Países: 30 (39% de la muestra)

Desarrollados: 10 (9'6% de su clase)

Transición: 1 (16'6% de su clase)

En Desarrollo: 19 (47'5% de su clase)

Máximo =  0.9823 (Cambodia)

Mínimo = 0.7538 (United States of America)

25% = 0.8185

50% = 0.8709

75% = 0.9317

Media = 0.8715

Mediana = 0.8709

Moda = 0

Desviación Típica = 0.0661

 

3.7 Investigadores en I+D por millón de habitantes

Nº Países: 46 (60% de la muestra)

Desarrollados: 18 (58% de su clase)

Transición: 3 (50% de su clase)

En Desarrollo: 25 (62.5% de su clase)

Máximo =  0.9835  (Cambodia)

Mínimo = 0.7531 (Brazil)

25% = 0.8383

50% = 0.8963

75% = 0.9349

Media = 0.8861

Mediana = 0.8963

Moda = 0

Desviación Típica = 0.0635

 

3.8 Exportaciones de servicios sector TIC

Nº Países: 5 (6'5% de la muestra)

Desarrollados: 3 (9'6% de su clase)

Transición: 0 (0% de su clase)

En Desarrollo: 2 (5% de su clase)

Máximo =  0.9351 (Bulgaria)

Mínimo = 0.7768 (El Salvador)

25% = 0.8076

50% = 0.8564

75% = 0.8923

Media = 0.8536

Mediana = 0.8564

Moda = 0

Desviación Típica = 0.0635

 

3.9 Gasto gubernamental en educación superior

Nº Países: 4 (60% de la muestra)

Desarrollados: 0 (0% de su clase)

Transición: 2 (33'3% de su clase)

En Desarrollo: 2 (5% de su clase)

Máximo =  0.969 (Uruguay)

Mínimo = 0.7896  (Myanmar)

25% = 0.7964

50% = 0.8395

75% = 0.9025

Media = 0.8594

Mediana = 0.8395

Moda = 0

Desviación Típica = 0.0836

 

3.10 Gasto gubernamental en educación

Nº Países: 19 (%24'6 de la muestra)

Desarrollados: 2 (33'3% de su clase)

Transición: 10 (33'3% de su clase)

En Desarrollo: 10 (25% de su clase)

Máximo =  0.9879 ( Belgium)

Mínimo = 0.7605 (Honduras)

25% = 0.8156

50% = 0.8645

75% = 0.9184

Media = 0.8658

Mediana = 0.8645

Moda = 0

Desviación Típica = 0.0686

 

3.11 Ratio estudiantes/profesor

Nº Países: 14 (%18'18 de la muestra)

Desarrollados: 4 (13% de su clase)

Transición: 0 (0% de su clase)

En Desarrollo: 10 (25% de su clase)

Máximo =  0.9561 (Nepal)

Mínimo = 0.7656 (Sweden)

25% = 0.8360

50% = 0.8691

75% = 0.9230

Media = 0.8721

Mediana = 0.8691

Moda = 0

Desviación Típica = 0.0599

 

3.12 Importaciones energía sobre el total de su uso

Nº Países: 19 (24'6% de la muestra)

Desarrollados: 3 (9'6% de su clase)

Transición: 0 (0% de su clase)

En Desarrollo: 16 (40% de su clase)

Máximo =  0.9699 ( India)

Mínimo = 0.7829 ( Morocco)

25% = 0.8363

50% = 0.8695

75% = 0.9292

Media = 0.8813

Mediana = 0.8695

Moda = 0

Desviación Típica = 0.0574

 

3.13 Empleo sector industrial sobre el empleo total

Nº Países: 15 (19'4% de la muestra)

Desarrollados: 0 (0% de su clase)

Transición: 1 (16'6% de su clase)

En Desarrollo: 14 (35% de su clase)

Máximo = 0.9832 (Cambodia)

Mínimo = 0.7694 (Georgia)

25% = 0.8800

50% = 0.917146

75% = 0.961536

Media = 0.9113

Mediana = 0.9171

Moda = 0

Desviación Típica = 0.0653

 

4. Conclusiones

Aunque en un principio pueda parecer chocante, las variables relacionadas con las TIC no indican una estrecha relación ya  que el número de países es notablemente inferior. Las razones probablemente se encuentren en el menor valor añadido, menores barreras de entrada, en la dimensión empresarial y en las economías de escala en estos sectores. Los servicios tienden normalmente a tener menores valores en estas variables y aunque estén relacionados con las nuevas tecnologías, no es extraño que su relación con la renta per cápita no sea fuerte.

  • Países Desarrollados: 60%
  • Países en Transición: 0%
  • Países en Desarrollo: 40%

El gasto público en educación superior depende de la eficiencia y de a qué campos estén orientados los estudios. Puede que la gestión no sea eficiente y que existan problemas de sobreeducación (como en España).

  • Países Desarrollados: 0%
  • Países en Transición: 50%
  • Países en Desarrollo: 50%

El gasto público total en educación sigue el mismo patrón que la variable anterior y puede ser explicada de la misma forma.

  • Países Desarrollados: 36'8%
  • Países en Transición: 10'5%
  • Países en Desarrollo: 52'6%

El ratio estudiantes/profesor demuestra que la cantidad no es sinónimo de calidad. Habría que estudiar en más profundidad la gestión de cada países en particular.

  • Países Desarrollados: 28'5%
  • Países en Transición: 0%
  • Países en Desarrollo: 71'5%

Las dos siguientes variables se ven claramente afectados por su heterogeneidad:

La dependencia energética resta productividad y aunque en principio debe tener una clara correlación negativa, la muestra no aclara una correlación sólida ni negativa ni positiva. Habría que profundizar en los sectores energéticos de cada país para afinar más el análisis. Gas, petróleo, carbón, etc....

  • Países Desarrollados: 15'7%
  • Países en Transición: 0%
  • Países en Desarrollo: 84%

El comportamiento del empleo industrial sobre el total también es desconcertante porque a priori debería tener una clara correlación positiva. Sus pobres resultados invitan a desagregar los subsectores industriales y a seleccionar un mayor número de países así como a recurrir a fuentes de datos alternativas.

  • Países en Transición: 0%
  • Países en Transición: 6'6%
  • Países en Desarrollo: 93'3%

Sí destaca el número de investigadores en i+d por millón de habitantes. Su distribución sigue un patrón muy similar al de las manufacturas, como veremos más adelante, en cuanto a participación de países:

  • Países Desarrollados: 40%
  • Países en Transición: 6%
  • Países en Desarrollo: 54%

La investigación en i+d está íntimamente ligada a los procesos de producción. Los investigadores innovan y los procesos mejoran en eficiencia y productividad. El modelo indica que existe correlación positiva.

A continuación el gasto estatal en i+d muestra una distribución algo distinta en la que los países desarrollados tienen menos peso:

  • Países Desarrollados: 33%
  • Países en Transición: 3'3%
  • Países en Desarrollo: 63%

Esta diferencia es probable que se deba a los distintos sistemas de innovación. En los países desarrollados puede que el gasto privado sea mayor y que el gasto público además de ser menor no sea tan eficiente. La correlación es positiva según el modelo.

En cuanto a las manufacturas, a la vista de los resultados es apreciable la clara correlación positiva que existe entre las manufacturas y la renta per cápita. En los cuatro grupos los países de la muestra siguen el mismo patrón distributivo. Aproximadamente sus porcentajes son:

  • Países Desarrollados : 42%
  • Países en Transición: 5%
  • Países en Desarrollo: 53%

Por lo tanto parece un fenómeno transversal. Sus explicaciones deben estar en el valor añadido de su actividad, la dimensión empresarial y el aprovechamiento de las economías de escala comparados al sector servicios por ejemplo. La sólida participación de los países desarrollados indica una reindustrialización en sectores de alta tecnología tras unas décadas de sectores terciarios sobredimensionados.

En resumen, según el presente análisis:

 

CORRELACIÓN RELEVANTE +

CORRELACIÓN NO RELEVANTE +

INVESTIGADORES EN I+D / MILLÓN  HABT.

GASTO PÚBLICO EN I+D

EXP. MANUFACTURAS TECNOLOGÍA: BAJA, MEDIA-BAJA, MEDIA-ALTA Y ALTA

EXPORTACIONES BIENES Y SERVICIOS TIC

GASTO PÚBLICO EN EDUCACIÓN SUPERIOR

GASTO PÚBLICO TOTAL EN EDUCACIÓN

RATIO ESTUDIANTES/PROFESOR

IMPORTACIONES ENERGÍA

EMPLEO SECTOR INDUSTRIAL

 

En el siguiente gráfico se ilustran la media aritmética de los coeficientes en el tramo relevante para cada variable así como el número de países que están dentro del mismo.

 

Media aritmética coeficientes

 

Para finalizar recalcar que la correlación obtenida es lineal, no de otro tipo, y ausencia de la misma no excluye la existencia de otra distinta. Por lo tanto, el trabajo llega a su fin en lo que es un punto y aparte hacia nuevas investigaciones.

Referencias

Introducción a la Programación Estadística. (2016). Rafael Marín Sastre. Máster en Business Intelligence & Big Data. INESEM Business School.

Conferencia de las Naciones Unidas sobre Comercio y desarrollo. (12 de mayo de 2019). https://unctad.org/en/Pages/statistics.aspx

Banco Mundial. (15 de Mayo de 2019). https://datos.bancomundial.org/

Explora nuestras Áreas Formativas

Construye tu carrera profesional

Descubre nuestro amplio Catálogo Formativo, incluye programas de Cursos Superior, Expertos, Master Profesionales y Master Universitarios en las diferentes Áreas Formativas para impulsar tu carrera profesional.