Revistas de la Universidad de Panamá

Octubre 2019 –Marzo 2020|Vol. 4| No 1 |ISSN 2616-9711

Aplicaciones con OpenGeoda entre la Producción Interna Bruta Total (PIB) y la Población Económicamente Activa (PEA) en Panamá, Años 2007-2015

Applications with OpenGeoda between Total Gross Domestic Production (GDP) and the Economically Active Population (EAP) in Panama, Years 2007-2015

Pérez, Jimmy ¹; Ashaw, María ²; Henríquez, Teresita³;González, Jaime Manuel ⁴

1. Estudiante de tesis; Centro regional de Coclé (C.R. Coclé); Lic. En mercadeo y comercio Internacional. Universidad Tecnológica de Panamá (UTP). agustinperez27@hotmail.es

2. Docente Universitaria (UP); Lic. En matemática, Máster en Matemática Aplicada. jetziba_beula@yahoo.es

3. Docente Universitaria (UP); Lic en Estadística, Master en Estadística Aplicada. terehen2@yahoo.com

4. Docente Universitario (ULP, UP y UTP); Lic. En Economía, Máster en Economía y Desarrollo. jaime_manuelg@hotmail.com, https://orcid.org/0000-0002-7718-1896

Págs.: 38 - 64

Recibido: 05/Jul. /2019 Aprobado: 17/Jul./2019

Resumen

Dentro de los estudios de mercado y potencial económico de un individuo, empresa y jurisdicciones geográfica se hace importante la utilización de Software apropiado para el análisis espacial, como es el OpenGeoda.

Para el caso de Panamá, se utilizó una base de datos del producto Interno Bruto de Panamá (PIB) provincial, extrayéndose algunos mapas ilustrativos de las variables de producción y del mercado de trabajo en Panamá. De igual forma, se trabajó con una matriz inversa y se pudo ilustrar y calcular el índice de Moran.

El software nos permitió trabajar modelos de econometría espacial que se pueden apreciar desde un mínimo cuadrado ordinario hasta modelos dinámicos en un análisis espacial y regional en Panamá.

Palabras claves: Econometría Espacial, Correlación Espacial, Índice de Moran

Abstract

Within the market studies and economic potential of an individual, company and geographic jurisdictions it is important to use appropriate software for spatial analysis, such as OpenGeoda.

In the case of Panama, a database of the provincial gross domestic product (GDP) of Panama was used, extracting some illustrative maps of the variables of production and the labor market in Panama. In the same way, we worked with an inverse matrix and we could illustrate and calculate the Moran index.

The software allowed us to work spatial econometrics models that can be appreciated from a minimum ordinary square to dynamic models in a spatial and regional analysis in Panama.

Keywords: Spatial Econometrics, spatial correlation, Moran index

Introducción

Como estudioso de los fenómenos económicos, sociales o ambientales seguramente se habrá percatado que cada vez se realiza una mayor difusión de información georreferenciada. Es decir, las variables aparecen vinculadas a su dimensión espacial y pueden ser manejadas en potentes mapas en los que se van superponiendo capas de información.

A la par de la difusión de datos georreferenciados, también se han desarrollado modernos paquetes computacionales, conocidos como Sistemas de Información Geográfica (GIS por sus siglas en inglés), ello ha permitido dar impulso a una nueva subdisciplina de la econometría conocida como econometría espacial.

La econometría espacial fue definida a principios de los años setenta por Jean Paelinck como el creciente cuerpo de la literatura en ciencia regional que trata primordialmente con la estimación y prueba de problemas encontrados en la implantación de modelos econométricos multirregionales.

Luc Anselin (1988) uno de los pioneros y grandes impulsores de la econometría espacial considera que el campo de esta disciplina está formado por: “…aquellos métodos y técnicas que, sustentados en una representación formal de la estructura de la dependencia y heterogeneidad espacial, provee el medio para llevar a cabo la adecuada especificación, estimación, prueba de hipótesis y predicción para modelos en la ciencia regional.”

Materiales y métodos

Los métodos desarrollados por la econometría espacial permiten atender problemas de violación a los supuestos del modelo de regresión ordinario, que no es posible resolverlos en el marco de los modelos econométricos de Mínimos Cuadrados Ordinarios (MCO).

Estos problemas son típicos en los datos espaciales y se refieren a:

Dependencia espacial entre observaciones: Correlación espacial.
Heterogeneidad espacial entre observaciones: Heteroscedasticidad espacial.

El caso al que se le ha dedicado mayor atención es al primero, debido a que el segundo ha podido estudiarse en el marco de modelos de panel y otras técnicas similares en donde la heterocedasticidad y el cambio estructural juegan un papel relevante.

Vecindad y dependencia espacial

Usualmente cuando el economista maneja series económicas, sociales o ambientales lo hace desde una perspectiva en la cual toma como dadas las coordenadas de localización geográfica de las variables. El obviar el contexto espacial significa una pérdida importante de información, sólo piense lo que ocurriría sí, por ejemplo, un estudio de criminalidad en una ciudad no considerará el efecto que tiene la situación que priva en las ciudades vecinas.

En ese sentido, los datos generalmente presentan algún tipo de dependencia o auto correlación espacial, la cual puede definirse como la existencia de una relación funcional entre lo que ocurre en un punto del espacio y lo que sucede en otro lugar, lo cual se explica fundamentalmente por razones de interacción humana con su entorno físico-ambiental. En tal sentido, las variables socioeconómicas, físicas, ambientales y otras; generalmente presentan algún tipo de dependencia o auto correlación espacial.

La dependencia espacial implicaría que al tomar en consideración una variable, para diferentes localidades, esperaríamos características más similares en localidades vecinas, que en aquéllas separadas por grandes distancias. La dependencia espacial puede ser positiva o negativa, de ser positiva la presencia de un atributo en una localidad se extendería a las regiones vecinas y, en caso de ser negativa, obstaculizaría su presencia en sus vecindades.

Los datos espaciales se pueden clasificar de acuerdo con el objeto espacial al que se refieren y al nivel de medida de las variables. Dicha clasificación puede ilustrarse matricialmente como en la figura N°1

𝑧1(1)	𝑧2(1)	….	𝑧𝑘(1)	S(1)
𝑧1(2)	𝑧2(2)	….	𝑧𝑘(2)	S(2)
….	….	….	….	….
….	….	….	….	….
….	….	….	….	….
𝑧1(𝑛)	𝑧2(𝑛)		𝑧𝑘(𝑛)	S(n)

Figura N° 1: Matriz de datos Espaciales

Donde tenemos k variables {z1, z2, …, zk} medidas en la localización s(i) donde i=1, 2, n. Si incorporamos el factor de temporalidad, podríamos tener una matriz de este tipo para cada
período del tiempo. Las relaciones entre las variables y localizaciones clasificadas en la matriz de datos pueden establecerse a través de conectividad o vecindad.

Matriz de vecindad por contigüidad

La noción de vecindad se puede establecer de forma binaria; en tal caso, sí dos unidades espaciales tienen una frontera común se les asigna un uno, en caso contrario se le asigna un cero.
Bajo esta sencilla idea, una variable particular podría referenciarse en un mapa, a partir del cual es posible establecer sus fronteras y, en consecuencia, identificar sus vecindades. Luc Anselin (1988), plantea diferentes medidas de vecindad, las cuales se asemejan a un tablero de ajedrez y que podemos apreciar en la figura N° 2:

Figura N° 2: Diferentes Vecindades

La vecindad entre puntos también puede ser de orden superior, sí se consideran series de bandas concéntricas alrededor de la localidad bajo consideración.

		D
	C	B	C
D	B	A	B	D
	C	B	C
		D

Figura N° 3: Vecindades de Orden superior

Por ejemplo, en la figura N°3 y considerando vecindad tipo torre, las celdas C y D son contiguas de segundo orden a la celda A, y son contiguas de primer orden a B.

En un mapa geográfico, como en la figura N°4, es posible construir cualquiera de los tipos de matrices de vecindad descritas anteriormente.

Figura N° 4: Mapa del istmo Panamá

Construcción analítica de una matriz de vecindad

Para ilustrar la forma en la que se construye una matriz binaria de vecindades por Anselin (1988). Suponga que la localización de diferentes variables podría ubicarse en un mapa cuadriculado como el siguiente:


1	2B	3
4B	5A	6B
7	8B	9

Figura N° 5: Mapa cuadriculado

A cada localidad le asignamos un número y tomando como punto de referencia la localidad 5 calculamos vecindades tipo torre. La localidad 1 y la 3 no tienen vecindad, por ello se le asigna un cero en la matriz de vecindades. La vecindad de una localidad consigo misma es contabilizada también con un cero. La matriz de contactos resultante aparece en la figura siguiente:

Localidad	1	2	3	4	5	6	7	8	9
1	1	0	0	0	0	0	0	0	0
2	0	1	0	0	0	0	0	0	0
3	0	0	1	0	0	0	0	0	0
4	0	0	0	1	0	0	0	0	0
5	0	0	0	0	1	0	0	0	0
6	0	0	0	0	0	1	0	0	0
7	0	0	0	0	0	0	1	0	0
8	0	0	0	0	0	0	0	1	0
9	0	0	0	0	0	0	0	0	1

Figura N° 6: Matriz de contactos

Matriz de vecindad por distancia

La matriz de vecindades binarias es limitada, ya que únicamente considera la vecindad física, por lo cual no contabiliza la posibilidad de interacción entre regiones alejadas. Por ello, han sido propuestas otras medidas de vecindad alternativas, sustentadas en distancias de diferente tipo y cuya matriz, W, es conocida como la matriz de pesos o contactos espaciales.

Anselin plantea que, en caso de que la unidad espacial sea un sistema urbano, la vecindad puede ser obtenida de la trayectoria más corta en una red o gráfica formada por una conexión de puntos. Por ejemplo, en la figura 5, la distancia más corta entre los puntos es representada por la línea punteada y la vecindad por el círculo que conecta los puntos y tiene como centroide a la localidad A.

Figura N° 5: Vecindad por distancia más corta

Considerando los centroides como punto de referencia para medir las distancias geográficas, Fotheringham, Brunsdon y Charlton (2000) proponen las siguientes medidas de distancias:

Localización en el plano cartesiano

En un sistema cartesiano, la distancia se mide por el teorema de Pitágoras y la localización es por medio de las coordenadas geográficas: latitud y longitud.
Distancia Euclidiana

Con base a las coordenadas de latitud (x) y la longitud (y), la distancia entre los centroides de las localidades i y j.

La distancia euclidiana entre dos localidades i y j con coordenadas (xi,1, xi,2), (xj,1, xj,2), se puede escribir también como:

La distancia puede ser generalizada a m dimensiones.

Métrica de Minkowski

En el caso de que p=2 es la distancia euclidiana, si p=1 es la distancia conocida como Manhattan o distancia taxicab.

Localización en el globo o superficie de la tierra

En el caso de considerar la superficie de la tierra en lugar del plano cartesiano, se necesita de los cálculos geométricos:

Trigonometría esférica (curvatura de la tierra)

𝑆𝑖𝑗 = 𝑅𝑎𝑟𝑐𝑜𝑠[cos(90° − Φ𝑖) cos (90° − Φ𝑗)] + 𝑠𝑒𝑛(90° − Φ𝑖)𝑠𝑒𝑛(90° − Φ𝑗)cos (𝜆𝑗 −𝜆𝑖)

R es el radio de la tierra, arcoseno (arcos), coseno (cos), seno (sen), la latitud y longitud de la locación i

Son (Φ𝑖, 𝜆𝑖)

𝑥 = 𝑅𝜆

𝑦 = 𝑅⁄𝑛 (𝑡𝑎𝑛(𝜋⁄4 + Φ⁄2)

Donde R es el radio de la tierra, ln es el logaritmo natural, tangente (tan), Φ es la latitud y λ es la longitud.

Lambert (proyección a un área cilíndrica)

𝑥 = 𝑅𝜆

𝑦 = 𝑅𝑠𝑒𝑛Φ

Construcción de matrices de contigüidad y distancia con OpenGeoDa

Para la construcción de matrices de contigüidad y distancia utilizamos el paquete OpenGeoDa, el cual fue desarrollado por el profesor Luc Anselin en el Departamento de Geografía de la Universidad de Illinois, Urbana-Champaign. Dicho paquete tiene la ventaja de ser gratuito y estar construido específicamente para el análisis de datos espaciales y la aplicación de técnicas de regresión espacial.

Para construir las matrices de pesos espaciales de contigüidad y distancias, se requiere que el archivo (PAN_1_ Jaime (Nuevo)1-2) este activo en el paquete OpenGeoDa.

El procedimiento es elegir primero las opciones de Tools/Weights/Create

Figura N° 6: El procedimiento es elegir primero las opciones de Tools/Weights/Create

Con la elección aparece una ventana con nombre “Weights File Creation” y las opciones para construir matrices contigüidad y de distancia. Lo primero que se requiere es indicarle al OpenGeoDa cuál es la variable que identifica a los objetos en la cartografía (ID). En el caso de que no esté incluido en el archivo se requiere incluirla, para ello primero se elegí la opción “Add ID Variable” con el nombre sugerido por ID y posterior a ello se elegí en la opción de Weights File Creation”. Una vez elegido el ID el OpenGeoDa permite elegir las opciones para la construcción de las matrices.

Figura N° 7: Las matrices de contigüidad

Las matrices de contigüidad se guardan asignando un nombre y la extensión gal y las distancias con gwt.

Estadísticos de dependencia espacial

Para la medición de dependencia espacial se han propuesto numerosos estadísticos, uno de los más utilizados es el índice de Moran (1948), que se define en la fórmula siguiente:

Donde 𝑥𝑖 es la variable cuantitativa en la región i, 𝑥̅ es su media muestral, 𝑤𝑖 son los pesos de la matriz W, R es el tamaño de muestra (Regiones); y,

El índice de Moran sigue una distribución normal estandarizada en muestras grandes (Vaya y Moreno, 2000), de forma tal que un valor positivo (negativo) significativo del índice Z(I) llevará al rechazo de la hipótesis nula de no autocorrelación espacial y a la aceptación de autocorrelación espacial positiva (negativa).

Es posible graficar la información del índice en un diagrama de dispersión de Moran.

Dicho diagrama, presenta en el eje horizontal a la variable 𝑥𝑥 normalizada y en el eje vertical a la variable multiplicada por la matriz de pesos W, lo cual da lugar al retardo espacial de dicha variable. La visualización de un patrón aleatorio en la gráfica brinda evidencia de la ausencia de auto correlación espacial.

Dependencia espacial

La dependencia temporal, como la correlación serial, es unidireccional (el pasado explica el presente), mientras que la dependencia espacial es multidireccional (una región puede estar afectada no solamente por otra región contigua o vecina sino por otras que la rodean, al igual que ella puede afectar a las otras). Este hecho imposibilita la utilización del operador rezago L,

𝐿𝑝Yt= Yt-p, presente en el contexto temporal, para el análisis de la dependencia espacial. La solución consiste en utilizar la matriz W de efectos espaciales como operador de rezago espacial, que se puede leer como una media ponderada de los valores vecinos y se define como:

Donde 𝑦𝑗 es el valor que toma el atributo medido en la vecindad j, 𝑤𝑖j es un ponderador cuya suma es la unidad.

Indicador Local de Asociación Espacial (LISA)

En procesos en los cuales existen patrones de agrupación local o clúster, el índice de Moran no los puede detectar, dado que sólo evalúa la dependencia global de todas las regiones. Como alternativa se han propuesto estadísticos locales, tal es el caso del índice local de Moran que se calcula en cada región o localidad y su definición es la siguiente:

Donde 𝑧𝑖 es el valor de la variable correspondiente en la región i, 𝑁𝑗 es el conjunto de regiones vecinas a i. Un valor elevado, positivo (negativo) y significativo del estadístico da lugar a la existencia de un clúster alrededor de la región i de valores similares elevados (bajos). Con base en el índice local, 𝑰𝑖, es posible encontrar su contribución al índice global, 𝑰, y detectar sus valores extremos lo cual lo convierte en un LISA.

Correlación espacial en el istmo centroamericano con OpenGeoda

Para poder elaborar este análisis se necesita previamente tener activo el archivo states en el paquete OpenGeoda y una matriz de contigüidad tipo Reina (Queen) de orden 1. Para visualizar la dependencia espacial del producto interno bruto utilizaremos la opción del menú de mapas Box-Map, con ella la información del PIB_TOTAL es agrupada en cuartiles y los valores inferiores y superiores son identificados para detectar outliers o valores extremos (Figura N° 8).

Figura N° 8: Box Map del PIB Total del istmo de Panamá de años 2007-2015

Del mapa anterior se desprende que existe una gran heterogeneidad del istmo de Panamá.

En primer lugar, existe una fuerte asociación espacial entre las entidades de ingresos altos y medios altos, las cuales fundamentalmente forman una mancha en el sur. En segundo lugar, se observa que las provincias de PIB_Total (07-15) bajos y medio-bajos también se agrupan formando una mancha que se distribuye fundamentalmente en el centro del istmo de Panamá.

Ahora aplicamos la misma técnica a la PEA para el año 2007-2015, los resultados se muestran en la figura N° 9.

Figura N° 9: Box Map de la Población Económicamente Activa del Istmo de Panamá, años 2007-2015

En este último mapa se observa que la dependencia espacial es notoriamente más elevada que la visualizada antes para la distribución del PIB_Total entre las provincias del istmo de Panamá. Los manchones más oscuros dan cuenta de una fuerte asociación espacial entre las provincias de mayor densidad de población, lo mismo sucede con las manchas más claras que indican asociación entre las entidades con menor densidad de población.

Para evaluar estadísticamente la asociación espacial detectada en los mapas hacemos uso de la opción Space del menú principal del OpenGeoDa y seleccionamos el índice de Moran y su diagrama de dispersión.

Figura N° 10: Índice de Moran

El índice de Moran, en la figura anterior, es de -0.216249 ello indica una baja correlación negativa en el crecimiento de la PEA a nivel global en el istmo de Panamá.

Figura N° 11: LISA del índice de Moran

Figura N°12: Clúster significativo de dependencia espacial

El mapa LISA previo muestra las regiones que contribuyen significativamente al índice global de Moran y que conforman entre sí clúster significativos de dependencia espacial en su dinámica de crecimiento. El grupo de entidades de alto crecimiento con vecinos con la misma característica (Low-High): Panamá Oeste.

Modelos espaciales

Confirmada la dependencia espacial de los datos, es necesario especificar un modelo de regresión espacial que tome en cuenta dicha dependencia. Para plantear una especificación

general prototipo, se combinaron las estrategias de Anselin (1988), Lesage y Pace (2009) y Ehorst (2010) para datos de corte transversal como los que hemos analizado en el modelo 2. El modelo general planteado es:

𝑦𝑖 = 𝜌𝑊1𝑦1 + 𝛽𝑋𝑖 + 𝜃𝑊2𝑥𝑖 + 𝜀𝑖

𝜀𝑖 = 𝜆𝑊3𝜀𝑖 + 𝑢𝑖

con 𝑢𝑖~𝑁 (0, Ω) siendo los elementos diagonales de Ωij=ℎ𝑖(𝑧α) con ℎ𝑖>0.

Donde 𝑦𝑖 es el vector de la variable endógena, 𝑋𝑖 es una matriz de variables exógenas y el término de error 𝜀𝑖 que incorpora una estructura de dependencia espacial autorregresiva,

𝑊1, 𝑊2 y 𝑊3

son matrices de pesos espaciales.

A partir de esta especificación podemos tener cinco casos:

Modelo de regresión clásico sin efectos espaciales:

𝜌 = 0, 𝜆 = 0, 𝜃 = 0

𝑦𝑖 = 𝛽𝑋𝑖 + 𝜀𝑖

𝜀𝑖 = 𝑢𝑖
Modelo Autoregresivo:

𝜌 ≠ 0, 𝜆 = 0, 𝜃 = 0

𝑦𝑖 = 𝜌𝑊𝑖𝑦𝑖 + 𝛽𝑋𝑖 + 𝜀𝑖

𝜀𝑖 = 𝑢𝑖
Modelo de error espacial

𝜌 = 0, 𝜆 ≠ 0, 𝜃 = 0

𝑦𝑖 = 𝛽𝑥𝑖 + 𝜀𝑖

𝜀𝑖 = 𝜆𝑊3𝜀𝑖 + 𝑢𝑖

Que se puede reescribir en su forma final como

𝑦𝑖 = 𝛽𝑥𝑖 + (𝐼 − 𝜆𝑊3)−1𝑢𝑖
Modelo Durbin Espacial

La estrategia de Durbin sobre el factor común se aplica al modelo de Retardo Espacial como:

𝑦𝑖 = 𝜌𝑊1𝑦1 + 𝛽𝑥𝑖 + 𝜃𝑊1𝑥𝑖 + 𝑢𝑖
Modelo mixto autorregresivo espacial con errores espaciales autorregresivos (SARMA)

𝜌 ≠ 0, 𝜆 ≠ 0, 𝜃 = 0

𝑦𝑖 = 𝜌𝑊1𝑦𝑖 + 𝛽𝑥𝑖 + (1 − 𝜆𝑊3)−1𝑢𝑖
Modelo Error Durbin Espacial

𝜌 = 0, 𝜆 ≠ 0, 𝜃 ≠ 0

La estrategia Durbin sobre el factor común se aplica al modelo de Error Espacial con los siguientes pasos:

De la primera ecuación despejar los errores y sustituir en la segunda

𝑦𝑖 − 𝛽𝑥𝑖 = 𝜆𝑊3(𝑦𝑖 − 𝛽𝑥𝑖) + 𝑢𝑖
Al despejar 𝑦𝑖, se obtiene

𝑦𝑖 = 𝜆𝑊3𝑦𝑖 + 𝜃𝑊3𝑥𝑖 + 𝑢𝑖

Donde 𝜃 = −𝛽𝜆

Métodos de Estimación

Al igual que en el modelo de regresión clásico, la presencia de autocorrelación espacial dará lugar a que los estimadores de mínimos cuadrados ordinarios sean insesgados, pero ineficientes, por lo cual no se cumple el teorema de Gauss-Markov. En los modelos 2, 4, 5 y 6 la especificación considera rezagos autorregresivos de la variable dependiente, en consecuencia, los estimadores de mínimos cuadrados ordinarios serán sesgados e inconsistentes. La estimación del modelo espacial se realiza a través del método de máxima verosimilitud en concordancia con el modelo espacial específico que se seleccione.

De acuerdo a Lesage y Pace (2009) la estrategia de estimación de los modelos Durbin Espacial (SDM) y Rezago Espacial (SAR) por sus siglas en inglés, es la siguiente:

El modelo SDM

𝑦 = 𝑝𝑊𝑦 + 𝛼𝑖𝑛 + 𝑋𝛽 + 𝑊𝑋𝜃 + 𝜀

𝜀~𝑁(0, 𝜎2𝐼𝑛)

Donde 0 representa un vector de ceros de 𝑛×1 y 𝑖𝑛 un vector de unos 𝑛𝑛×1 asociados con el término de la constante 𝛼. Este modelo puede ser escrito de forma compacta con

𝑍 = [𝑖𝑛𝑋𝑊𝑋]`𝑦𝛿 = [𝛼𝛽𝜃]

y entonces definir el caso del modelo SAR cuando

𝑍 = [𝑖𝑛𝑋]`𝑦𝛿 = [𝛼𝛽]

El modelo SAR

𝑦 = 𝑝𝑊𝑦 + 𝑍𝛿 + 𝜀

𝜀~𝑁(0, 𝜎2𝐼𝑛)

Si el valor del parámetro rho (𝑝) fuera conocido por decir 𝑝∗, el modelo se puede escribir como

𝑦 − 𝑝∗𝑊𝑦 = 𝑍𝛿 + 𝜀

Por lo que se puede resolver el problema de estimación de 𝛿 como

(𝐼𝑛 − 𝑝∗𝑊)𝑦 = 𝑍𝛿 + 𝜀

𝛿̂ = (𝑍´′𝑍)⁻¹𝑍´′(𝐼𝑛 − 𝑝∗𝑊)𝑦

También se encuentra la estimación de la varianza

𝜎̂2 = 𝑛−1𝑒(𝑝∗)′𝑒(𝑝∗) Donde 𝑒 (𝑝∗) = 𝑦 − 𝑝∗𝑊𝑦 − 𝑍𝛿̂

Donde 𝑒 son los errores de estimación.

Lo anterior indica que el método de estimación se concentra en el log de verosimilitud con respecto a los parámetros de 𝛽 𝑦 𝑝2 y por tanto la maximización de la verosimilitud se convierte a un problema de optimización univariante en el parámetro 𝜌.

Propuesta para estimar al mismo tiempo todo:

Estimar la función de log-verosimilitud concentrada con respecto a los parámetros 𝛽 𝑦 𝜎2, para obtener soluciones muy cercanas a las condiciones de primer orden junto con rho.
Sustituir las estimaciones de 𝛽 𝑦 𝜎2 , por lo que la función de log-verosimilitud depende de la muestra de datos y el parámetro desconocido rho.
En este punto la función de log-verosimilitud está concentrada con respecto rho, por lo que se usa para encontrar la estimación de máxima verosimilitud 𝑝̂que será usada a su vez en la estimación de 𝛽̂(𝑝̂)𝑦 𝜎̂2(𝑝̂) en la siguiente vuelta.

La función de verosimilitud para SDM y SAR toma la forma siguiente

𝑙𝑛𝐿 = − (𝑛/2) ln(𝜋𝜎²) + 𝑙𝑛|𝑙𝑛 − 𝑝𝑊| −𝑒′𝑒/2𝜎²

𝑒 = 𝑦 − 𝑝𝑊𝑦 − 𝑍𝛿̂

𝑝 ∈ (min (𝜔)⁻¹, max (𝜔)⁻¹)

Donde 𝜔 es el vector de 𝑛 × 1 raíces características de la matriz W. Dado que la matriz siempre está construida para tener raíces máximas de 1, entonces 𝜌 ∈ (min (𝜔)−1, 1) el cual es un subconjunto del empleado en la práctica 𝜌 ∈ [0,1).

La función de log-verosimilitud concentrada en los valores de ln L(𝜌) se escribe como

𝑙𝑛𝐿(𝑝) = 𝑘 + 𝑙𝑛|𝐼𝑛 − 𝑝𝑊| − (𝑛⁄2)ln (𝑠(𝑝))

𝑆(𝑝) = 𝑒(𝑝)′𝑒(𝑝) = 𝑒′0𝑒0 − 2𝑝𝑒′0𝑒𝑑 + 𝑝𝑒′𝑑𝑒𝑑

𝑒(𝑝) = 𝑒0 − 𝑝𝑒𝑑

𝑒0 = 𝑦 − 𝑍𝛿0

𝑒𝑑 = 𝑊𝑦 − 𝑍𝛿𝑑

𝛿0 = (𝑍′𝑍)−1𝑍′𝑦

𝛿𝑑 = (𝑍′𝑍)−1𝑍′𝑊𝑦

La optimización es con respecto al parámetro rho y una vez estimado 𝑝̂ con máxima verosimilitud se llega a la estimación con máxima verosimilitud de 𝛿̂ y 𝜎̂

𝛿̂ = 𝛿0 − 𝑝̂𝛿𝑑

𝜎̂2 = 𝑛−1𝑆(𝑝̂)

Ω̂ = 𝜎̂2[(𝐼𝑛 − 𝑝̂𝑊)′(𝐼𝑛 − 𝑝̂𝑊)]⁻¹

Estimación del modelo de Error Espacial (SEM)

Con una estrategia parecida, se obtiene la solución para SEM

𝑦 = 𝑋𝛽 + 𝑢

𝑢 = 𝜆𝑊𝑢 + 𝜀

𝜀~𝑁(0, 𝜎2𝐼𝑛)

𝑙𝑛𝐿 = − (𝑛/2) ln(𝜋𝜎²) + 𝑙𝑛|𝑙𝑛 − 𝜆𝑊| −𝑒′𝑒/2𝜎²

𝑒 = (𝐼𝑛 − 𝜆𝑊)(𝑦 − 𝑋𝛽)

Para un valor dado de 𝜆,

𝛽(𝜆) = (𝑋(𝜆)′𝑋(𝜆))−1𝑋(𝜆)′𝑦(𝜆), donde

𝑋(𝜆) = (𝑋 − 𝜆𝑊𝑋)

𝑦(𝜆) = (𝑦 − 𝜆𝑊𝑦)

𝜎2(𝜆) = 𝑒(𝜆)′𝑒(𝜆)/𝑛

𝑒(𝜆) = 𝑦(𝜆) − 𝑋(𝜆)𝛽(𝜆)

La función de log-verosimilitud concentrada en los parámetros 𝛽 y 𝜎2

𝑙𝑛𝐿(𝜆) = 𝑘 + 𝑙𝑛|𝑙𝑛 − 𝜆𝑊| − (𝑛⁄2)ln (𝑆(𝜆))

𝑆(𝜆) = 𝑒(𝜆)′𝑒(𝜆)

No es cuadrático, se necesita todo un proceso simultáneo

𝛽̂ = 𝛽(𝜆̂)

𝜎̂2 = 𝑛−1𝑆(𝜆̂)

Ω̂ = 𝜎̂2[(𝐼𝑛− 𝜆̂𝑊)′(𝐼𝑛− 𝜆̂𝑊)]⁻¹

Estrategia de Selección de modelos: de lo particular a lo general

Anselin (2005) propone seguir un proceso de decisión para seleccionar entre el modelo clásico y los modelos espaciales SAR, SEM y SARMA, utilizando la estrategia que se muestra en la figura 10 y los estadísticos de contraste para la prueba de hipótesis de los tipos de dependencia espacial.

Figura N° 13: Estrategia de selección de modelos: de lo particular a lo general

Contrastes de autocorrelación espacial

Estos contrastes se aplican después de estimar el modelo clásico para analizar la presencia de algún tipo de dependencia espacial. La hipótesis nula es que el tipo de dependencia espacial es igual a cero, contra la hipótesis alternativa de que es diferente de cero.

Test I de Moran

Mide el efecto de autocorrelación espacial en los residuos 𝑒𝑖 en un modelo no-espacial o clásico, sin distinguir estructuras de Rezago o Error Espacial:

La inferencia se hace con el valor z estandarizado. El primer y segundo momento

Se distribuye como una 𝑋²con un grado de libertad

2. Test LM-EL: Error espacial (robusto)

Se basa en el principio de los multiplicadores de Lagrange y fue propuesto por Burridge (1980):

Se distribuye como una 𝑋²con un grado de libertad

3. Test LM-EL: Error espacial (robusto)

El estadístico LM-ERR se ajusta por una mala especificación local de la dependencia espacial, como es el caso de una variable endógena rezagada (Anselin, 1996):

Se distribuye como una 𝑋²con un grado de libertad

4. Test LM-LAG: Rezago Espacial

Por rezago espaciales de la variable endógena (Anselin, 1988):

Se distribuye como una 𝑋²con un grado de libertad

5.Test LM-LE: Rezago Espacial (Robusto)

El estadístico es robusto ante la presencia de dependencia local del error espacial (Anselin, 1988):

6. Test SARMA: Rezago y Error Espacial

Es robusto ante la presencia de dependencia local y del error espacial (Anselin, 1988):

Se distribuye como una 𝑋²con un grado de libertad.

Un modelo espacial para convergencia Beta con OpenGeoDa

La teoría neoclásica del crecimiento, aplicada al crecimiento regional, permite plantear que una región pobre tendrá un acervo de capital per cápita inferior al de una región rica, en consecuencia, tenderá a crecer más rápido pues su productividad marginal del capital es mayor. La consecuencia de esto es que en el largo plazo se puede presentar convergencia entre las regiones pobres y las más ricas.

Para verificar está hipótesis Sala i Martin (1999) presenta un modelo conocido como convergencia beta absoluta y que se define de la siguiente manera:

ln (𝑦𝑖,𝑡) − ln(𝑦𝑖,𝑡−1) = 𝛼 − 𝛽 ln(𝑦𝑖,𝑡−1) + 𝑢𝑖,𝑡

Donde (𝑦𝑖,𝑡) es el logaritmo natural del producto per cápita de la región i en el período actual t, mientras que (𝑦𝑖,𝑡−1) es el logaritmo del producto per cápita de la región i en el período inicial t-1.

Un coeficiente estimado negativo para la beta será evidencia a favor de la existencia de convergencia absoluta.

Para probar convergencia en las entidades provinciales de Panamá se utiliza la opción Methods/Regression del OpenGeoDa, se incluyen las opciones de resultados, como la del valor z del la I- Moran, se define en la ventana correspondiente la variable dependiente con la tasa de crecimiento entre el PIB_TOTAL entre 2007 y 2015, y la variable explicativa que, para esta ecuación, es la Población Ocupada (PO) y Población desocupada (DES) de 2007-2015. En principio seleccionamos el modelo 1 correspondiente a la regresión clásica, sus resultados se muestran en la figura N° 14 siguiente.

Figura N° 14: Convergencia beta en el modelo de regresión clásico

Dado el elevado p-valor de beta podemos concluir que no es estadísticamente significativa y se rechaza la hipótesis de convergencia.

Las pruebas de diagnóstico al modelo se muestran en la figura N° 15, los diferentes estadísticos de prueba contrastan la hipótesis nula de no autocorrelación espacial.

Figura N° 15: Estadísticos de prueba del modelo de regresión clásico

En los resultados en la Figura N° 15, el índice de Moran presenta un p-valor de 1.08% lo cual permite rechazar la hipótesis nula de no autocorrelación espacial. El LM-lag y el LM-lag robusto presentan la hipótesis alternativa específica de modelo de rezago espacial, mientras que el LM-error y LM-error robusto establecen como hipótesis alternativa al modelo de error espacial. En todos los casos, las versiones robustas se consideran sólo si las versiones estándar son significativas.

En la Figura N° 16 la prueba LM-lag permite rechazar la hipótesis nula, pero el LM robusto no lo confirma, lo mismo sucede con los otros dos estadísticos LM-error, de acuerdo con Anselin, está es una situación patológica en donde el estadístico robusto se invalida debido a la existencia de otro error de especificación, en la forma funcional.

Como alternativa se estimó un modelo de rezago espacial, sus resultados se presentan en la Figura N° 17.

Figura N° 17: Convergencia beta en el modelo de rezago espacial

El coeficiente del rezago espacial es estadísticamente significativo, sin embargo, de nueva cuenta, el coeficiente beta no brinda evidencia de convergencia absoluta.

Figura N° 18: Estadísticos de prueba en el modelo de rezago espacial

El estadístico LR del modelo de rezago espacial se puede apreciar en el Figura N° 18 y permite rechazar la hipótesis nula de modelo de regresión clásica a favor de la alternativa de modelo espacial, por lo menos a un nivel de significancia del 88.8%.

Para completar el análisis se estimó también el modelo de error espacial

Figura N° 18: Convergencia beta en el modelo de error espacial

El coeficiente del error espacial es estadísticamente significativo, pero de nueva cuenta el coeficiente beta no brinda evidencia de convergencia absoluta. Con el estadístico LR del modelo de error espacial también se rechaza la hipótesis nula de modelo de regresión clásica a favor de la alternativa de modelo espacial.

Figura N° 19: Estadísticos de prueba en el modelo de error espacial

Índice de Moran para los residuales del modelo de rezago y error espacial

Figura N° 20: Residuales del modelo de rezago

Figura N° 20: Residuales del modelo error espacial

Al evaluar los residuales de los modelos de rezago y de error espacial, se puede confirmar en la figura anterior que los índices son muy pequeños, sus p-valores son de 0.198 y 0.528 respectivamente los cuales no permiten rechazar la hipótesis nula de no autocorrelación espacial. Lo anterior significa que, los modelos de rezago y error espacial consiguieron eliminar la autocorrelación espacial.

Conclusiones

La utilización del software OpenGeoda se convierte en una herramienta de análisis espacial de primera línea, cuando se trata de estudios de variables económicas y que estén relacionadas con variables geográficas. Haciendo uso del análisis por individuo geográfico como unidad jurisdiccional por provincia en Panamá, observamos en este estudio que nuestro país experimenta un crecimiento económico hipertrófico y se evidencia por medio de los mapas y los indicadores espaciales descriptivos. Además, se puede utilizar de igual forma a individuos, empresas, corregimientos, distritos y países como unidades de análisis espacial.

Utilizando la data de valores tanto para el Producto Interno Bruto Total (PIB_T), la Población Ocupada (PO) y Población Desocupada (DES) enmarcándolo en un análisis de causalidad se pudo establecer modelos de corte espacial y lograr establecer aproximaciones entre las variables. Debemos advertir que la medición del índice de Moran y los modelos de rezago y

de error espacial, constituyen un buen método de predicción econométrica en la investigación inicial

En términos generales el estudiantado y las empresas nacionales pueden ser beneficiadas de los avances que se tenga en el estudio de la Economía Regional y Espacial en Panamá.

Referencias Bibliográficas

Anselin L (2005) Exploring Spatial Data with GeoDaTM: A Workbook. Centre for Spatially Integrated Social Science. Disponible en: http://sal.agecon.uiuc.edu/

Anselin, l., (1998) Spatial Econometrics: Methods and Models. kluwer academic, publishers, dordrecht, the netherlands.

Anselin, l., (2012) Opengeoda 1.2 User’s Guide. Spatial Analysis Laboratory (sal). department of agricultural and consumer economics, university of illinois, urbana- champaign, il.

Chasco C (2003) Econometría espacial aplicada a la predicción-extrapolación de datos microterritoriales. Comunidad de Madrid. Disponible en: http://www.madrid.org

Fotheringham, Brunsdon y Charlton (2000) Quantitative Geography: Perspectives on Spatial Data Analisys.

Haining, Robert (2003) Spatial Data analysis, Cambridge University Press,

Lesage, j. y Pace, k. (2009) Introduction of Spatial econometrics, taylor & francis group, llc. Mendoza, m. á. (1999). Econometría Espacial: Aplicaciones con Opengeoda yr.

Sala i-Martín-Xavier, Apuntes de Crecimiento Económico. antoni bosch editor. barcelona.

Octubre 2019 –Marzo 2020|Vol. 4| No 1 |ISSN 2616-9711

Aplicaciones con OpenGeoda entre la Producción Interna Bruta Total (PIB) y la Población Económicamente Activa (PEA) en Panamá, Años 2007-2015

Applications with OpenGeoda between Total Gross Domestic Production (GDP) and the Economically Active Population (EAP) in Panama, Years 2007-2015

Pérez, Jimmy 1; Ashaw, María 2; Henríquez, Teresita 3;González, Jaime Manuel 4

Págs.: 38 - 64

Recibido: 05/Jul. /2019 Aprobado: 17/Jul./2019

Resumen

Abstract

Introducción

Materiales y métodos

Vecindad y dependencia espacial

Matriz de vecindad por contigüidad

Construcción analítica de una matriz de vecindad

Matriz de vecindad por distancia

Localización en el plano cartesiano

Métrica de Minkowski

Localización en el globo o superficie de la tierra

Construcción de matrices de contigüidad y distancia con OpenGeoDa

Estadísticos de dependencia espacial

Dependencia espacial

Indicador Local de Asociación Espacial (LISA)

Correlación espacial en el istmo centroamericano con OpenGeoda

Modelos espaciales

Métodos de Estimación

El modelo SDM

El modelo SAR

Estrategia de Selección de modelos: de lo particular a lo general

Contrastes de autocorrelación espacial

Un modelo espacial para convergencia Beta con OpenGeoDa

Conclusiones

Referencias Bibliográficas

Pérez, Jimmy ¹; Ashaw, María ²; Henríquez, Teresita³;González, Jaime Manuel ⁴