Octubre 2019 –Marzo 2020|Vol. 4| No 1 |ISSN 2616-9711 |
1. Estudiante de tesis; Centro regional de Coclé (C.R. Coclé); Lic. En mercadeo y comercio Internacional. Universidad Tecnológica de Panamá (UTP). agustinperez27@hotmail.es
2. Docente Universitaria (UP); Lic. En matemática, Máster en Matemática Aplicada. jetziba_beula@yahoo.es
3. Docente Universitaria (UP); Lic en Estadística, Master en Estadística Aplicada. terehen2@yahoo.com
4. Docente Universitario (ULP, UP y UTP); Lic. En Economía, Máster en Economía y Desarrollo. jaime_manuelg@hotmail.com, https://orcid.org/0000-0002-7718-1896
Dentro de los estudios de mercado y potencial económico de un individuo, empresa y jurisdicciones geográfica se hace importante la utilización de Software apropiado para el análisis espacial, como es el OpenGeoda.
Para el caso de Panamá, se utilizó una base de datos del producto Interno Bruto de Panamá (PIB) provincial, extrayéndose algunos mapas ilustrativos de las variables de producción y del mercado de trabajo en Panamá. De igual forma, se trabajó con una matriz inversa y se pudo ilustrar y calcular el índice de Moran.
El software nos permitió trabajar modelos de econometría espacial que se pueden apreciar desde un mínimo cuadrado ordinario hasta modelos dinámicos en un análisis espacial y regional en Panamá.
Palabras claves: Econometría Espacial, Correlación Espacial, Índice de Moran
Within the market studies and economic potential of an individual, company and geographic jurisdictions it is important to use appropriate software for spatial analysis, such as OpenGeoda.
In the case of Panama, a database of the provincial gross domestic product (GDP) of Panama was used, extracting some illustrative maps of the variables of production and the labor market in Panama. In the same way, we worked with an inverse matrix and we could illustrate and calculate the Moran index.
The software allowed us to work spatial econometrics models that can be appreciated from a minimum ordinary square to dynamic models in a spatial and regional analysis in Panama.
Keywords: Spatial Econometrics, spatial correlation, Moran index
Como estudioso de los fenómenos económicos, sociales o ambientales seguramente se habrá percatado que cada vez se realiza una mayor difusión de información georreferenciada. Es decir, las variables aparecen vinculadas a su dimensión espacial y pueden ser manejadas en potentes mapas en los que se van superponiendo capas de información.
A la par de la difusión de datos georreferenciados, también se han desarrollado modernos paquetes computacionales, conocidos como Sistemas de Información Geográfica (GIS por sus siglas en inglés), ello ha permitido dar impulso a una nueva subdisciplina de la econometría conocida como econometría espacial.
La econometría espacial fue definida a principios de los años setenta por Jean Paelinck como el creciente cuerpo de la literatura en ciencia regional que trata primordialmente con la estimación y prueba de problemas encontrados en la implantación de modelos econométricos multirregionales.
Luc Anselin (1988) uno de los pioneros y grandes impulsores de la econometría espacial considera que el campo de esta disciplina está formado por: “…aquellos métodos y técnicas que, sustentados en una representación formal de la estructura de la dependencia y heterogeneidad espacial, provee el medio para llevar a cabo la adecuada especificación, estimación, prueba de hipótesis y predicción para modelos en la ciencia regional.”
Los métodos desarrollados por la econometría espacial permiten atender problemas de violación a los supuestos del modelo de regresión ordinario, que no es posible resolverlos en el marco de los modelos econométricos de Mínimos Cuadrados Ordinarios (MCO).
Estos problemas son típicos en los datos espaciales y se refieren a:
El caso al que se le ha dedicado mayor atención es al primero, debido a que el segundo ha podido estudiarse en el marco de modelos de panel y otras técnicas similares en donde la heterocedasticidad y el cambio estructural juegan un papel relevante.
Usualmente cuando el economista maneja series económicas, sociales o ambientales lo hace desde una perspectiva en la cual toma como dadas las coordenadas de localización geográfica de las variables. El obviar el contexto espacial significa una pérdida importante de información, sólo piense lo que ocurriría sí, por ejemplo, un estudio de criminalidad en una ciudad no considerará el efecto que tiene la situación que priva en las ciudades vecinas.
En ese sentido, los datos generalmente presentan algún tipo de dependencia o auto correlación espacial, la cual puede definirse como la existencia de una relación funcional entre lo que ocurre en un punto del espacio y lo que sucede en otro lugar, lo cual se explica fundamentalmente por razones de interacción humana con su entorno físico-ambiental. En tal sentido, las variables socioeconómicas, físicas, ambientales y otras; generalmente presentan algún tipo de dependencia o auto correlación espacial.
La dependencia espacial implicaría que al tomar en consideración una variable, para diferentes localidades, esperaríamos características más similares en localidades vecinas, que en aquéllas separadas por grandes distancias. La dependencia espacial puede ser positiva o negativa, de ser positiva la presencia de un atributo en una localidad se extendería a las regiones vecinas y, en caso de ser negativa, obstaculizaría su presencia en sus vecindades.
Los datos espaciales se pueden clasificar de acuerdo con el objeto espacial al que se refieren y al nivel de medida de las variables. Dicha clasificación puede ilustrarse matricialmente como en la figura N°1
π§1(1) |
π§2(1) |
…. |
π§π(1) |
S(1) |
π§1(2) |
π§2(2) |
…. |
π§π(2) |
S(2) |
…. |
…. |
…. |
…. |
…. |
…. |
…. |
…. |
…. |
…. |
…. |
…. |
…. |
…. |
…. |
π§1(π) |
π§2(π) |
|
π§π(π) |
S(n) |
Figura N° 1: Matriz de datos Espaciales
Donde tenemos k variables {z1, z2, …, zk} medidas en la localización s(i) donde i=1, 2, n. Si incorporamos el factor de temporalidad, podríamos tener una matriz de este tipo para cada
período del tiempo. Las relaciones entre las variables y localizaciones clasificadas en la matriz de datos pueden establecerse a través de conectividad o vecindad.
La noción de vecindad se puede establecer de forma binaria; en tal caso, sí dos unidades espaciales tienen una frontera común se les asigna un uno, en caso contrario se le asigna un cero.
Bajo esta sencilla idea, una variable particular podría referenciarse en un mapa, a partir del cual es posible establecer sus fronteras y, en consecuencia, identificar sus vecindades. Luc Anselin (1988), plantea diferentes medidas de vecindad, las cuales se asemejan a un tablero de ajedrez y que podemos apreciar en la figura N° 2:
Figura N° 2: Diferentes Vecindades
La vecindad entre puntos también puede ser de orden superior, sí se consideran series de bandas concéntricas alrededor de la localidad bajo consideración.
|
|
D |
|
|
|
C |
B |
C |
|
D |
B |
A |
B |
D |
|
C |
B |
C |
|
|
|
D |
|
|
Figura N° 3: Vecindades de Orden superior
Por ejemplo, en la figura N°3 y considerando vecindad tipo torre, las celdas C y D son contiguas de segundo orden a la celda A, y son contiguas de primer orden a B.
En un mapa geográfico, como en la figura N°4, es posible construir cualquiera de los tipos de matrices de vecindad descritas anteriormente.
Figura N° 4: Mapa del istmo Panamá
Para ilustrar la forma en la que se construye una matriz binaria de vecindades por Anselin (1988). Suponga que la localización de diferentes variables podría ubicarse en un mapa cuadriculado como el siguiente:
|
|
|
1 |
2B |
3 |
4B |
5A |
6B |
7 |
8B |
9 |
Figura N° 5: Mapa cuadriculado
A cada localidad le asignamos un número y tomando como punto de referencia la localidad 5 calculamos vecindades tipo torre. La localidad 1 y la 3 no tienen vecindad, por ello se le asigna un cero en la matriz de vecindades. La vecindad de una localidad consigo misma es contabilizada también con un cero. La matriz de contactos resultante aparece en la figura siguiente:
Localidad |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
1 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
2 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
3 |
0 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
4 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
5 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
0 |
6 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
0 |
7 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
8 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
9 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
Figura N° 6: Matriz de contactos
La matriz de vecindades binarias es limitada, ya que únicamente considera la vecindad física, por lo cual no contabiliza la posibilidad de interacción entre regiones alejadas. Por ello, han sido propuestas otras medidas de vecindad alternativas, sustentadas en distancias de diferente tipo y cuya matriz, W, es conocida como la matriz de pesos o contactos espaciales.
Anselin plantea que, en caso de que la unidad espacial sea un sistema urbano, la vecindad puede ser obtenida de la trayectoria más corta en una red o gráfica formada por una conexión de puntos. Por ejemplo, en la figura 5, la distancia más corta entre los puntos es representada por la línea punteada y la vecindad por el círculo que conecta los puntos y tiene como centroide a la localidad A.
Figura N° 5: Vecindad por distancia más corta
Considerando los centroides como punto de referencia para medir las distancias geográficas, Fotheringham, Brunsdon y Charlton (2000) proponen las siguientes medidas de distancias:
En un sistema cartesiano, la distancia se mide por el teorema de Pitágoras y la localización es por medio de las coordenadas geográficas: latitud y longitud.
Con base a las coordenadas de latitud (x) y la longitud (y), la distancia entre los centroides de las localidades i y j.
La distancia euclidiana entre dos localidades i y j con coordenadas (xi,1, xi,2), (xj,1, xj,2), se puede escribir también como:
La distancia puede ser generalizada a m dimensiones.
En el caso de que p=2 es la distancia euclidiana, si p=1 es la distancia conocida como Manhattan o distancia taxicab.
En el caso de considerar la superficie de la tierra en lugar del plano cartesiano, se necesita de los cálculos geométricos:
Trigonometría esférica (curvatura de la tierra)
πππ = π πππππ [cos(90° − Φπ) cos (90° − Φπ)] + π ππ(90° − Φπ)π ππ(90° − Φπ)cos (ππ −ππ)
R es el radio de la tierra, arcoseno (arcos), coseno (cos), seno (sen), la latitud y longitud de la locación i
Son (Φπ, ππ)
π₯ = π π
π¦ = π ⁄π (π‘ππ(π⁄4 + Φ⁄2)
Donde R es el radio de la tierra, ln es el logaritmo natural, tangente (tan), Φ es la latitud y λ es la longitud.
Lambert (proyección a un área cilíndrica)
π₯ = π π
π¦ = π π ππΦ
Para la construcción de matrices de contigüidad y distancia utilizamos el paquete OpenGeoDa, el cual fue desarrollado por el profesor Luc Anselin en el Departamento de Geografía de la Universidad de Illinois, Urbana-Champaign. Dicho paquete tiene la ventaja de ser gratuito y estar construido específicamente para el análisis de datos espaciales y la aplicación de técnicas de regresión espacial.
Para construir las matrices de pesos espaciales de contigüidad y distancias, se requiere que el archivo (PAN_1_ Jaime (Nuevo)1-2) este activo en el paquete OpenGeoDa.
El procedimiento es elegir primero las opciones de Tools/Weights/Create
Figura N° 6: El procedimiento es elegir primero las opciones de Tools/Weights/Create
Con la elección aparece una ventana con nombre “Weights File Creation” y las opciones para construir matrices contigüidad y de distancia. Lo primero que se requiere es indicarle al OpenGeoDa cuál es la variable que identifica a los objetos en la cartografía (ID). En el caso de que no esté incluido en el archivo se requiere incluirla, para ello primero se elegí la opción “Add ID Variable” con el nombre sugerido por ID y posterior a ello se elegí en la opción de Weights File Creation”. Una vez elegido el ID el OpenGeoDa permite elegir las opciones para la construcción de las matrices.
Figura N° 7: Las matrices de contigüidad
Las matrices de contigüidad se guardan asignando un nombre y la extensión gal y las distancias con gwt.
Para la medición de dependencia espacial se han propuesto numerosos estadísticos, uno de los más utilizados es el índice de Moran (1948), que se define en la fórmula siguiente:
Donde π₯π es la variable cuantitativa en la región i, π₯Μ es su media muestral, π€π son los pesos de la matriz W, R es el tamaño de muestra (Regiones); y,
El índice de Moran sigue una distribución normal estandarizada en muestras grandes (Vaya y Moreno, 2000), de forma tal que un valor positivo (negativo) significativo del índice Z(I) llevará al rechazo de la hipótesis nula de no autocorrelación espacial y a la aceptación de autocorrelación espacial positiva (negativa).
Es posible graficar la información del índice en un diagrama de dispersión de Moran.
Dicho diagrama, presenta en el eje horizontal a la variable π₯π₯ normalizada y en el eje vertical a la variable multiplicada por la matriz de pesos W, lo cual da lugar al retardo espacial de dicha variable. La visualización de un patrón aleatorio en la gráfica brinda evidencia de la ausencia de auto correlación espacial.
La dependencia temporal, como la correlación serial, es unidireccional (el pasado explica el presente), mientras que la dependencia espacial es multidireccional (una región puede estar afectada no solamente por otra región contigua o vecina sino por otras que la rodean, al igual que ella puede afectar a las otras). Este hecho imposibilita la utilización del operador rezago L,
πΏπYt= Yt-p, presente en el contexto temporal, para el análisis de la dependencia espacial. La solución consiste en utilizar la matriz W de efectos espaciales como operador de rezago espacial, que se puede leer como una media ponderada de los valores vecinos y se define como:
Donde π¦π es el valor que toma el atributo medido en la vecindad j, π€πj es un ponderador cuya suma es la unidad.
En procesos en los cuales existen patrones de agrupación local o clúster, el índice de Moran no los puede detectar, dado que sólo evalúa la dependencia global de todas las regiones. Como alternativa se han propuesto estadísticos locales, tal es el caso del índice local de Moran que se calcula en cada región o localidad y su definición es la siguiente:
Donde π§π es el valor de la variable correspondiente en la región i, ππ es el conjunto de regiones vecinas a i. Un valor elevado, positivo (negativo) y significativo del estadístico da lugar a la existencia de un clúster alrededor de la región i de valores similares elevados (bajos). Con base en el índice local, π°π, es posible encontrar su contribución al índice global, π°, y detectar sus valores extremos lo cual lo convierte en un LISA.
Para poder elaborar este análisis se necesita previamente tener activo el archivo states en el paquete OpenGeoda y una matriz de contigüidad tipo Reina (Queen) de orden 1. Para visualizar la dependencia espacial del producto interno bruto utilizaremos la opción del menú de mapas Box-Map, con ella la información del PIB_TOTAL es agrupada en cuartiles y los valores inferiores y superiores son identificados para detectar outliers o valores extremos (Figura N° 8).
Figura N° 8: Box Map del PIB Total del istmo de Panamá de años 2007-2015
Del mapa anterior se desprende que existe una gran heterogeneidad del istmo de Panamá.
En primer lugar, existe una fuerte asociación espacial entre las entidades de ingresos altos y medios altos, las cuales fundamentalmente forman una mancha en el sur. En segundo lugar, se observa que las provincias de PIB_Total (07-15) bajos y medio-bajos también se agrupan formando una mancha que se distribuye fundamentalmente en el centro del istmo de Panamá.
Ahora aplicamos la misma técnica a la PEA para el año 2007-2015, los resultados se muestran en la figura N° 9.
Figura N° 9: Box Map de la Población Económicamente Activa del Istmo de Panamá, años 2007-2015
En este último mapa se observa que la dependencia espacial es notoriamente más elevada que la visualizada antes para la distribución del PIB_Total entre las provincias del istmo de Panamá. Los manchones más oscuros dan cuenta de una fuerte asociación espacial entre las provincias de mayor densidad de población, lo mismo sucede con las manchas más claras que indican asociación entre las entidades con menor densidad de población.
Para evaluar estadísticamente la asociación espacial detectada en los mapas hacemos uso de la opción Space del menú principal del OpenGeoDa y seleccionamos el índice de Moran y su diagrama de dispersión.
Figura N° 10: Índice de Moran
El índice de Moran, en la figura anterior, es de -0.216249 ello indica una baja correlación negativa en el crecimiento de la PEA a nivel global en el istmo de Panamá.
Figura N° 11: LISA del índice de Moran
Figura N°12: Clúster significativo de dependencia espacial
El mapa LISA previo muestra las regiones que contribuyen significativamente al índice global de Moran y que conforman entre sí clúster significativos de dependencia espacial en su dinámica de crecimiento. El grupo de entidades de alto crecimiento con vecinos con la misma característica (Low-High): Panamá Oeste.
Confirmada la dependencia espacial de los datos, es necesario especificar un modelo de regresión espacial que tome en cuenta dicha dependencia. Para plantear una especificación
general prototipo, se combinaron las estrategias de Anselin (1988), Lesage y Pace (2009) y Ehorst (2010) para datos de corte transversal como los que hemos analizado en el modelo 2. El modelo general planteado es:
π¦π = ππ1π¦1 + π½ππ + ππ2π₯π + ππ
ππ = ππ3ππ + π’π
con π’π~π (0, Ω) siendo los elementos diagonales de Ωij=βπ(π§α) con βπ>0.
Donde π¦π es el vector de la variable endógena, ππ es una matriz de variables exógenas y el término de error ππ que incorpora una estructura de dependencia espacial autorregresiva,
π1, π2 y π3
son matrices de pesos espaciales.
A partir de esta especificación podemos tener cinco casos:
Modelo de regresión clásico sin efectos espaciales:
π = 0, π = 0, π = 0
π¦π = π½ππ + ππ
ππ = π’π
Modelo Autoregresivo:
π ≠ 0, π = 0, π = 0
π¦π = ππππ¦π + π½ππ + ππ
ππ = π’π
Modelo de error espacial
π = 0, π ≠ 0, π = 0
π¦π = π½π₯π + ππ
ππ = ππ3ππ + π’π
Que se puede reescribir en su forma final como
π¦π = π½π₯π + (πΌ − ππ3)−1π’π
Modelo Durbin Espacial
La estrategia de Durbin sobre el factor común se aplica al modelo de Retardo Espacial como:
π¦π = ππ1π¦1 + π½π₯π + ππ1π₯π + π’π
Modelo mixto autorregresivo espacial con errores espaciales autorregresivos (SARMA)
π ≠ 0, π ≠ 0, π = 0
π¦π = ππ1π¦π + π½π₯π + (1 − ππ3)−1π’π
Modelo Error Durbin Espacial
π = 0, π ≠ 0, π ≠ 0
La estrategia Durbin sobre el factor común se aplica al modelo de Error Espacial con los siguientes pasos:
De la primera ecuación despejar los errores y sustituir en la segunda
π¦π − π½π₯π = ππ3(π¦π − π½π₯π) + π’π
Al despejar π¦π, se obtiene
π¦π = ππ3π¦π + ππ3π₯π + π’π
Donde π = −π½π
Al igual que en el modelo de regresión clásico, la presencia de autocorrelación espacial dará lugar a que los estimadores de mínimos cuadrados ordinarios sean insesgados, pero ineficientes, por lo cual no se cumple el teorema de Gauss-Markov. En los modelos 2, 4, 5 y 6 la especificación considera rezagos autorregresivos de la variable dependiente, en consecuencia, los estimadores de mínimos cuadrados ordinarios serán sesgados e inconsistentes. La estimación del modelo espacial se realiza a través del método de máxima verosimilitud en concordancia con el modelo espacial específico que se seleccione.
De acuerdo a Lesage y Pace (2009) la estrategia de estimación de los modelos Durbin Espacial (SDM) y Rezago Espacial (SAR) por sus siglas en inglés, es la siguiente:
π¦ = πππ¦ + πΌππ + ππ½ + πππ + π
π~π(0, π2πΌπ)
Donde 0 representa un vector de ceros de π×1 y ππ un vector de unos ππ×1 asociados con el término de la constante πΌ. Este modelo puede ser escrito de forma compacta con
π = [πππππ]`π¦πΏ = [πΌπ½π]
y entonces definir el caso del modelo SAR cuando
π = [πππ]`π¦πΏ = [πΌπ½]
π¦ = πππ¦ + ππΏ + π
π~π(0, π2πΌπ)
Si el valor del parámetro rho (π) fuera conocido por decir π∗, el modelo se puede escribir como
π¦ − π∗ππ¦ = ππΏ + π
Por lo que se puede resolver el problema de estimación de πΏ como
(πΌπ − π∗π)π¦ = ππΏ + π
πΏΜ = (π´′π)−1 π´′(πΌπ − π∗π)π¦
También se encuentra la estimación de la varianza
πΜ2 = π−1π(π∗)′π(π∗) Donde π (π∗) = π¦ − π∗ππ¦ − ππΏΜ
Donde π son los errores de estimación.
Lo anterior indica que el método de estimación se concentra en el log de verosimilitud con respecto a los parámetros de π½ π¦ π2 y por tanto la maximización de la verosimilitud se convierte a un problema de optimización univariante en el parámetro π.
Propuesta para estimar al mismo tiempo todo:
Estimar la función de log-verosimilitud concentrada con respecto a los parámetros π½ π¦ π2, para obtener soluciones muy cercanas a las condiciones de primer orden junto con rho.
Sustituir las estimaciones de π½ π¦ π2 , por lo que la función de log-verosimilitud depende de la muestra de datos y el parámetro desconocido rho.
En este punto la función de log-verosimilitud está concentrada con respecto rho, por lo que se usa para encontrar la estimación de máxima verosimilitud πΜque será usada a su vez en la estimación de π½Μ(πΜ)π¦ πΜ2(πΜ) en la siguiente vuelta.
La función de verosimilitud para SDM y SAR toma la forma siguiente
πππΏ = − (π/2) ln(ππ2) + ππ|ππ − ππ| −π′π/2π2
π = π¦ − πππ¦ − ππΏΜ
π ∈ (min (π)−1, max (π)−1)
Donde π es el vector de π × 1 raíces características de la matriz W. Dado que la matriz siempre está construida para tener raíces máximas de 1, entonces π ∈ (min (π)−1, 1) el cual es un subconjunto del empleado en la práctica π ∈ [0,1).
La función de log-verosimilitud concentrada en los valores de ln L(π) se escribe como
πππΏ(π) = π + ππ|πΌπ − ππ| − (π⁄2)ln (π (π))
π(π) = π(π)′π(π) = π′0π0 − 2ππ′0ππ + ππ′πππ
π(π) = π0 − πππ
π0 = π¦ − ππΏ0
ππ = ππ¦ − ππΏπ
πΏ0 = (π′π)−1π′π¦
πΏπ = (π′π)−1π′ππ¦
La optimización es con respecto al parámetro rho y una vez estimado πΜ con máxima verosimilitud se llega a la estimación con máxima verosimilitud de πΏΜ y πΜ
πΏΜ = πΏ0 − πΜπΏπ
πΜ2 = π−1π(πΜ)
ΩΜ = πΜ2[(πΌπ − πΜπ)′(πΌπ − πΜπ)]−1
Estimación del modelo de Error Espacial (SEM)
Con una estrategia parecida, se obtiene la solución para SEM
π¦ = ππ½ + π’
π’ = πππ’ + π
π~π(0, π2πΌπ)
πππΏ = − (π/2) ln(ππ2) + ππ|ππ − ππ| −π′π/2π2
π = (πΌπ − ππ)(π¦ − ππ½)
Para un valor dado de π,
π½(π) = (π(π)′π(π))−1π(π)′π¦(π), donde
π(π) = (π − πππ)
π¦(π) = (π¦ − πππ¦)
π2(π) = π(π)′π(π)/π
π(π) = π¦(π) − π(π)π½(π)
La función de log-verosimilitud concentrada en los parámetros π½ y π2
πππΏ(π) = π + ππ|ππ − ππ| − (π⁄2)ln (π(π))
π(π) = π(π)′π(π)
No es cuadrático, se necesita todo un proceso simultáneo
π½Μ = π½(πΜ)
πΜ2 = π−1π(πΜ)
ΩΜ = πΜ2[(πΌπ− πΜπ)′(πΌπ− πΜπ)]−1
Anselin (2005) propone seguir un proceso de decisión para seleccionar entre el modelo clásico y los modelos espaciales SAR, SEM y SARMA, utilizando la estrategia que se muestra en la figura 10 y los estadísticos de contraste para la prueba de hipótesis de los tipos de dependencia espacial.
Figura N° 13: Estrategia de selección de modelos: de lo particular a lo general
Estos contrastes se aplican después de estimar el modelo clásico para analizar la presencia de algún tipo de dependencia espacial. La hipótesis nula es que el tipo de dependencia espacial es igual a cero, contra la hipótesis alternativa de que es diferente de cero.
La inferencia se hace con el valor z estandarizado. El primer y segundo momento
Se distribuye como una π2 con un grado de libertad
2. Test LM-EL: Error espacial (robusto)
Se basa en el principio de los multiplicadores de Lagrange y fue propuesto por Burridge (1980):
Se distribuye como una π2 con un grado de libertad
3. Test LM-EL: Error espacial (robusto)
El estadístico LM-ERR se ajusta por una mala especificación local de la dependencia espacial, como es el caso de una variable endógena rezagada (Anselin, 1996):
Se distribuye como una π2 con un grado de libertad
4. Test LM-LAG: Rezago Espacial
Por rezago espaciales de la variable endógena (Anselin, 1988):
Se distribuye como una π2 con un grado de libertad
5.Test LM-LE: Rezago Espacial (Robusto)
El estadístico es robusto ante la presencia de dependencia local del error espacial (Anselin, 1988):
6. Test SARMA: Rezago y Error Espacial
Es robusto ante la presencia de dependencia local y del error espacial (Anselin, 1988):
Se distribuye como una π2 con un grado de libertad.
La teoría neoclásica del crecimiento, aplicada al crecimiento regional, permite plantear que una región pobre tendrá un acervo de capital per cápita inferior al de una región rica, en consecuencia, tenderá a crecer más rápido pues su productividad marginal del capital es mayor. La consecuencia de esto es que en el largo plazo se puede presentar convergencia entre las regiones pobres y las más ricas.
Para verificar está hipótesis Sala i Martin (1999) presenta un modelo conocido como convergencia beta absoluta y que se define de la siguiente manera:
ln (π¦π,π‘) − ln(π¦π,π‘−1) = πΌ − π½ ln(π¦π,π‘−1) + π’π,π‘
Donde (π¦π,π‘) es el logaritmo natural del producto per cápita de la región i en el período actual t, mientras que (π¦π,π‘−1) es el logaritmo del producto per cápita de la región i en el período inicial t-1.
Un coeficiente estimado negativo para la beta será evidencia a favor de la existencia de convergencia absoluta.
Para probar convergencia en las entidades provinciales de Panamá se utiliza la opción Methods/Regression del OpenGeoDa, se incluyen las opciones de resultados, como la del valor z del la I- Moran, se define en la ventana correspondiente la variable dependiente con la tasa de crecimiento entre el PIB_TOTAL entre 2007 y 2015, y la variable explicativa que, para esta ecuación, es la Población Ocupada (PO) y Población desocupada (DES) de 2007-2015. En principio seleccionamos el modelo 1 correspondiente a la regresión clásica, sus resultados se muestran en la figura N° 14 siguiente.
Figura N° 14: Convergencia beta en el modelo de regresión clásico
Dado el elevado p-valor de beta podemos concluir que no es estadísticamente significativa y se rechaza la hipótesis de convergencia.
Las pruebas de diagnóstico al modelo se muestran en la figura N° 15, los diferentes estadísticos de prueba contrastan la hipótesis nula de no autocorrelación espacial.
Figura N° 15: Estadísticos de prueba del modelo de regresión clásico
En los resultados en la Figura N° 15, el índice de Moran presenta un p-valor de 1.08% lo cual permite rechazar la hipótesis nula de no autocorrelación espacial. El LM-lag y el LM-lag robusto presentan la hipótesis alternativa específica de modelo de rezago espacial, mientras que el LM-error y LM-error robusto establecen como hipótesis alternativa al modelo de error espacial. En todos los casos, las versiones robustas se consideran sólo si las versiones estándar son significativas.
En la Figura N° 16 la prueba LM-lag permite rechazar la hipótesis nula, pero el LM robusto no lo confirma, lo mismo sucede con los otros dos estadísticos LM-error, de acuerdo con Anselin, está es una situación patológica en donde el estadístico robusto se invalida debido a la existencia de otro error de especificación, en la forma funcional.
Como alternativa se estimó un modelo de rezago espacial, sus resultados se presentan en la Figura N° 17.
Figura N° 17: Convergencia beta en el modelo de rezago espacial
El coeficiente del rezago espacial es estadísticamente significativo, sin embargo, de nueva cuenta, el coeficiente beta no brinda evidencia de convergencia absoluta.
Figura N° 18: Estadísticos de prueba en el modelo de rezago espacial
El estadístico LR del modelo de rezago espacial se puede apreciar en el Figura N° 18 y permite rechazar la hipótesis nula de modelo de regresión clásica a favor de la alternativa de modelo espacial, por lo menos a un nivel de significancia del 88.8%.
Para completar el análisis se estimó también el modelo de error espacial
Figura N° 18: Convergencia beta en el modelo de error espacial
El coeficiente del error espacial es estadísticamente significativo, pero de nueva cuenta el coeficiente beta no brinda evidencia de convergencia absoluta. Con el estadístico LR del modelo de error espacial también se rechaza la hipótesis nula de modelo de regresión clásica a favor de la alternativa de modelo espacial.
Figura N° 19: Estadísticos de prueba en el modelo de error espacial
Índice de Moran para los residuales del modelo de rezago y error espacial
Figura N° 20: Residuales del modelo de rezago
Figura N° 20: Residuales del modelo error espacial
Al evaluar los residuales de los modelos de rezago y de error espacial, se puede confirmar en la figura anterior que los índices son muy pequeños, sus p-valores son de 0.198 y 0.528 respectivamente los cuales no permiten rechazar la hipótesis nula de no autocorrelación espacial. Lo anterior significa que, los modelos de rezago y error espacial consiguieron eliminar la autocorrelación espacial.
La utilización del software OpenGeoda se convierte en una herramienta de análisis espacial de primera línea, cuando se trata de estudios de variables económicas y que estén relacionadas con variables geográficas. Haciendo uso del análisis por individuo geográfico como unidad jurisdiccional por provincia en Panamá, observamos en este estudio que nuestro país experimenta un crecimiento económico hipertrófico y se evidencia por medio de los mapas y los indicadores espaciales descriptivos. Además, se puede utilizar de igual forma a individuos, empresas, corregimientos, distritos y países como unidades de análisis espacial.
Utilizando la data de valores tanto para el Producto Interno Bruto Total (PIB_T), la Población Ocupada (PO) y Población Desocupada (DES) enmarcándolo en un análisis de causalidad se pudo establecer modelos de corte espacial y lograr establecer aproximaciones entre las variables. Debemos advertir que la medición del índice de Moran y los modelos de rezago y
de error espacial, constituyen un buen método de predicción econométrica en la investigación inicial
En términos generales el estudiantado y las empresas nacionales pueden ser beneficiadas de los avances que se tenga en el estudio de la Economía Regional y Espacial en Panamá.
Anselin L (2005) Exploring Spatial Data with GeoDaTM: A Workbook. Centre for Spatially Integrated Social Science. Disponible en: http://sal.agecon.uiuc.edu/
Anselin, l., (1998) Spatial Econometrics: Methods and Models. kluwer academic, publishers, dordrecht, the netherlands.
Anselin, l., (2012) Opengeoda 1.2 User’s Guide. Spatial Analysis Laboratory (sal). department of agricultural and consumer economics, university of illinois, urbana- champaign, il.
Chasco C (2003) Econometría espacial aplicada a la predicción-extrapolación de datos microterritoriales. Comunidad de Madrid. Disponible en: http://www.madrid.org
Fotheringham, Brunsdon y Charlton (2000) Quantitative Geography: Perspectives on Spatial Data Analisys.
Haining, Robert (2003) Spatial Data analysis, Cambridge University Press,
Lesage, j. y Pace, k. (2009) Introduction of Spatial econometrics, taylor & francis group, llc. Mendoza, m. á. (1999). Econometría Espacial: Aplicaciones con Opengeoda yr.
Sala i-Martín-Xavier, Apuntes de Crecimiento Económico. antoni bosch editor. barcelona.