Metodología — Índices de Riesgo Dual AI-GPR (IRP + IRE)
Base metodológica: Construido siguiendo a Iacoviello & Tong (2026), "The AI-GPR Index: Measuring Geopolitical Risk using Artificial Intelligence", Federal Reserve Board Working Paper. Aplicado a Perú como dos índices independientes — IRP (político) e IRE (económico) — usando Claude Sonnet 4.6 como clasificador LLM, 16 fuentes de noticias con feeds RSS y backfill de archivo histórico, y normalización por feed (media = 100 sobre línea base 2025).
Resumen Ejecutivo
Qhawarina produce dos índices de riesgo diarios independientes: el IRP (Índice de Riesgo Político) y el IRE (Índice de Riesgo Económico). Cada índice agrega puntajes de severidad asignados por Claude Sonnet 4.6 a artículos individuales, usando una normalización por feed que elimina el sesgo de composición al agregar nuevos feeds. Ambos índices están calibrados a una media de 100 sobre la línea base del año 2025. Es la primera aplicación de la metodología AI-GPR a un país latinoamericano con frecuencia diaria.
1. La Fórmula AI-GPR de Índice Dual
El IRP y el IRE se calculan con el mismo procedimiento de cuatro pasos, aplicado independientemente a los puntajes políticos y económicos. La innovación clave respecto a un enfoque de suma diaria simple es la normalización por feed (Paso 2), que previene la distorsión del índice cuando se agregan nuevos feeds o cuando un diario publica más de lo usual.
1.1 Umbrales de Nivel (IRP e IRE)
| Nivel | Valor del índice | Interpretación |
|---|---|---|
| MÍNIMO | < 50 | Calma excepcional, noticias de rutina |
| BAJO | 50–90 | Por debajo del promedio, pocas notas relevantes |
| NORMAL | 90–110 | Entorno normal, cerca de la media histórica |
| ELEVADO | 110–150 | Inestabilidad por encima del promedio, vigilancia activa |
| ALTO | 150–200 | Crisis significativa, múltiples eventos graves |
| CRÍTICO | > 200 | Crisis aguda: vacancia, colapso institucional, emergencia |
1.2 Suavización
El puntaje mostrado es una media móvil centrada de 7 días para reducir el ruido día a día manteniendo la señal de tendencia. Los días con menos de 5 artículos se marcan como baja cobertura.
2. Clasificación Dual por LLM
Cada artículo es clasificado por Claude Sonnet 4.6 (Anthropic) mediante dos llamadas independientes a la API: una para la dimensión política y una para la dimensión económica. Cada llamada asigna un puntaje entero de 0 a 100. La clasificación se realiza en lotes de 20 artículos por llamada a la API.
2.1 Sistema de Puntaje Dual
| Puntaje | Rango | Qué mide | Usado por |
|---|---|---|---|
| political_score | 0 – 100 | Inestabilidad institucional: vacancias, censuras, corrupción, crisis de gobernabilidad, conflictos sociales | IRP |
| economic_score | 0 – 100 | Disrupción económica: crisis financieras, colapso sectorial, shocks de precios, grandes riesgos fiscales | IRE |
2.2 Escala de Severidad (enteros 0 – 100)
El LLM asigna un entero de 0 a 100 en cada dimensión de forma independiente. La escala está calibrada de modo que 0 = sin relevancia y valores sobre 60 representan eventos importantes de alto impacto.
| Puntaje | Nivel | Ejemplo (político) |
|---|---|---|
| 0 | Sin relevancia | Deportes, farándula, noticias extranjeras sin impacto Perú |
| 1–20 | Menor | Sesiones legislativas rutinarias, declaraciones menores de partidos |
| 21–40 | Moderado | Investigaciones parlamentarias, disputas políticas escalando |
| 41–60 | Significativo | Mociones de interpelación, cambios de gabinete bajo presión |
| 61–80 | Mayor | Intentos de vacancia, crisis constitucionales, protestas masivas |
| 81–100 | Crítico | Estado de emergencia, cambio de régimen inminente, violencia masiva |
2.3 Filtro de Principales Impulsores
Para evitar contaminación cruzada entre las dos listas de impulsores, los artículos mostrados como principales impulsores políticos se restringen a aquellos donde political_score ≥ economic_score, y los principales impulsores económicos a aquellos donde economic_score > political_score. Esto garantiza que cada artículo aparece solo en la lista que refleja su dimensión dominante.
3. Fuentes de Datos (RSS Feeds + Archivo)
Los artículos se recolectan diariamente de 16 fuentes de noticias peruanas vía feeds RSS, cubriendo política nacional, economía, eventos regionales y medios audiovisuales. La cobertura histórica se extiende vía la API de archivo Arc Publishing para fuentes seleccionadas.
| Fuente | Feeds RSS | Archivo | Cobertura |
|---|---|---|---|
| El Comercio | Política, Economía | ✓ | Política, economía, Lima |
| Gestión | Peru, Economía | ✓ | Economía, empresa, mercados |
| La República | Política, Economía | – | Política nacional, conflictos sociales |
| Andina | Política, Economía | – | Agencia oficial, noticias del gobierno |
| RPP Noticias | General | – | Noticias de última hora, regiones |
| Correo | Política, Economía | ✓ | Política nacional, opinión |
| Peru21 | General | – | Noticias nacionales, opinión |
| Trome | General | – | Prensa popular, temas sociales |
| Caretas | General | – | Investigativo, política, cultura |
| ATV | General | – | Noticias televisivas |
| Canal N | General | – | Canal de noticias, política |
| El Búho | General | – | Noticias digitales, análisis |
| Inforegión | General | – | Noticias regionales, medioambiente |
| Diario UNO | General | – | Noticias nacionales, temas sociales |
| La Razón | General | – | Noticias nacionales, política |
| Panamericana | General | – | Televisión, noticias de última hora |
Total: 16 fuentes. Artículos recolectados diariamente. La cobertura RSS comienza en enero 2025; el backfill de archivo extiende la cobertura para El Comercio, Gestión y Correo.
4. Estadísticas de Muestra (Ene 2025 – presente)
Las distribuciones del IRP e IRE son sesgadas a la derecha: la mayoría de días muestran actividad moderada (índice 50–120), pero las crisis políticas o económicas crean lecturas extremas. El año calendario 2025 sirve como línea base de normalización (media = 100). Más de 415 artículos han sido corregidos retroactivamente por clasificaciones claramente erróneas (reportes cambiarios rutinarios, política extranjera, deportes, farándula) para mantener la integridad del índice.
5. Comparación con Enfoques Clásicos
| Característica | Baker, Bloom & Davis (2016) | Iacoviello & Tong (2026) | Qhawarina |
|---|---|---|---|
| Método de clasificación | Conteo de palabras clave | LLM (GPT) | LLM (Claude Sonnet 4.6) |
| Unidad de análisis | Artículo (binario) | Artículo (severidad 0–100) | Artículo (puntaje dual 0–100) |
| Estructura del índice | Compuesto único | Índice único | Dual: IRP + IRE (independientes) |
| Normalización | Mean = 100 | Mean = 100 | Media por feed (línea base 2025) |
| Frecuencia | Mensual | Mensual/Diaria | Diaria |
| País | USA | 43 países | Perú |
⚠️ Limitaciones
- Período de línea base corto: La línea base de normalización (S̄) se calcula solo con datos del año calendario 2025. No cubre episodios de crisis anteriores (vacancia Castillo 2022, COVID 2020). A medida que crezca el archivo, los umbrales serán mejor calibrados.
- Medios centrados en Lima: La mayoría de fuentes son medios nacionales con sede en Lima. Protestas regionales o shocks económicos locales pueden estar subrepresentados si no reciben cobertura nacional. Inforegión mitiga parcialmente esto.
- Errores de clasificación LLM: Claude Sonnet 4.6 puede ocasionalmente clasificar incorrectamente artículos o asignar severidades erróneas. Se han aplicado más de 415 correcciones retroactivas para patrones sistemáticos (reportes cambiarios rutinarios, política extranjera, deportes), pero pueden quedar errores residuales.
- Profundidad de archivo varía por fuente: La cobertura RSS comienza uniformemente en enero 2025. El backfill de archivo vía Arc Publishing cubre El Comercio y Correo desde enero 2025, pero Gestión solo desde septiembre 2025 (limitación de la API).
🔮 Mejoras Futuras
- Backfill de archivo más largo: Extender la cobertura histórica a 2022 (vacancia Castillo) vía APIs de archivo de noticias para mejorar la calibración de la línea base y permitir benchmarking histórico contra episodios de crisis conocidos.
- Fuentes regionales: Agregar feeds RSS de diarios regionales (La República Arequipa, El Correo Cusco, etc.) para capturar mejor conflictos regionales y shocks económicos fuera de Lima.
- Integración en forecasting: Incluir rezagos del IRP e IRE como predictores en los modelos de nowcasting de PBI e inversión, para capturar los costos reales de la incertidumbre política en la economía.
- Validación contra índices externos: Validar cruzadamente el IRP contra puntajes de inestabilidad política de V-DEM y calificaciones de riesgo país (EMBI Peru) para evaluar la validez de constructo.
Referencias
Iacoviello, M. & Tong, J. (2026). "The AI-GPR Index: Measuring Geopolitical Risk using Artificial Intelligence." Federal Reserve Board Working Paper. — Referencia metodológica principal: normalización por feed, severidad por LLM, y agregación ponderada por volumen.
Baker, S. R., Bloom, N., & Davis, S. J. (2016). "Measuring economic policy uncertainty." The Quarterly Journal of Economics, 131(4), 1593–1636. — Marco EPU fundacional: índice de incertidumbre basado en noticias con normalización media = 100.
Caldara, D., & Iacoviello, M. (2022). "Measuring geopolitical risk." American Economic Review, 112(4), 1194–1225. — Metodología del índice GPR que precede y motiva la extensión AI-GPR.
Gentzkow, M., Kelly, B., & Taddy, M. (2019). "Text as data." Journal of Economic Literature, 57(3), 535–574. — Survey de métodos NLP en economía; marco conceptual para clasificación de severidad a nivel de artículo.
Código fuente disponible en el repositorio Qhawarina
Archivos clave: src/nlp/classifier.py, scripts/build_daily_index.py, scripts/export_web_data.py