Metodología — Índices de Riesgo Dual AI-GPR (IRP + IRE)

Base metodológica: Construido siguiendo a Iacoviello & Tong (2026), "The AI-GPR Index: Measuring Geopolitical Risk using Artificial Intelligence", Federal Reserve Board Working Paper. Aplicado a Perú como dos índices independientes — IRP (político) e IRE (económico) — usando Claude Sonnet 4.6 como clasificador LLM, 16 fuentes de noticias con feeds RSS y backfill de archivo histórico, y normalización por feed (media = 100 sobre línea base 2025).

Resumen Ejecutivo

Qhawarina produce dos índices de riesgo diarios independientes: el IRP (Índice de Riesgo Político) y el IRE (Índice de Riesgo Económico). Cada índice agrega puntajes de severidad asignados por Claude Sonnet 4.6 a artículos individuales, usando una normalización por feed que elimina el sesgo de composición al agregar nuevos feeds. Ambos índices están calibrados a una media de 100 sobre la línea base del año 2025. Es la primera aplicación de la metodología AI-GPR a un país latinoamericano con frecuencia diaria.

Estructura
2 índices independientes
IRP (político) + IRE (económico)
Escala
Media = 100, sin límite
Períodos de crisis: 200–400+
Frecuencia
Diaria
16 fuentes + archivo

1. La Fórmula AI-GPR de Índice Dual

El IRP y el IRE se calculan con el mismo procedimiento de cuatro pasos, aplicado independientemente a los puntajes políticos y económicos. La innovación clave respecto a un enfoque de suma diaria simple es la normalización por feed (Paso 2), que previene la distorsión del índice cuando se agregan nuevos feeds o cuando un diario publica más de lo usual.

# Step 1: Average score per feed-day (N_it = article count)
SWPit = (1/Nit) × Σ scorej [articles j in feed i on day t]
# Step 2: Per-feed normalization (composition-bias correction)
Yit = SWPit / meani,2025 [each feed's 2025 mean → 1.0]
# Step 3: Volume-weighted mean across active feeds
Zt = Σ(Nit × Yit) / Σ(Nit)
# Step 4: Scale to 2025 baseline (S̄ = mean(Z_t) over 2025)
IRPt = (Zt / S̄2025) × 100
# IRE_t uses economic_score instead of political_score — same formula
¿Por qué normalización por feed? Si Gestión Economía publica 50 artículos un día y Gestión Peru solo 5, una suma simple contaría doble la contribución de Gestión. La normalización por feed da peso igual a cada feed sin importar el volumen de publicación, y evita que el índice suba mecánicamente al incorporar nuevos feeds.

1.1 Umbrales de Nivel (IRP e IRE)

NivelValor del índiceInterpretación
MÍNIMO< 50Calma excepcional, noticias de rutina
BAJO50–90Por debajo del promedio, pocas notas relevantes
NORMAL90–110Entorno normal, cerca de la media histórica
ELEVADO110–150Inestabilidad por encima del promedio, vigilancia activa
ALTO150–200Crisis significativa, múltiples eventos graves
CRÍTICO> 200Crisis aguda: vacancia, colapso institucional, emergencia

1.2 Suavización

El puntaje mostrado es una media móvil centrada de 7 días para reducir el ruido día a día manteniendo la señal de tendencia. Los días con menos de 5 artículos se marcan como baja cobertura.

IRPtsmooth = (1/7) × Σ IRPt+k, k ∈ [-3, +3]

2. Clasificación Dual por LLM

Cada artículo es clasificado por Claude Sonnet 4.6 (Anthropic) mediante dos llamadas independientes a la API: una para la dimensión política y una para la dimensión económica. Cada llamada asigna un puntaje entero de 0 a 100. La clasificación se realiza en lotes de 20 artículos por llamada a la API.

2.1 Sistema de Puntaje Dual

PuntajeRangoQué mideUsado por
political_score0 – 100Inestabilidad institucional: vacancias, censuras, corrupción, crisis de gobernabilidad, conflictos socialesIRP
economic_score0 – 100Disrupción económica: crisis financieras, colapso sectorial, shocks de precios, grandes riesgos fiscalesIRE
Regla de dimensión dominante: Cuando una acción política usa una crisis económica como contexto o palanca (e.g., "Partido opositor condiciona al gobierno usando la crisis energética"), el puntaje político debe dominar. El artículo describe una maniobra política, no un evento económico. Por el contrario, un reporte de Moody's sobre interrupciones en el suministro de gas que afectan la inflación es primordialmente económico, no político. Cada artículo se clasifica por lo que realmente ocurre, no por qué tema menciona.

2.2 Escala de Severidad (enteros 0 – 100)

El LLM asigna un entero de 0 a 100 en cada dimensión de forma independiente. La escala está calibrada de modo que 0 = sin relevancia y valores sobre 60 representan eventos importantes de alto impacto.

PuntajeNivelEjemplo (político)
0Sin relevanciaDeportes, farándula, noticias extranjeras sin impacto Perú
1–20MenorSesiones legislativas rutinarias, declaraciones menores de partidos
21–40ModeradoInvestigaciones parlamentarias, disputas políticas escalando
41–60SignificativoMociones de interpelación, cambios de gabinete bajo presión
61–80MayorIntentos de vacancia, crisis constitucionales, protestas masivas
81–100CríticoEstado de emergencia, cambio de régimen inminente, violencia masiva

2.3 Filtro de Principales Impulsores

Para evitar contaminación cruzada entre las dos listas de impulsores, los artículos mostrados como principales impulsores políticos se restringen a aquellos donde political_score ≥ economic_score, y los principales impulsores económicos a aquellos donde economic_score > political_score. Esto garantiza que cada artículo aparece solo en la lista que refleja su dimensión dominante.

3. Fuentes de Datos (RSS Feeds + Archivo)

Los artículos se recolectan diariamente de 16 fuentes de noticias peruanas vía feeds RSS, cubriendo política nacional, economía, eventos regionales y medios audiovisuales. La cobertura histórica se extiende vía la API de archivo Arc Publishing para fuentes seleccionadas.

FuenteFeeds RSSArchivoCobertura
El ComercioPolítica, EconomíaPolítica, economía, Lima
GestiónPeru, EconomíaEconomía, empresa, mercados
La RepúblicaPolítica, EconomíaPolítica nacional, conflictos sociales
AndinaPolítica, EconomíaAgencia oficial, noticias del gobierno
RPP NoticiasGeneralNoticias de última hora, regiones
CorreoPolítica, EconomíaPolítica nacional, opinión
Peru21GeneralNoticias nacionales, opinión
TromeGeneralPrensa popular, temas sociales
CaretasGeneralInvestigativo, política, cultura
ATVGeneralNoticias televisivas
Canal NGeneralCanal de noticias, política
El BúhoGeneralNoticias digitales, análisis
InforegiónGeneralNoticias regionales, medioambiente
Diario UNOGeneralNoticias nacionales, temas sociales
La RazónGeneralNoticias nacionales, política
PanamericanaGeneralTelevisión, noticias de última hora

Total: 16 fuentes. Artículos recolectados diariamente. La cobertura RSS comienza en enero 2025; el backfill de archivo extiende la cobertura para El Comercio, Gestión y Correo.

4. Estadísticas de Muestra (Ene 2025 – presente)

25,000+
Artículos totales
415+
Correcciones aplicadas
100
Media IRP 2025 (línea base)
300+
IRP máximo observado

Las distribuciones del IRP e IRE son sesgadas a la derecha: la mayoría de días muestran actividad moderada (índice 50–120), pero las crisis políticas o económicas crean lecturas extremas. El año calendario 2025 sirve como línea base de normalización (media = 100). Más de 415 artículos han sido corregidos retroactivamente por clasificaciones claramente erróneas (reportes cambiarios rutinarios, política extranjera, deportes, farándula) para mantener la integridad del índice.

5. Comparación con Enfoques Clásicos

CaracterísticaBaker, Bloom & Davis (2016)Iacoviello & Tong (2026)Qhawarina
Método de clasificaciónConteo de palabras claveLLM (GPT)LLM (Claude Sonnet 4.6)
Unidad de análisisArtículo (binario)Artículo (severidad 0–100)Artículo (puntaje dual 0–100)
Estructura del índiceCompuesto únicoÍndice únicoDual: IRP + IRE (independientes)
NormalizaciónMean = 100Mean = 100Media por feed (línea base 2025)
FrecuenciaMensualMensual/DiariaDiaria
PaísUSA43 paísesPerú

⚠️ Limitaciones

  • Período de línea base corto: La línea base de normalización (S̄) se calcula solo con datos del año calendario 2025. No cubre episodios de crisis anteriores (vacancia Castillo 2022, COVID 2020). A medida que crezca el archivo, los umbrales serán mejor calibrados.
  • Medios centrados en Lima: La mayoría de fuentes son medios nacionales con sede en Lima. Protestas regionales o shocks económicos locales pueden estar subrepresentados si no reciben cobertura nacional. Inforegión mitiga parcialmente esto.
  • Errores de clasificación LLM: Claude Sonnet 4.6 puede ocasionalmente clasificar incorrectamente artículos o asignar severidades erróneas. Se han aplicado más de 415 correcciones retroactivas para patrones sistemáticos (reportes cambiarios rutinarios, política extranjera, deportes), pero pueden quedar errores residuales.
  • Profundidad de archivo varía por fuente: La cobertura RSS comienza uniformemente en enero 2025. El backfill de archivo vía Arc Publishing cubre El Comercio y Correo desde enero 2025, pero Gestión solo desde septiembre 2025 (limitación de la API).

🔮 Mejoras Futuras

  • Backfill de archivo más largo: Extender la cobertura histórica a 2022 (vacancia Castillo) vía APIs de archivo de noticias para mejorar la calibración de la línea base y permitir benchmarking histórico contra episodios de crisis conocidos.
  • Fuentes regionales: Agregar feeds RSS de diarios regionales (La República Arequipa, El Correo Cusco, etc.) para capturar mejor conflictos regionales y shocks económicos fuera de Lima.
  • Integración en forecasting: Incluir rezagos del IRP e IRE como predictores en los modelos de nowcasting de PBI e inversión, para capturar los costos reales de la incertidumbre política en la economía.
  • Validación contra índices externos: Validar cruzadamente el IRP contra puntajes de inestabilidad política de V-DEM y calificaciones de riesgo país (EMBI Peru) para evaluar la validez de constructo.

Referencias

Iacoviello, M. & Tong, J. (2026). "The AI-GPR Index: Measuring Geopolitical Risk using Artificial Intelligence." Federal Reserve Board Working Paper. — Referencia metodológica principal: normalización por feed, severidad por LLM, y agregación ponderada por volumen.

Baker, S. R., Bloom, N., & Davis, S. J. (2016). "Measuring economic policy uncertainty." The Quarterly Journal of Economics, 131(4), 1593–1636. — Marco EPU fundacional: índice de incertidumbre basado en noticias con normalización media = 100.

Caldara, D., & Iacoviello, M. (2022). "Measuring geopolitical risk." American Economic Review, 112(4), 1194–1225. — Metodología del índice GPR que precede y motiva la extensión AI-GPR.

Gentzkow, M., Kelly, B., & Taddy, M. (2019). "Text as data." Journal of Economic Literature, 57(3), 535–574. — Survey de métodos NLP en economía; marco conceptual para clasificación de severidad a nivel de artículo.

Código fuente disponible en el repositorio Qhawarina

Archivos clave: src/nlp/classifier.py, scripts/build_daily_index.py, scripts/export_web_data.py