Metodología — Índices de Riesgo Dual AI-GPR (IRP + IRE)

Base metodológica: Construido siguiendo a Iacoviello & Tong (2026), "The AI-GPR Index: Measuring Geopolitical Risk using Artificial Intelligence", Federal Reserve Board Working Paper. Aplicado a Perú como dos índices independientes — IRP (político) e IRE (económico) — usando Claude Sonnet 4.6 como clasificador LLM, 16 fuentes de noticias con feeds RSS y backfill de archivo histórico, y normalización por feed (media = 100 sobre línea base 2025).

Resumen Ejecutivo

Qhawarina produce dos índices de riesgo diarios independientes: el IRP (Índice de Riesgo Político) y el IRE (Índice de Riesgo Económico). Cada índice agrega puntajes de severidad asignados por Claude Sonnet 4.6 a artículos individuales, usando una normalización por feed que elimina el sesgo de composición al agregar nuevos feeds. Ambos índices están calibrados a una media de 100 sobre la línea base del año 2025. Es la primera aplicación de la metodología AI-GPR a un país latinoamericano con frecuencia diaria.

Estructura

2 índices independientes

IRP (político) + IRE (económico)

Escala

Media = 100, sin límite

Períodos de crisis: 200–400+

Frecuencia

Diaria

16 fuentes + archivo

1. La Fórmula AI-GPR de Índice Dual

El IRP y el IRE se calculan con el mismo procedimiento de cuatro pasos, aplicado independientemente a los puntajes políticos y económicos. La innovación clave respecto a un enfoque de suma diaria simple es la normalización por feed (Paso 2), que previene la distorsión del índice cuando se agregan nuevos feeds o cuando un diario publica más de lo usual.

# Step 1: Average score per feed-day (N_it = article count)

SWP_it = (1/N_it) × Σ score_j [articles j in feed i on day t]

# Step 2: Per-feed normalization (composition-bias correction)

Y_it = SWP_it / mean_i,2025 [each feed's 2025 mean → 1.0]

# Step 3: Volume-weighted mean across active feeds

Z_t = Σ(N_it × Y_it) / Σ(N_it)

# Step 4: Scale to 2025 baseline (S̄ = mean(Z_t) over 2025)

IRP_t = (Z_t / S̄₂₀₂₅) × 100

# IRE_t uses economic_score instead of political_score — same formula

¿Por qué normalización por feed? Si Gestión Economía publica 50 artículos un día y Gestión Peru solo 5, una suma simple contaría doble la contribución de Gestión. La normalización por feed da peso igual a cada feed sin importar el volumen de publicación, y evita que el índice suba mecánicamente al incorporar nuevos feeds.

1.1 Umbrales de Nivel (IRP e IRE)

Nivel	Valor del índice	Interpretación
MÍNIMO	< 50	Calma excepcional, noticias de rutina
BAJO	50–90	Por debajo del promedio, pocas notas relevantes
NORMAL	90–110	Entorno normal, cerca de la media histórica
ELEVADO	110–150	Inestabilidad por encima del promedio, vigilancia activa
ALTO	150–200	Crisis significativa, múltiples eventos graves
CRÍTICO	> 200	Crisis aguda: vacancia, colapso institucional, emergencia

1.2 Suavización

El puntaje mostrado es una media móvil centrada de 7 días para reducir el ruido día a día manteniendo la señal de tendencia. Los días con menos de 5 artículos se marcan como baja cobertura.

IRP_t^smooth = (1/7) × Σ IRP_t+k, k ∈ [-3, +3]

2. Clasificación Dual por LLM

Cada artículo es clasificado por Claude Sonnet 4.6 (Anthropic) mediante dos llamadas independientes a la API: una para la dimensión política y una para la dimensión económica. Cada llamada asigna un puntaje entero de 0 a 100. La clasificación se realiza en lotes de 20 artículos por llamada a la API.

2.1 Sistema de Puntaje Dual

Puntaje	Rango	Qué mide	Usado por
political_score	0 – 100	Inestabilidad institucional: vacancias, censuras, corrupción, crisis de gobernabilidad, conflictos sociales	IRP
economic_score	0 – 100	Disrupción económica: crisis financieras, colapso sectorial, shocks de precios, grandes riesgos fiscales	IRE

Regla de dimensión dominante: Cuando una acción política usa una crisis económica como contexto o palanca (e.g., "Partido opositor condiciona al gobierno usando la crisis energética"), el puntaje político debe dominar. El artículo describe una maniobra política, no un evento económico. Por el contrario, un reporte de Moody's sobre interrupciones en el suministro de gas que afectan la inflación es primordialmente económico, no político. Cada artículo se clasifica por lo que realmente ocurre, no por qué tema menciona.

2.2 Escala de Severidad (enteros 0 – 100)

El LLM asigna un entero de 0 a 100 en cada dimensión de forma independiente. La escala está calibrada de modo que 0 = sin relevancia y valores sobre 60 representan eventos importantes de alto impacto.

Puntaje	Nivel	Ejemplo (político)
0	Sin relevancia	Deportes, farándula, noticias extranjeras sin impacto Perú
1–20	Menor	Sesiones legislativas rutinarias, declaraciones menores de partidos
21–40	Moderado	Investigaciones parlamentarias, disputas políticas escalando
41–60	Significativo	Mociones de interpelación, cambios de gabinete bajo presión
61–80	Mayor	Intentos de vacancia, crisis constitucionales, protestas masivas
81–100	Crítico	Estado de emergencia, cambio de régimen inminente, violencia masiva

2.3 Filtro de Principales Impulsores

Para evitar contaminación cruzada entre las dos listas de impulsores, los artículos mostrados como principales impulsores políticos se restringen a aquellos donde political_score ≥ economic_score, y los principales impulsores económicos a aquellos donde economic_score > political_score. Esto garantiza que cada artículo aparece solo en la lista que refleja su dimensión dominante.

3. Fuentes de Datos (RSS Feeds + Archivo)

Los artículos se recolectan diariamente de 16 fuentes de noticias peruanas vía feeds RSS, cubriendo política nacional, economía, eventos regionales y medios audiovisuales. La cobertura histórica se extiende vía la API de archivo Arc Publishing para fuentes seleccionadas.

Fuente	Feeds RSS	Archivo	Cobertura
El Comercio	Política, Economía	✓	Política, economía, Lima
Gestión	Peru, Economía	✓	Economía, empresa, mercados
La República	Política, Economía	–	Política nacional, conflictos sociales
Andina	Política, Economía	–	Agencia oficial, noticias del gobierno
RPP Noticias	General	–	Noticias de última hora, regiones
Correo	Política, Economía	✓	Política nacional, opinión
Peru21	General	–	Noticias nacionales, opinión
Trome	General	–	Prensa popular, temas sociales
Caretas	General	–	Investigativo, política, cultura
ATV	General	–	Noticias televisivas
Canal N	General	–	Canal de noticias, política
El Búho	General	–	Noticias digitales, análisis
Inforegión	General	–	Noticias regionales, medioambiente
Diario UNO	General	–	Noticias nacionales, temas sociales
La Razón	General	–	Noticias nacionales, política
Panamericana	General	–	Televisión, noticias de última hora

Total: 16 fuentes. Artículos recolectados diariamente. La cobertura RSS comienza en enero 2025; el backfill de archivo extiende la cobertura para El Comercio, Gestión y Correo.

4. Estadísticas de Muestra (Ene 2025 – presente)

25,000+

Artículos totales

415+

Correcciones aplicadas

100

Media IRP 2025 (línea base)

300+

IRP máximo observado

Las distribuciones del IRP e IRE son sesgadas a la derecha: la mayoría de días muestran actividad moderada (índice 50–120), pero las crisis políticas o económicas crean lecturas extremas. El año calendario 2025 sirve como línea base de normalización (media = 100). Más de 415 artículos han sido corregidos retroactivamente por clasificaciones claramente erróneas (reportes cambiarios rutinarios, política extranjera, deportes, farándula) para mantener la integridad del índice.

5. Comparación con Enfoques Clásicos

Característica	Baker, Bloom & Davis (2016)	Iacoviello & Tong (2026)	Qhawarina
Método de clasificación	Conteo de palabras clave	LLM (GPT)	LLM (Claude Sonnet 4.6)
Unidad de análisis	Artículo (binario)	Artículo (severidad 0–100)	Artículo (puntaje dual 0–100)
Estructura del índice	Compuesto único	Índice único	Dual: IRP + IRE (independientes)
Normalización	Mean = 100	Mean = 100	Media por feed (línea base 2025)
Frecuencia	Mensual	Mensual/Diaria	Diaria
País	USA	43 países	Perú

⚠️ Limitaciones

Período de línea base corto: La línea base de normalización (S̄) se calcula solo con datos del año calendario 2025. No cubre episodios de crisis anteriores (vacancia Castillo 2022, COVID 2020). A medida que crezca el archivo, los umbrales serán mejor calibrados.
Medios centrados en Lima: La mayoría de fuentes son medios nacionales con sede en Lima. Protestas regionales o shocks económicos locales pueden estar subrepresentados si no reciben cobertura nacional. Inforegión mitiga parcialmente esto.
Errores de clasificación LLM: Claude Sonnet 4.6 puede ocasionalmente clasificar incorrectamente artículos o asignar severidades erróneas. Se han aplicado más de 415 correcciones retroactivas para patrones sistemáticos (reportes cambiarios rutinarios, política extranjera, deportes), pero pueden quedar errores residuales.
Profundidad de archivo varía por fuente: La cobertura RSS comienza uniformemente en enero 2025. El backfill de archivo vía Arc Publishing cubre El Comercio y Correo desde enero 2025, pero Gestión solo desde septiembre 2025 (limitación de la API).

🔮 Mejoras Futuras

Backfill de archivo más largo: Extender la cobertura histórica a 2022 (vacancia Castillo) vía APIs de archivo de noticias para mejorar la calibración de la línea base y permitir benchmarking histórico contra episodios de crisis conocidos.
Fuentes regionales: Agregar feeds RSS de diarios regionales (La República Arequipa, El Correo Cusco, etc.) para capturar mejor conflictos regionales y shocks económicos fuera de Lima.
Integración en forecasting: Incluir rezagos del IRP e IRE como predictores en los modelos de nowcasting de PBI e inversión, para capturar los costos reales de la incertidumbre política en la economía.
Validación contra índices externos: Validar cruzadamente el IRP contra puntajes de inestabilidad política de V-DEM y calificaciones de riesgo país (EMBI Peru) para evaluar la validez de constructo.

Referencias

Iacoviello, M. & Tong, J. (2026). "The AI-GPR Index: Measuring Geopolitical Risk using Artificial Intelligence." Federal Reserve Board Working Paper. — Referencia metodológica principal: normalización por feed, severidad por LLM, y agregación ponderada por volumen.

Baker, S. R., Bloom, N., & Davis, S. J. (2016). "Measuring economic policy uncertainty." The Quarterly Journal of Economics, 131(4), 1593–1636. — Marco EPU fundacional: índice de incertidumbre basado en noticias con normalización media = 100.

Caldara, D., & Iacoviello, M. (2022). "Measuring geopolitical risk." American Economic Review, 112(4), 1194–1225. — Metodología del índice GPR que precede y motiva la extensión AI-GPR.

Gentzkow, M., Kelly, B., & Taddy, M. (2019). "Text as data." Journal of Economic Literature, 57(3), 535–574. — Survey de métodos NLP en economía; marco conceptual para clasificación de severidad a nivel de artículo.

Código fuente disponible en el repositorio Qhawarina

Archivos clave: src/nlp/classifier.py, scripts/build_daily_index.py, scripts/export_web_data.py