Ciudad de México – 26 de febrero de 2026 – Un atacante cibernético aprovechó las capacidades del chatbot de inteligencia artificial Claude, desarrollado por Anthropic, para ejecutar una serie de intrusiones contra instituciones públicas mexicanas, logrando sustraer alrededor de 150 gigabytes de información confidencial.
Según una investigación publicada por la firma israelí de ciberseguridad Gambit Security, el incidente ocurrió entre diciembre de 2025 y enero de 2026. El hacker escribió indicaciones en español para que Claude actuara como un “hacker de élite”, detectara vulnerabilidades en redes gubernamentales, generara scripts informáticos para explotarlas y automatizara el proceso de extracción de datos.
Entre los objetivos comprometidos se encuentran la autoridad fiscal federal (SAT), el Instituto Nacional Electoral (INE), gobiernos estatales como Jalisco, Michoacán y Tamaulipas, sistemas municipales y otros organismos públicos. La información robada incluye documentos relacionados con 195 millones de registros de contribuyentes, padrones electorales, credenciales de empleados públicos y archivos del registro civil.
El atacante empleó técnicas avanzadas para sortear las barreras de seguridad de Claude, incluyendo un proceso iterativo de “jailbreak” mediante prompts persistentes y simulando participación en programas de detección de errores (bug bounty). Cuando Claude presentaba restricciones, el operador complementaba con consultas a otros modelos como ChatGPT para refinar métodos de movimiento lateral en redes y obtención de credenciales.
Gambit Security identificó al menos 20 vulnerabilidades explotadas durante la campaña. La IA facilitó la producción de miles de informes detallados con planes listos para ejecutar, lo que aceleró significativamente la selección de objetivos y la ejecución de los ataques.
Anthropic confirmó que detectó la actividad maliciosa, bloqueó las cuentas involucradas y actualizó sus mecanismos de seguridad incorporando los patrones observados para fortalecer versiones posteriores del modelo.
Instituciones afectadas como el INE negaron vulneraciones recientes y afirmaron haber reforzado sus protocolos de ciberseguridad. Otros organismos, como el SAT y gobiernos estatales, no han emitido respuestas detalladas inmediatas sobre el alcance de la intrusión.
Este caso destaca el doble filo de la inteligencia artificial en la ciberseguridad: mientras sirve para fortalecer defensas, también se convierte en una herramienta poderosa para actores maliciosos que buscan escalar ataques de manera automatizada y eficiente. Expertos advierten que incidentes como este subrayan la necesidad de protocolos más robustos tanto en plataformas de IA como en infraestructuras críticas gubernamentales.
Imágen cortesía: IA
