mythos nsa
Inteligência Artificial

Mythos penetrou quase todos os sistemas classificados da NSA em horas, num red-team autorizado, e os EUA tiraram o modelo do ar

O que parecia disputa política sobre um jailbreak virou caso de soberania de capacidade depois que o diretor da NSA revelou ao Senado que o modelo penetrou quase todos os sistemas classificados da agência em horas, autonomamente.

6 min de leitura
462 views
Por Sandoval Almeida
Compartilhar:

Um modelo de IA pode sumir do teu stack amanhã. Não por bug. Por decisão de Estado.

No dia 9 de junho de 2026, a Anthropic lançou o Fable 5 e o Mythos 5 com a comunicação de praxe de um modelo de fronteira. Três dias depois, em 12 de junho às 17h21 (horário de Brasília menos uma hora, horário da Costa Leste americana), recebeu do governo dos EUA uma diretiva de controle de exportação que a obrigou a desligar os dois modelos para todos os clientes do planeta. Dez dias depois, eles continuam fora do ar. E a razão pública pela qual ficaram fora do ar mudou completamente nas últimas 48 horas.

A versão inicial era a de sempre num atrito entre laboratório de IA e Estado: a Casa Branca alegava um método de "jailbreak" capaz de burlar as travas de cibersegurança do Fable 5, a Anthropic respondia que o jailbreak era estreito, não universal, e que os mesmos resultados saíam de modelos públicos concorrentes como o GPT-5.5 da OpenAI, que não sofreram controle algum. Era a moldura conveniente para os dois lados. O governo tinha um pretexto técnico nomeável. A Anthropic tinha uma defesa de incremento de risco: o que o Mythos faz, outros já fazem, logo controlar só a ela não nega nada a adversário nenhum.

O testemunho que dissolveu a moldura do jailbreak

Em 21 de junho, via The Economist, veio a explicação pública mais clara até agora, e ela não tem nada a ver com prompt malicioso. O general Joshua Rudd, diretor da NSA e também chefe do Cyber Command, revelou em briefing à Comissão de Inteligência do Senado que o Mythos, num exercício classificado de red-team, invadiu de forma autônoma quase todos os sistemas classificados da NSA em questão de horas.

Isso reposiciona o caso inteiro. Um jailbreak é um exploit do lado do usuário: alguém induz o modelo a fazer o que não deveria, e a correção é fechar a brecha do prompt. O que o diretor da NSA descreveu é outra categoria. Não é o usuário forçando o modelo. É o modelo, operando dentro das próprias salvaguardas, exibindo capacidade ofensiva autônoma de nível que nenhum sistema público havia demonstrado. A frase do senador Warner resume a leitura do Estado: teria sido irresponsável não impor controle de exportação sobre uma coisa dessas.

Essa é a chave que explica por que o enquadramento "conserta o jailbreak e o banimento cai", repetido por figuras como David Sacks, não destravou nada. Não há jailbreak a consertar. A preocupação é arquitetural, não de prompt. Você não corrige a capacidade do modelo com um patch. A capacidade é o produto.

mythos

De soberania de dados para soberania de capacidade

O instrumento jurídico que o governo usou é o ponto que importa para quem constrói. A carta do Departamento de Comércio classifica o acesso ao modelo por estrangeiro como "deemed export", exportação presumida, e exige licença para quatro situações, incluindo a liberação do modelo a qualquer "foreign person" dentro ou fora dos EUA. Inclui os próprios funcionários estrangeiros da Anthropic, parte relevante da força de trabalho da empresa.

Historicamente, exportar um modelo significava transferir o código. Agora a leitura jurídica dominante é que, em qualquer deployment SaaS, exportação passa a ser qualquer acesso ao modelo. E aqui mora o problema operacional que nenhum CIO resolve com folha de cálculo: não existe forma de verificar a cidadania de um usuário através de uma chamada de API. Três quartos dos americanos sequer têm passaporte. Diante de uma instrução impossível de cumprir com granularidade, a Anthropic fez a única coisa racional: desligou tudo para todo mundo, em vez de tentar segmentar acesso por nacionalidade.

O termo que circula entre os analistas é capability sovereignty. Soberania de capacidade. O governo não está mais tentando controlar onde os dados moram, está tentando controlar quem tem acesso à capacidade de fronteira, independentemente de quem construiu, onde está hospedado ou quem trabalhou nisso. Para qualquer empresa que embute um modelo de fronteira em ferramenta interna, agente autônomo ou pipeline de produção, a lição é desconfortável: um modelo pode desaparecer por razões que não têm nada a ver com uptime, preço ou desempenho. O mesmo modelo que ajuda a defender um sistema pode ser retirado no momento em que o defensor mais precisa dele.

O pano de fundo que não é coincidência

O choque não nasceu em junho. Em fevereiro, Trump ordenou que todas as agências federais parassem de usar modelos da Anthropic depois que a empresa recusou os termos de contrato preferidos do Pentágono, que exigiam que qualquer modelo comprado pudesse ser usado "para qualquer propósito lícito". A Anthropic queria exceção para não ter os modelos aplicados em armas autônomas ou vigilância doméstica em massa. Em março, o Pentágono declarou a empresa "risco de cadeia de suprimento" e proibiu o uso militar dos seus modelos. A Anthropic contesta a designação na justiça federal.

Some a isso a Ordem Executiva de 2 de junho, "Promoting Advanced Artificial Intelligence Innovation and Security". A Seção 3 manda NSA, Tesouro e CISA criarem, em até 60 dias, um processo classificado de benchmarking para designar modelos como "covered frontier models", além de um framework voluntário em que o desenvolvedor pré-informaria o governo 30 dias antes de lançar. O Fable 5 saiu em 9 de junho, sete dias depois da ordem. Sem pré-aviso. O banimento de 12 de junho forçou exatamente a cooperação que o framework voluntário da ordem foi desenhado para induzir.

O que observar nos próximos dias

Os mercados de previsão davam, no dia 20, 57% de chance de restauração do Fable 5 antes de 1 de julho e 75% até 17 de julho. O diretor internacional da Anthropic, Chris Ciauri, declarou estar muito confiante de que os modelos voltariam nos próximos dias. A própria empresa chamou o episódio de mal-entendido e diz trabalhar para restaurar o acesso.

Mas se o testemunho da NSA estiver correto sobre a natureza do que o Mythos fez, o problema não se resolve com um comunicado conciliatório. Resolve-se com a Anthropic entrando no processo classificado de benchmarking e aceitando o pré-briefing de 30 dias que vinha resistindo. Isso é um pedido fundamentalmente diferente de "conserta a brecha". E é por isso que a resolução tem sido mais lenta do que o discurso político sugeria. No fim, fica a pergunta que o caso abre para a indústria inteira: quando a capacidade de um modelo passa a ser tratada como munição, quem decide quando ela pode ser usada, e quem fica desarmado enquanto a decisão não vem.

Sandoval Almeida

Sandoval Almeida

Executivo de tecnologia, cientista da computação e especialista em inteligência artificial aplicada a negócios. Com mais de duas décadas de experiência em desenvolvimento de software, segurança da informação e arquitetura de sistemas, atua na criação de plataformas SaaS e soluções de IA voltadas à automação, análise de dados e transformação digital. É fundador de iniciativas tecnológicas nas áreas de IA, healthtech e análise operacional

Receba as Notícias no Seu Email

Cadastre-se gratuitamente e receba nosso resumo diário das principais notícias.

Ao cadastrar, você concorda em receber emails informativos. Você pode cancelar a qualquer momento.