O fiasco da Fable da Anthropic abre espaço para IA de código aberto, especialmente modelos mais baratos da China

O fiasco da Fable da Anthropic abre espaço para IA de código aberto, especialmente modelos mais baratos da China



A decisão do governo dos EUA de impedir a Anthropic de oferecer seus modelos Mythos 5 e Fable 5 a não-nacionais pode acabar impulsionando significativamente a adoção de modelos de código aberto, incluindo aqueles de laboratórios de IA chineses como DeepSeek e Moonshot AI.

Os usuários podem baixar modelos de código aberto e executá-los em seus próprios computadores ou redes de nuvem, evitando assim a capacidade tanto de desenvolvedores de IA quanto de governos de controlar o acesso. Além disso, esses modelos podem ser mais facilmente ajustados pelos desenvolvedores para atender a necessidades específicas.

Laboratórios chineses já estão reivindicando uma vitória de relações públicas em decorrência da controvérsia envolvendo a Anthropic.

As ações da Knowledge Atlas Technology, um laboratório de IA chinês mais conhecido como Z.ai, dispararam mais de 30% nas negociações em Hong Kong na segunda-feira, após o lançamento da última versão de seu modelo de código aberto, GLM-5.2. (As ações da Knowledge Atlas já aumentaram mais de 800% desde o seu lançamento em janeiro.)

“Em um momento em que alguns modelos de ponta podem de repente se tornar indisponíveis, escolhemos acreditar em um caminho diferente”, publicou a Knowledge Atlas nas redes sociais, de acordo com o South China Morning Post. Em uma referência clara à notícia sobre a Anthropic, a empresa acrescentou que “a inteligência de ponta não deve pertencer apenas a algumas pessoas, nem ser sujeita a retiradas por um punhado de regras a qualquer momento”.

A demanda por modelos chineses já superou a por modelos dos EUA na OpenRouter, uma plataforma popular para acessar diferentes modelos de IA. Na semana passada, os quatro modelos mais usados eram de empresas chinesas: DeepSeek, MiniMax, Tencent e Xiaomi. Os modelos de código aberto da China se mostraram populares não apenas dentro do país, mas também em muitas outras nações em desenvolvimento ao redor do mundo, onde são vistos como um bom compromisso entre preço e desempenho.

A proibição dos EUA ao Fable e Mythos pode também acabar validando o movimento mais amplo da China rumo à autossuficiência tecnológica, que ganhou força em 2022 após a administração Biden impor controles sobre a venda de chips avançados e equipamentos de fabricação de chips. “É um grande avanço para a China”, afirma Neil Shah, vice-presidente de pesquisa da Counterpoint Research. “Obviamente, eles não estão na vanguarda devido aos controles de exportação, mas têm seu próprio silício e seu próprio software.”

Por que optar pelo código aberto?

Na sexta-feira, a Anthropic revelou que o Departamento de Comércio dos EUA ordenou que parasse de fornecer acesso a seus modelos de ponta para qualquer um fora dos EUA. A forma como as regras de exportação dos EUA são interpretadas também significa que a empresa não pode oferecer os modelos a qualquer “nacional estrangeiro” dentro dos EUA, incluindo seus próprios funcionários. Em resposta à ordem do governo, a empresa decidiu suspender o acesso a esses modelos para todos os usuários.

A Anthropic já havia argumentado que seu modelo Mythos era poderoso demais para ser liberado ao público sem salvaguardas e havia iniciado um programa de acesso antecipado, intitulado Projeto Glasswing, para que instituições-chave usassem o modelo para descobrir vulnerabilidades de segurança. Instituições de cerca de 15 países, incluindo aliados dos EUA como Japão e Coreia do Sul, acabaram obtendo acesso ao Mythos através do Projeto Glasswing.

Entretanto, a medida dos EUA contra a Anthropic levanta a possibilidade de que modelos de ponta de outros laboratórios, como OpenAI ou Google, também possam ser afetados por controles de exportação. Nesse caso, organizações não estadunidenses poderiam ficar completamente excluídas do acesso aos melhores modelos desenvolvidos nos EUA.

Modelos de código aberto poderiam ser uma alternativa, especialmente para governos que esperam investir em IA soberana—modelos e infraestrutura de IA desenvolvidos e controlados internamente. Os controles de exportação dos EUA sobre a Anthropic apenas destacam o perigo que os governos enfrentam ao estarem atrelados a modelos de IA de um único país.

“É a primeira vez que um governo ordena a um desenvolvedor de modelo que restrinja o acesso a um modelo específico com base na nacionalidade”, afirma Paul Triolo, parceiro da DGA-Albright Stonebridge Group. “As empresas e os governos começarão a reconsiderar como abordam o desenvolvimento de aplicações com base em um modelo específico, e para os governos, quais empresas desejam contratar para implantações de IA soberana.”

“Até que haja uma maior clareza sobre quais critérios o governo dos EUA usará para avaliar e aprovar modelos de ponta, as empresas e governos certamente explorarão opções como modelos de origem não americana,” como aqueles da Mistral, Cohere, e “modelos chineses de código aberto capazes”, acrescenta ele.

A ordem da Anthropic irá “impulsionar a escala dos modelos de código aberto chineses”, diz Shah. “Mas também veremos muitas economias ambiciosas e autossuficientes, como as do Oriente Médio, que tentarão construir seus próprios modelos de software indígenas.”

Governos asiáticos, em particular, têm feito um esforço público por “IA soberana”. A Coreia do Sul, por exemplo, lançou uma competição nacional apoiada pelo estado para desenvolver modelos de IA em coreano.

“Precisamos avançar nossa própria tecnologia o mais rápido possível e nos tornarmos o mais autossuficientes que pudermos”, disse Sung Kim, cofundador da startup de IA coreana Upstage, em uma coletiva de imprensa na terça-feira, acrescentando que a IA agora é um “ativo nacional estratégico”.

O Japão, por sua vez, está sugerindo que pode recorrer à OpenAI, rival da Anthropic, para reforçar suas defesas cibernéticas.

Qual é a qualidade dos modelos de IA de código aberto da China?

Nem a OpenAI nem a Anthropic disponibilizam seus modelos na China, incluindo a cidade de Hong Kong (que fica fora dos controles de internet de Pequim).

Ambas as empresas já acusaram laboratórios chineses como DeepSeek de realizar ataques de “destilação”, nos quais seus modelos são usados para treinar modelos menores e mais eficientes.

Os modelos chineses ainda estão atrás daqueles desenvolvidos nos EUA. O modelo mais recente do DeepSeek, V4, possui desempenho aproximadamente igual ao Claude Opus 4.6 da Anthropic e ao GPT-5.4 da OpenAI. Esses modelos foram lançados em fevereiro e março de 2026, respectivamente. A startup chinesa estimou que está de três a seis meses atrás dos modelos de ponta mais avançados.

No entanto, embora os modelos de código aberto chineses não sejam tão potentes quanto os de seus pares americanos, eles ainda são significativamente mais baratos. O V4 Pro do DeepSeek custa $3,48 por 1 milhão de tokens de saída; o modelo Fable 5 da Anthropic custa $50 pelo mesmo número de tokens. (Um token é a unidade básica de dados que os sistemas de IA contemporâneos, a maioria dos quais são grandes modelos de linguagem, processam. É equivalente a cerca de uma palavra e meia em texto em inglês.)


Leave a Comment

O seu endereço de email não será publicado. Campos obrigatórios marcados com *