No dia 5 de março, a Alibaba apresentou seu novo modelo de raciocínio em IA, o QwQ-32B, o que resultou em um aumento de 8% nas ações da empresa listadas em Hong Kong. Embora seja considerado menos avançado do que os principais modelos de IA dos EUA, como o o3 da OpenAI ou o Claude 3.7 Sonnet da Anthropic, o QwQ-32B apresenta desempenho similar ao modelo R1 da DeepSeek, sua concorrente chinesa, mas com uma exigência muito menor de poder computacional para desenvolvimento e execução. Os criadores do modelo destacam que ele incorpora um espírito filosófico antigo ao abordar problemas com um senso genuíno de dúvida e curiosidade.
A apresentação do QwQ-32B faz parte de um cenário mais amplo da crescente competitividade do ecossistema de IA na China, que inclui também os modelos da DeepSeek e do Tencent. Embora as avaliações sobre o modelo da Alibaba ainda sejam preliminares, com base em análises feitas apenas pela própria empresa, especialistas apontam que a corrida global para o desenvolvimento de Inteligência Artificial Geral (AGI), um sistema altamente avançado capaz de realizar praticamente qualquer trabalho cognitivo, está em plena ascensão, com implicações de segurança e geopolítica, especialmente no contexto das relações entre os EUA e a China.
O lançamento de novos modelos de IA é uma continuidade das tendências tecnológicas recentes, com sistemas cada vez mais potentes e baratos de operar. A inovação técnica tem mostrado que a computação usada no treinamento de IA tem aumentado rapidamente, enquanto a eficiência dos algoritmos tem melhorado, permitindo o uso de menos recursos. A Alibaba, assim como outros gigantes tecnológicos da China, enfrenta desafios devido às restrições de exportação de chips dos EUA, o que representa um obstáculo importante para o desenvolvimento de IA no país. O QwQ-32B, lançado com pesos abertos, também reflete uma nova abordagem de modelos de IA, onde a ênfase está no aumento do poder computacional usado durante a resposta a uma consulta, em vez de simplesmente escalar os dados ou o poder de processamento utilizados no treinamento.