Qwen3: A Revolução em Modelos de Raciocínio Open Source da Alibaba

A temporada de verão da IA está agitando o mercado com novidades impressionantes! Se você estivesse procurando por um ‘hit do verão’ no mundo da inteligência artificial, ele seria, sem dúvida, o Qwen da Alibaba. Nas últimas semanas, a equipe Qwen da gigante chinesa nos surpreendeu com quatro novos modelos de IA generativa em código aberto que estão estabelecendo novos recordes, superando opções proprietárias líderes.

Na noite passada, a equipe Qwen lançou o Qwen3-235B-A22B-Thinking-2507, seu modelo de linguagem de raciocínio grande (LLM) atualizado. Este modelo pode demorar um pouco mais para responder em comparação aos LLMs de “instrução”, pois realiza “correntes de pensamento” e auto-reflexão, resultando em respostas mais precisas e abrangentes em tarefas complexas.

O novo Qwen3-Thinking-2507 se destaca em vários benchmarks de desempenho. Segundo o influenciador de IA Andrew Curran, “O modelo de raciocínio mais forte do Qwen chegou, e está na vanguarda.”

Desempenho de Destaque nos Benchmarks

Em benchmarks como o AIME25, que avaliam a habilidade de resolução de problemas em contextos matemáticos e lógicos, o Qwen3-Thinking-2507 lidera com uma pontuação de 92.3, ultrapassando por pouco o OpenAI’s o4-mini (92.7) e o Gemini-2.5 Pro (88.0).

O modelo também apresenta um desempenho impressionante no LiveCodeBench v6, marcando 74.1, à frente do Google Gemini-2.5 Pro (72.5) e do OpenAI o4-mini (71.8), superando significativamente sua versão anterior, que obteve 55.7.

No GPQA, um benchmark para perguntas de múltipla escolha em nível de pós-graduação, alcançou 81.1, quase igualando o Deepseek-R1-0528 (81.0) e ficando atrás apenas do melhor resultado do Gemini-2.5 Pro, que atingiu 86.4.

Uma Mudança de Paradigma nos Modelos de Raciocínio

O lançamento do Qwen3-Thinking-2507 reflete uma mudança estratégica da equipe Qwen da Alibaba. O foco está agora em modelos separados, treinados para tarefas de raciocínio e instrução, permitindo otimizações específicas que melhoram a consistência, clareza e desempenho nos benchmarks.

A Alibaba também lançou o Qwen3-Coder-480B-A35B-Instruct, um modelo de 480 bilhões de parâmetros voltado para codificação complexa, e o Qwen3-MT, um modelo de tradução multilíngue treinado em trilhões de tokens em mais de 92 idiomas.

Licenciamento Apache 2.0: Vantagens para Empresas

Diferente dos modelos proprietários que exigem acesso a APIs ou impõem limites, o licenciamento Apache 2.0 do Qwen3-235B-A22B-Thinking-2507 permite que empresas façam download, modifiquem, self-hospehem, afinem e integrem o modelo em sistemas sem restrições, garantindo flexibilidade e propriedade integral.

Disponibilidade e Integração

O modelo está disponível gratuitamente para download no Hugging Face e ModelScope. Para empresas que preferem não hospedar o modelo, o serviço está disponível através da API da Alibaba Cloud, com preços a partir de $0.70 por milhão de tokens de entrada e $8.40 por milhão de tokens de saída, e uma camada gratuita de 1 milhão de tokens válida por 180 dias.

Com seu desempenho destacado em benchmarks e licenciamento permissivo, o Qwen3-Thinking-2507 é ideal para sistemas empresariais de IA que envolvem raciocínio, planejamento e suporte à decisão. A série Qwen, com seus modelos especializados e suporte comunitário, indica uma mudança em direção a uma infraestrutura de IA aberta e eficiente.

Para mais informações e atualizações sobre IA e tecnologias, confira a fonte original do artigo.

Fique por dentro do futuro

Qwen3: A Revolução em Modelos de Raciocínio Open Source da Alibaba

Desempenho de Destaque nos Benchmarks

Uma Mudança de Paradigma nos Modelos de Raciocínio

Licenciamento Apache 2.0: Vantagens para Empresas

Disponibilidade e Integração