HOME FEEDBACK

Alibaba lança modelo Qwen3 em desafio de IA à DeepSeek

Alibaba lança Qwen3 em meio à intensa competição no setor de inteligência artificial, prometendo maior eficiência e capacidade em relação aos rivais. A companhia busca fortalecer sua posição no mercado com um investimento significativo em infraestrutura de IA e nuvem.

Intensificam-se as competições em IA com o lançamento do Qwen3 pela Alibaba em 29 de outubro.

O Qwen3 é a mais recente geração dos modelos de linguagem de código aberto da Alibaba, prometendo reduzir o poder computacional em comparação com concorrentes.

Ele foi treinado em 36 trilhões de tokens, o que é o dobro do anterior Qwen2.5. Quanto mais tokens, melhor o desempenho do modelo em seguir instruções e resolver problemas.

O produto inclui modos de raciocínio híbrido: um "modo de pensamento" para tarefas complexas e um "modo não pensamento" para respostas rápidas.

  • Seis modelos densos para tarefas gerais.
  • Dois modelos Mixture-of-Experts (MoE), que são mais eficientes.

O Qwen3-235B-A22B supera rivais como DeepSeek-R1 e OpenAI-o1 em testes de benchmark para raciocínio matemático e proficiência em codificação.

A competição acirrou-se desde que a DeepSeek surgiu no início do ano. Em resposta, a Baidu lançou novos modelos a preços baixos.

Antes do lançamento, havia especulações sobre atrasos devido à saída de engenheiros seniores para a ByteDance.

A corrida ocorre em meio a restrições dos EUA à exportação de chips, embora empresas chinesas tenham estocado chips valiosos.

A Alibaba planeja investir 380 bilhões de yuan (US$ 52 bilhões) em infraestrutura de IA e nuvem. O preço das ações da empresa subiu mais de 40% este ano.

O índice Hang Seng Tech cresceu cerca de 12,5% no ano, refletindo o entusiasmo em torno da IA na China.

Leia mais em valoreconomico