Recentemente, a DeepSeek AI lançou o aguardado DeepSeek-V3-0324 uma nova versão que promete revolucionar o mundo da inteligência artificial. Com uma série de melhorias significativas e mantendo seu caráter open source (sob a licença MIT), o novo modelo já está causando alvoroço na comunidade e abrindo portas para inovações em diversas áreas.
Desempenho aprimorado em várias frentes
Disponibilizado na plataforma Hugging Face, o DeepSeek-V3-0324 apresenta melhorias notáveis em áreas como raciocínio e capacidades de codificação, superando seu predecessor em diversos benchmarks técnicos.
O DeepSeek-V3-0324 chega com avanços em comparação com sua versão anterior, o DeepSeek V3. Confira os principais pontos de melhoria:
• Raciocínio e Resolução de Problemas
Testes e benchmarks evidenciam ganhos expressivos:
– MMLU-Pro: +5,3
– GPQA: +9,3
– AIME: +19,8
– LiveCodeBench: +10,0
Apesar de não ter sido especificamente otimizado para raciocínio (como o DeepSeek R1), o V3-0324 demonstra robusta capacidade lógica e de resolução de desafios, alcançando cerca de 60% de acerto em tarefas de programação em Python e Bash.
• Desenvolvimento Web Front-End
A nova versão apresenta melhorias consideráveis na geração de código, permitindo a criação de páginas web e interfaces de jogos mais esteticamente agradáveis. Testes práticos comprovaram que, a partir de prompts simples, o modelo é capaz de desenvolver websites completos com links funcionando perfeitamente, além de se destacar em tarefas complexas de front-end.
• Escrita e Busca em Chinês
Para quem trabalha com conteúdos em chinês, a qualidade do estilo e do conteúdo foi aprimorada, equiparando-se ao modelo R1 e garantindo excelência em textos de média e longa duração. Além disso, as capacidades de análise e requisição de relatórios em chinês foram significativamente otimizadas.
• Function Calling e Interação Multi-Turno
As funcionalidades de Function Calling foram aprimoradas, corrigindo inconsistências presentes em versões anteriores. Ademais, a reescrita interativa multi-turno e a qualidade na tradução e na elaboração de cartas receberam refinamentos que elevam a experiência do usuário.

DeepSeek-V3-0324 – detalhes técnicos e acessibilidade
O DeepSeek-V3-0324 não é apenas poderoso em desempenho, mas também apresenta uma arquitetura robusta e inovadora:
• Tamanho e Arquitetura
– Modelo massivo de 700 GB disponível para download no Hugging Face.
– Estruturado como um “mixture of experts” com 671 bilhões de parâmetros, dos quais cerca de 37 bilhões são utilizados por prompt, contribuindo para manter os custos de inferência reduzidos.
• Janela de Contexto e Métodos Inovadores
– Capacidade de lidar com uma janela de contexto expandida para impressionantes 128 mil tokens, graças a um método denominado YARN (Yet Another Recurrent Network).
– Essa característica permite a geração de respostas extensas, ideal para tarefas como o desenvolvimento de software.
• Treinamento e Infraestrutura
– Treinado com um dataset massivo de 14,8 trilhões de tokens
– Processamento realizado com chips Nvidia H800, com custo de treinamento inferior a 6 milhões de dólares.
• Diversas Formas de Acesso
– Website oficial da DeepSeek, onde o modelo é o padrão (com o “Deep Seek Thinking Feature” desativado).
– API via plataforma própria da DeepSeek, mantendo a interface e os métodos já conhecidos do V3.
– API gratuita pelo OpenRouter, onde o modelo é identificado como “DeepSQ3 0324” e pode gerar até 131 mil tokens.
– Pesos disponíveis no Hugging Face (observando que o Transformers da Hugging Face ainda não oferece suporte direto).
Comparações e desempenho eeal
Usuários já relatam que o DeepSeek-V3-0324 apresenta uma velocidade de geração de texto muito rápida – cerca de 20 tokens por segundo em um Mac Studio de ponta, utilizando quantização de 4 bits. Em benchmarks internos, o modelo supera concorrentes como o Claude 3.5 e 3.7 em tarefas de codificação, sendo considerado atualmente um dos melhores modelos não voltados especificamente para raciocínio. Em testes como o ERS Polyglot, o DeepSeek-V3-0324 alcançou cerca de 55%, ficando próximo ao Sonnet 3.7 entre modelos com foco similar. Vale notar que o estilo de resposta do V3-0324 adota uma abordagem mais formal se comparado às versões anteriores.
Implicações no cenário global de IA
O lançamento do DeepSeek-V3-0324 ocorre em um momento de intensa competição global na área de inteligência artificial. Com o governo chinês incentivando seus especialistas, o sucesso da DeepSeek reforça a reputação da China no setor. A abertura do modelo para a comunidade (open source) estimula a sua adoção por pequenas equipes e startups, e até mesmo projetos de organizações governamentais (como aplicações de gestão urbana) e pelo exército chinês para tarefas não combatentes. Esse movimento está pressionando outras empresas de IA a reavaliarem suas estratégias e a investirem ainda mais em pesquisa e desenvolvimento.
Fundada recentemente, a DeepSeek tem ganhado destaque no cenário global de IA, oferecendo modelos que rivalizam com contrapartes ocidentais a custos operacionais mais baixos. A empresa lançou o modelo V3 em dezembro e o modelo R1 em janeiro, consolidando sua posição no mercado.
A eficiência e o custo reduzido dos modelos da DeepSeek têm chamado a atenção da indústria tecnológica. Empresas como a Amazon já integraram os modelos da DeepSeek, que podem superar outros modelos populares no mercado.
O DeepSeek-V3-0324 representa um avanço significativo no campo dos modelos de linguagem, combinando desempenho aprimorado, uma janela de contexto recorde e acessibilidade open source. Essa atualização não só eleva os padrões da inteligência artificial, mas também promete impactar profundamente a forma como desenvolvedores, startups e até órgãos governamentais utilizam essa tecnologia para inovar e transformar processos.
O avanço da DeepSeek destaca a crescente competitividade da China no campo da inteligência artificial, desafiando a liderança tradicional dos EUA e sinalizando uma mudança no equilíbrio tecnológico global.
Fique ligado para mais atualizações e análises detalhadas deste impressionante novo modelo da DeepSeek!