CiênciasInteligência ArtificialTecnologia

DeepSeek lança DeepSeek-V3.2-Exp: novo modelo de IA chinês mais eficiente e barato pavimenta caminho para a era agêntica

DeepSeek lança DeepSeek-V3.2-Exp: novo modelo de IA chinês mais eficiente e barato pavimenta caminho para a era agêntica

A chinesa DeepSeek, uma das startups mais inovadoras no campo da inteligência artificial, anunciou nesta segunda-feira, 29 de setembro de 2025, o lançamento do DeepSeek-V3.2-Exp, um modelo experimental que representa um avanço significativo em eficiência computacional e processamento de textos longos. Descrito pela empresa como “um passo intermediário em direção à nossa arquitetura de próxima geração”, o novo modelo incorpora inovações como o mecanismo DeepSeek Sparse Attention (DSA), que otimiza o treinamento e a inferência em contextos extensos, reduzindo custos sem comprometer a qualidade das saídas. Essa liberação, disponível no Hugging Face, chega em um momento de intensa competição global em IA, com benchmarks mostrando desempenho comparável ao antecessor V3.1-Terminus em tarefas de raciocínio, codificação e uso de ferramentas agênticas.

Inovações técnicas: eficiência em sequências longas e atenção esparsa

O DeepSeek-V3.2-Exp foi treinado com configurações alinhadas ao V3.1-Terminus para permitir comparações diretas, mas destaca-se pela introdução do DSA, um mecanismo de atenção esparsa de granulação fina que seleciona apenas tokens relevantes para cada consulta, em vez de processar sequências completas. Isso resulta em reduções substanciais de custo computacional – até 50% em operações de contexto longo, como análise de documentos extensos, códigos complexos ou grandes volumes de dados. De acordo com o relatório técnico da DeepSeek, disponível no GitHub, o modelo mantém “qualidade de saída praticamente idêntica” enquanto acelera o treinamento e a inferência, tornando-o ideal para aplicações em escala.

Em benchmarks públicos, o V3.2-Exp demonstra paridade com o V3.1 em domínios variados, com ganhos marginais em eficiência para tarefas que envolvem contextos extensos. Ferramentas como vLLM e SGLang já oferecem suporte imediato, permitindo que desenvolvedores lancem servidores de inferência com configurações como tensor parallelism (tp 8) e data parallelism (dp 8). Para pesquisadores, kernels como TileLang e FlashMLA facilitam experimentos com atenção esparsa, promovendo inovações em designs de transformers mais sustentáveis. No Brasil, onde o acesso a computação de alto desempenho é limitado, esse modelo pode democratizar o desenvolvimento de IA em universidades como a UFCG ou a UFPB, especialmente para análises de dados em biologia computacional ou processamento de textos em português.

Redução de preços: acessibilidade que desafia gigantes ocidentais

Além das melhorias técnicas, a DeepSeek anunciou uma drástica redução nos preços da API, efetiva imediatamente. O custo por milhão de tokens de entrada caiu de US$ 0,07 para US$ 0,028 – um desconto de 60% –, enquanto o de saída despencou 70%, para US$ 0,042 por milhão. Isso posiciona o modelo como 20 a 30 vezes mais barato que concorrentes como o ChatGPT da OpenAI ou o Gemini do Google, tornando-o atraente para startups e pesquisadores independentes. O V3.1-Terminus permanecerá disponível via API temporária até 15 de outubro de 2025, para testes comparativos, e a empresa incentiva feedback via formulário dedicado.

Essa estratégia de precificação reflete o foco da DeepSeek em eficiência: o modelo R1, lançado no início de 2025, já havia chocado o Vale do Silício por ser treinado com menos de US$ 6 milhões em chips mais antigos, rivalizando com sistemas caros de treinamento. No contexto nordestino, onde iniciativas como o Fab Lab da UEPB buscam ferramentas acessíveis para inovação, o V3.2-Exp pode impulsionar projetos em educação e saúde, como chatbots para atendimento em português ou análise de dados epidemiológicos na Caatinga, reduzindo barreiras econômicas à adoção de IA avançada.

Vislumbre da próxima geração: IA agêntica e autônoma

O V3.2-Exp serve como precursor para a arquitetura de próxima geração da DeepSeek, prevista para o final de 2025 ou início de 2026, com ênfase em IA agêntica – sistemas capazes de executar tarefas autônomas em nome do usuário, como reservar mesas em restaurantes, gerenciar agendas ou até conduzir negociações simples, sem supervisão constante. Essa evolução, alinhada a tendências globais como o Grok da xAI ou o o1 da OpenAI, promete transformar assistentes virtuais em agentes proativos, integrando ferramentas externas e raciocínio multistep. No relatório da empresa, o foco em otimizações arquiteturais para contextos longos sugere que a versão oficial do V3.2 sairá em dezembro, com prévias da V4 no primeiro trimestre de 2026.

Para o ecossistema brasileiro de IA, que cresce com hubs em São Paulo e Recife, essa acessibilidade pode fomentar colaborações internacionais, como adaptações do modelo para dialetos regionais ou aplicações em agritech para o semiárido paraibano. Desenvolvedores já exploram o repositório no GitHub para integrações personalizadas, acelerando a inovação local sem depender de infraestruturas caras.

Controvérsias e tensões geopolíticas: privacidade em xeque

Apesar dos avanços, a DeepSeek enfrenta escrutínio intenso nos Estados Unidos, onde acusações de laços com o governo chinês e compartilhamento de dados para fins militares e de inteligência persistem desde junho de 2025. Uma autoridade do Departamento de Estado americano alegou à Reuters que a empresa “fornece suporte voluntário” a operações de Pequim, usando empresas de fachada no Sudeste Asiático para contornar controles de exportação de chips da Nvidia. Relatórios bipartidários da Câmara dos Representantes, como o de abril de 2025, classificam a DeepSeek como “ameaça profunda” à segurança nacional, citando coleta de dados de usuários americanos – incluindo histórico de chats e detalhes de dispositivos – armazenados em servidores chineses, sujeitos a leis que obrigam cooperação com agências de inteligência.

A OpenAI, em parceria com o governo dos EUA, recomendou proibições à IA chinesa, argumentando riscos à privacidade e segurança. Medidas como o “No DeepSeek on Government Devices Act” (HR 1121) e bloqueios em agências federais, Itália, Taiwan e Austrália refletem temores de espionagem cibernética e roubo de propriedade intelectual. A DeepSeek, por sua vez, nega irregularidades, mas críticos apontam recusa em responder tópicos sensíveis como o tratamento a uigures ou Tiananmen, sugerindo viés alinhado ao Partido Comunista Chinês. No Brasil, onde a regulação de IA avança com o PL 2.338/2023, esses debates ecoam: enquanto o modelo oferece oportunidades para pesquisa acessível, questões éticas sobre dados transfronteiriços demandam cautela, especialmente em setores sensíveis como defesa e saúde pública na Paraíba.

Um equilíbrio entre inovação e responsabilidade global

O lançamento do DeepSeek-V3.2-Exp não é apenas uma façanha técnica, mas um marco na corrida pela IA acessível e eficiente, desafiando narrativas de domínio exclusivo por gigantes ocidentais. Com reduções de custo que democratizam o acesso e otimizações que pavimentam o caminho para agentes autônomos, a DeepSeek reforça sua posição como disruptora. Contudo, as controvérsias geopolíticas lembram que o progresso em IA deve vir pareado a salvaguardas éticas e transparentes, evitando que inovações se tornem vetores de risco. No horizonte, a versão oficial prometida para dezembro pode redefinir benchmarks, mas o verdadeiro teste será equilibrar eficiência com confiança global – um desafio que, se superado, beneficiará ecossistemas como o brasileiro, fomentando uma IA inclusiva e soberana.


“O DeepSeek-V3.2-Exp é um passo intermediário em direção à nossa arquitetura de próxima geração, com o DeepSeek Sparse Attention entregando melhorias substanciais em eficiência para contextos longos, mantendo qualidade idêntica.” – Equipe DeepSeek, via Hugging Face


Traduzido e adaptado de TecMundo [GRK-XAI-30092025-1558-V1G]


Descubra mais sobre Movimento PB

Assine para receber nossas notícias mais recentes por e-mail.