Pesquisar
Feche esta caixa de pesquisa.

Como uma startup chinesa revolucionou o ainda incipiente universo da IA

Redação Culturize-se

Foto: Jaap Arriens/NurPhoto

Silicon Valley, Wall Street e Washington estão em frenesi por conta do DeepSeek-R1, um novo modelo de inteligência artificial desenvolvido por uma startup chinesa. A DeepSeek, relativamente desconhecida até então, causou um forte impacto ao lançar um modelo de código aberto que apresenta avanços impressionantes em capacidade, custo e eficiência. A novidade levanta questões sobre a vantagem competitiva dos Estados Unidos no setor de IA, assim como sobre o futuro da corrida tecnológica entre China e Ocidente.

O maior impacto imediato foi sentido no mercado de tecnologia. A Nvidia, principal fabricante de chips para IA, viu suas ações despencarem quase 20% em um único dia, resultando em uma perda de US$ 600 bilhões em valor de mercado. Esse choque reflete a crescente preocupação dos investidores com a viabilidade da estratégia tradicional de investimento bilionário em computação para treinamento de modelos de IA. O DeepSeek-R1, desenvolvido com uma fração do custo de seus concorrentes ocidentais, sugere que um novo paradigma pode estar se formando.

Ao contrário das grandes empresas de tecnologia do Ocidente, que apostam na escalabilidade infinita por meio da aquisição de mais chips e treinamentos prolongados, a DeepSeek adotou uma abordagem diferente. A empresa se concentrou na reestruturação fundamental dos modelos de IA, maximizando a eficiência do software e reduzindo a dependência de hardware avançado. Essa abordagem permite que modelos altamente eficientes sejam desenvolvidos com um orçamento significativamente menor.

A origem da DeepSeek

A DeepSeek não é uma startup convencional. Ela nasceu como Fire-Flyer, uma divisão de pesquisa de deep learning dentro do High-Flyer, um dos hedge funds quantitativos mais bem-sucedidos da China. Em 2015, o High-Flyer se destacou no mercado financeiro chinês, chegando a administrar mais de US$ 15 bilhões em ativos. Com o tempo, começou a acumular GPUs e desenvolver supercomputadores para análise de dados financeiros. Em 2023, Liang Wenfeng, fundador da DeepSeek, decidiu direcionar esses recursos para a criação de modelos de IA de ponta, com o objetivo ambicioso de avançar na pesquisa de inteligência geral artificial (AGI).

A estratégia de Liang se diferencia da maioria das startups de IA. Em vez de contratar engenheiros experientes focados em produtos comerciais, ele reuniu um time de recém-formados das melhores universidades chinesas, como Peking University e Tsinghua University. Muitos desses jovens pesquisadores já haviam sido publicados em conferências de prestígio, mas careciam de experiência no setor. Essa abordagem criou um ambiente colaborativo e inovador, onde a pesquisa fundamental recebe prioridade sobre as preocupações comerciais.

Outro fator que diferencia a DeepSeek é sua adesão ao código aberto. Muitas empresas chinesas de IA dependem fortemente do acesso a hardwares avançados, o que as torna vulneráveis às restrições de exportação dos EUA. Em resposta, a DeepSeek apostou na otimização de software e na eficiência dos modelos. Isso a levou a adotar estratégias como a destilação de modelos, onde um modelo maior treina um menor, e o uso de atenção latente multi-head (MLA) e Mistura de Especialistas (MoE), permitindo reduzir significativamente o custo computacional.

Essas otimizações permitiram que o DeepSeek-R1 fosse treinado com apenas um décimo do poder de computação necessário para modelos equivalentes desenvolvidos pela Meta e outros concorrentes ocidentais. Essa eficiência representa uma mudança significativa no campo da IA, onde a narrativa dominante tem sido de que apenas as empresas com vastos recursos poderiam competir na vanguarda da pesquisa.

O lançamento do DeepSeek-R1 também evidencia um dos paradoxos do atual embate tecnológico entre China e EUA. As restrições de exportação de chips impuseram um desafio significativo para empresas chinesas, que precisaram buscar soluções alternativas. A DeepSeek demonstrou que a inovação em software pode compensar a limitação em hardware, colocando em xeque a eficácia das políticas de controle tecnológico dos EUA.

Foto: Reprodução/Internet

Perspectivas

Esse sucesso da DeepSeek levanta questões importantes para o futuro da IA e da competição global. O avanço dos modelos de código aberto está democratizando o acesso a tecnologias de ponta, permitindo que startups menores desafiem os gigantes do setor. Esse movimento também pressiona empresas ocidentais a repensarem suas estratégias. Já se fala em cortes de custos e revisão de abordagens por parte de companhias como Meta e Google, que buscam manter sua relevância diante de concorrentes mais enxutos e inovadores.

No entanto, há desafios para a adoção generalizada do modelo da DeepSeek. Empresas ocidentais podem hesitar em utilizar tecnologia chinesa para aplicações sensíveis, por questões de segurança e soberania tecnológica. Além disso, a confiabilidade de modelos treinados com métodos mais eficientes ainda precisa ser testada em escala, especialmente no que diz respeito à sua capacidade de generalização e segurança.

Apesar desses desafios, o impacto da DeepSeek é inegável. Seu avanço reforça a ideia de que a inovação em IA não depende apenas de investimentos bilionários, mas também de novas abordagens técnicas e filosóficas. O fato de que o modelo está disponível gratuitamente também impulsiona a pesquisa global, permitindo que cientistas e desenvolvedores em todo o mundo explorem novas aplicações e contribuam para avanços futuros.

O crescimento da DeepSeek também ilustra a mudança na própria cultura tecnológica da China. Enquanto as gigantes chinesas da internet, como Baidu e Alibaba, tradicionalmente seguem um modelo fechado e hierárquico, a DeepSeek abraça um paradigma mais aberto e colaborativo. Essa abordagem pode posicionar a China como um líder inesperado na revolução da IA, especialmente à medida que mais desenvolvedores ao redor do mundo adotam e aprimoram seus modelos.

Isso pode te interessar

Marketing

Dua Lipa assume o café de Clooney e a Nespresso aposta na maior virada de sua história

Literatura

Bienal do Livro Bahia 2026 aposta na diversidade e projeta recorde de público em Salvador

Gastronomia

Perfil de porco: tradição, sabor e controvérsia na mesa brasileira

Prato simboliza versatilidade culinária, mas levanta debates sobre saúde e consumo

Literatura

Livro relaciona crescimento do sertanejo universitário ao agronegócio

Newsletter Gratuita

Tenha o melhor da cultura na palma da sua mão. Assine a newsletter gratuita de Culturize-se. Todos os dias pela manhã na sua caixa de e-mail.