DeepSeek põe o pé no acelerador para lançar novo modelo de IA

A corrida das gigantes tecnológicas para ter os melhores modelos de inteligência artificial (IA) continua aguerrida e ninguém quer ficar para trás. A mais recente novidade provém da startup chinesa DeepSeek que está decidida a reforçar a sua posição no mercado da IA.

Após o sucesso do seu modelo R1, que gerou um grande impacto na indústria ao competir com tecnologias de empresas norte-americanas a um custo inferior, a empresa procura trazer para o mercado, o quanto antes, o seu modelo de nova geração, R2.

O seu primeiro modelo, R1, utilizou chips Nvidia menos potentes e arquiteturas otimizadas, o que permitiu reduzir os custos sem comprometer o desempenho. Agora, com a chegada iminente do R2, a empresa pode consolidar a sua posição e pressionar os líderes do setor a acelerar as suas próprias inovações.

Segundo a empresa tecnológica indiana Zensar, o lançamento do R2 pode redefinir a indústria da IA, democratizando o acesso a ferramentas avançadas para mais empresas e setores. Em particular, os profissionais de marketing e publicidade poderão beneficiar de modelos mais acessíveis e eficientes para otimizar estratégias, analisar dados e personalizar experiências do consumidor.

Ao contrário de outras startups chinesas, a DeepSeek opera com uma cultura organizativa mais flexível e horizontal. O seu fundador, Liang Wenfeng, optou por um ambiente colaborativo onde os jovens investigadores desempenham um papel fundamental no desenvolvimento tecnológico. Esta estrutura impulsionou uma maior criatividade e agilidade na melhoria dos seus modelos de IA.

A High-Flyer, o fundo de investimento que apoia a startup, oferece ainda salários competitivos que superam os de outras empresas do setor, atraindo assim os melhores talentos em ciência de dados e inteligência artificial.

O governo chinês vê na DeepSeek um exemplo de inovação tecnológica e tem apoiado o seu crescimento. No entanto, pediu à startup que mantenha um perfil discreto nos meios internacionais. Ao mesmo tempo, países como a Coreia do Sul e a Itália proibiram a aplicação da DeepSeek nos seus territórios por medo de riscos relacionados com a privacidade.

Para continuar a crescer, a DeepSeek foca-se na otimização da sua arquitetura de IA, utilizando técnicas avançadas como Mixture-of-Experts (MoE) e Multihead Latent Attention (MLA). Esta estratégia permite-lhe manter a competitividade apesar das restrições no acesso a chips de alta gama.

Artigos relacionados