
Google DeepMind traz robôs para o mundo real com o lançamento da Gemini Robotics
A DeepMind, divisão de inteligência artificial do Google, acaba de lançar a Gemini Robotics, uma inovação significativa que promete transformar o campo da robótica. Baseada na tecnologia avançada do Gemini 2.0, a Gemini Robotics foi projetada para integrar visão, linguagem e ação, ampliando as possibilidades de controlo de robôs. Esse avanço representa um passo crucial para trazer a inteligência artificial para além do digital, permitindo que interaja com o mundo físico e execute tarefas complexas com maior habilidade e precisão.
A Gemini Robotics, o modelo mais avançado de visão-linguagem-ação (VLA), possibilita o controlo direto de robôs no mundo real e adapta-se a uma ampla gama de tarefas. Além disso, a sua capacidade de compreensão espacial avançada permite que especialistas desenvolvam e implementem sistemas de controlo mais sofisticados.
De acordo com a DeepMind, para que os robôs sejam realmente úteis às pessoas, devem possuir três qualidades essenciais: generalidade, interatividade e destreza. A Gemini Robotics destaca-se nesses três aspetos, aproximando-se cada vez mais da visão de robôs de uso geral, capazes de atuar com eficiência e autonomia em diferentes cenários.