MolmoAct da AI2: Inovação em IA Robótica Desafia Gigantes como Nvidia e Google
Olha só… a inteligência artificial não para de nos surpreender! Recentemente, a equipe da Allen Institute for AI (Ai2) lançou o MolmoAct 7B, um modelo open-source que promete abalar as estruturas de gigantes como Nvidia e Google no campo da robótica. Mas o que faz o MolmoAct tão especial assim? Vamos descobrir!
Uma Nova Dimensão de Raciocínio: O MolmoAct e o Espaço 3D
Pra você entender, o MolmoAct é um modelo inovador que “pensa” em três dimensões, permitindo que os robôs entendam e interajam com o mundo físico de forma bem mais natural. Ai2 classifica o MolmoAct como um Modelo de Raciocínio em Ação, capaz de planejar e executar ações no espaço físico tridimensional.
Esse recurso de raciocínio em 3D permite que os robôs usem suas capacidades para compreender o ambiente ao seu redor, planejar como se deslocar e então agir de acordo. Em outras palavras, estamos diante de uma revolução na interação robótica com o mundo físico!
Superando Barreiras com Inovação
Se liga, a Ai2 anunciou que, através do MolmoAct, os robôs podem adaptar-se a ambientes variados, sejam eles residenciais ou industriais, fazendo com que suas capacidades de adaptação impressionem. O modelo emite “tokens de percepção espacial”, essenciais para codificar estruturas geométricas e estimar distâncias entre objetos.
Com essa estimativa de distância, o MolmoAct pode prever uma sequência de pontos no “espaço de imagem”, determinando um caminho a seguir e iniciando ações específicas, como mover um braço mecânico. Os testes realizados mostraram que o MolmoAct 7B tem uma taxa de sucesso nas tarefas de 72,1%, superando modelos de empresas como Google, Microsoft e Nvidia.
Uma Pequena Grande Passo na IA
De acordo com Alan Fern, professor da Oregon State University, a pesquisa da Ai2 representa um avanço natural na melhoria dos modelos de linguagem visual para robótica. Embora essa inovação não seja considerada revolucionária, ela é um passo significativo em direção ao desenvolvimento de modelos de raciocínio físico em 3D mais eficazes.
Por outro lado, Daniel Maturana, cofundador da Gather AI, elogia a abertura dos dados, destacando que isso representa uma base forte para outras instituições e até mesmo para hobbistas interessados em avançar nessa tecnologia.
O Futuro dos Robôs Mais Inteligentes
Imagina isso… O sonho de criar robôs mais espertos e cientes do espaço está se tornando mais real a cada dia. Métodos baseados em LLMs permitiram que robôs, pelo menos os braços robóticos, decidam quais ações tomar com base nos objetos ao seu redor. Projetos da Google Research e da Meta também estão no caminho para permitir que robôs planejem movimentos e manipulam objetos de forma eficiente.
Apesar dos desafios e das limitações ainda presentes, o campo da inteligência artificial física está se expandindo rapidamente, com muito espaço para avanços inovadores. É uma área promissora e empolgante para se ficar de olho!
Para saber mais, confira a matéria completa na fonte do artigo.

