Robôs, sejam eles humanoides bípedes lidando com tarefas básicas de fábrica ou “cães robôs” militares de quatro patas destinados ao combate urbano, precisam de cérebros. Historicamente, eles foram altamente especializados e construídos para um propósito específico. Mas uma startup de robótica sediada em Pittsburgh (EUA) afirma ter criado uma inteligência única pronta para o uso e que pode ser conectada a diferentes robôs para habilitar funções básicas.
Fundada em maio de 2023 por Abhinav Gupta e Deepak Pathak, dois ex-professores da Carnegie Mellon University, a Skild AI criou um modelo fundamental para o que descreve como um “cérebro de propósito geral” que pode ser encaixado em uma variedade de robôs, permitindo que eles façam coisas como escalar encostas íngremes, caminhar sobre objetos que obstruem o caminho e identificar e pegar itens.
A empresa levantou US$ 300 milhões (R$ 1,635 bilhão) em uma avaliação de US$ 1,5 bilhão (R$ 8,175 bilhão) em uma rodada de financiamento da Série A liderada pela Lightspeed Ventures, Softbank, Coatue e o fundador da Amazon, Jeff Bezos, com a participação da CRV, Felicis Ventures, Menlo Ventures, Amazon, Sequoia Capital, General Catalyst, SV Angel e CMU.
Raviraj Jain, o parceiro da Lightspeed que também liderou a rodada da empresa em julho de 2023, disse à Forbes que ficou extremamente impressionado com os modelos da Skild AI quando os viu pela primeira vez sendo testados em abril. Os robôs eram capazes de executar tarefas em ambientes que nunca tinham visto antes nem tinham sido projetados para tais demonstrações. “Os robôs naquela época eram capazes de subir escadas, e acho realmente louco o quão bem eles conseguiam fazer isso porque é um problema de estabilidade muito complexo”, disse Jain.
Mais impressionante ainda: os robôs que usam os modelos de IA da Skild também demonstraram “capacidades emergentes” — habilidades inteiramente novas que não lhes foram ensinadas. Geralmente são simples, como recuperar um objeto que escorrega da mão ou girar um objeto. Mas demonstram o avanço do modelo para executar tarefas não previstas, uma tendência que ocorre em sistemas artificiais avançados, como grandes modelos de linguagem.
A Skild conseguiu isso treinando seu modelo em um enorme banco de dados de texto, imagens e vídeo — que ela afirma ser 1 mil vezes maior do que os usados por seus rivais. Para criar esse enorme banco de dados, os cofundadores, ambos ex-pesquisadores de IA da Meta, misturaram uma mistura de técnicas de coleta de dados, que desenvolveram e testaram ao longo de anos de pesquisa.
Uma maneira era contratar humanos para operar robôs remotamente e coletar dados sobre essas ações. Outra era fazer com que o robô realizasse tarefas aleatórias, registrasse os resultados e aprendesse por tentativa e erro. O modelo de IA também foi treinado em milhões de vídeos públicos.
Como aluno de doutorado na UC Berkeley, Pathak desenvolveu uma maneira de incutir “curiosidade artificial” em robôs, recompensando o sistema por ações que ocorrem sem conseguir prever os resultados. “Quanto mais incerto o agente está sobre a previsão do efeito de suas ações, mais curioso ele fica para explorar”, explicou. A técnica incentivou a IA a navegar em mais cenários e coletar mais dados.
Sua pesquisa sobre aprendizagem orientada pela curiosidade foi publicada em 2017 e foi citada mais de 4 mil vezes. Pathak também criou uma maneira para robôs usarem informações escritas em grandes modelos de linguagem, como o GPT. Por exemplo, como abrir uma lata de leite, e convertê-las em ações.
“Em 2022, descobrimos uma maneira de juntar essas coisas em um único sistema coerente”, disse Pathak. “A noção de aprender com vídeos, aprender com curiosidade, aprender com dados reais, mas combinados com o conhecimento da simulação.”
A Skild AI enfrenta forte concorrência de uma série de empresas de robótica que surgiram com bilhões de dólares em financiamento de risco graças ao boom da IA. A gigante da indústria OpenAI recentemente reviveu sua equipe de robótica para fornecer modelos para empresas de robótica, informou a Forbes. Depois, há empresas como a de robótica humanoide Figure AI, comandada pelo CEO bilionário Brett Adcock, e a Covariant, uma spin off da OpenAI que está construindo o ChatGPT para robôs e arrecadou mais de US$ 200 milhões (US$ 1, 09 bilhão) para isso.
O cofundador Gupta afirma que o acesso da Skild AI a grandes quantidades de dados a separa de outras no espaço, mas se recusou a revelar exatamente a quantos dados seu modelo é treinado.
Ken Goldberg, professor de robótica e automação na UC Berkeley, concorda que os dados são a chave para dimensionar a robótica, mas explica que os robôs exigem um tipo específico de dados que não está amplamente disponível na internet. Além disso, usar dados coletados de simulação nem sempre se traduz no mundo real.
“Toda a ideia que empolga a robótica agora é a que podemos fazer algo análogo a grandes modelos de linguagem e grandes modelos de linguagem de visão, onde ambos têm dados de internet em escala acessíveis, com bilhões de exemplos”, disse Goldberg. Não é uma tarefa simples para a robótica, mas a Skild AI visa abordar o problema combinando todas as suas técnicas de coleta de dados com mais informações extraídas de simulações.
Pathak e Gupta imaginam um futuro para sua empresa que é semelhante ao da OpenAI, onde diferentes casos de uso e produtos podem ser construídos em cima do modelo fundamental da Skild, ajustando-o. “É exatamente assim que pretendemos promover uma disrupção na indústria de robótica”, disse Gupta, acrescentando que, eventualmente, eles querem alcançar inteligência geral artificial (um sistema de IA hipotético que pode rivalizar ou superar as capacidades humanas) para robôs, mas um com o qual as pessoas podem interagir no mundo físico.
“Um momento GPT-3 está chegando ao mundo da robótica”, disse Stephanie Zhan, sócia da Sequoia Capital e investidora existente na Skild AI. “Isso desencadeará uma mudança monumental que trará avanços semelhantes aos que vimos no mundo da inteligência digital para o mundo físico.”
Fonte: Forbes.