Dentro de la Startup de Mil Millones de Dólares que Lleva la IA al Mundo Físico

lalalatvla maquina, revista Leave a Comment

En una puerta metálica en el distrito de Mission de San Francisco, un solo carácter — «π» — ofrece una pista críptica sobre el círculo virtuoso de trabajo que se lleva a cabo más allá. Al abrir la puerta, se revela una actividad frenética que involucra tanto a humanos como a máquinas. Una mujer utiliza dos joysticks para operar un par de brazos robóticos de mesa que cuidadosamente levantan y doblan camisetas en una pila ordenada. Varios robots más grandes mueven artículos de despensa de una caja desordenada a otra. En una esquina de la habitación, un hombre opera una pinza de plástico que se ajusta sobre su muñeca y tiene una webcam en la parte superior. Partes de robots están esparcidas por la habitación.

Este almacén es el hogar de Physical Intelligence, también conocida como PI o π (de ahí el símbolo en la puerta principal), una startup que busca dar a los robots una mejora profunda en inteligencia artificial. La emoción y las expectativas en torno al sueño de la compañía son tales que los inversores están apostando cientos de millones a que logrará el próximo avance revolucionario en el campo de la IA. Physical Intelligence anunció la semana pasada que había recaudado $400 millones de inversores, incluidos OpenAI y Jeff Bezos, con una valoración de más de $2 mil millones.

La Visión de Physical Intelligence

En una sala de conferencias con paredes de vidrio en el segundo piso del edificio, el CEO de la startup, Karol Hausman, un hombre alto con un suave acento alemán y unos días de barba, expone la visión. «Si te pongo en control de un nuevo robot, con un poco de práctica probablemente podrías averiguar cómo controlarlo», dice Hausman. «Y si realmente resolvemos este problema, entonces la IA podrá hacer lo mismo».

Physical Intelligence cree que puede dotar a los robots de una comprensión similar a la humana del mundo físico y de la destreza al alimentar datos de sensores y movimiento de robots que realizan vastas cantidades de demostraciones en su modelo maestro de IA. «Esto es, para nosotros, lo que se necesita para ‘resolver’ la inteligencia física», dice Hausman. «Para insuflar inteligencia en un robot simplemente conectándolo a nuestro modelo».

El Equipo Detrás de la Revolución Robótica

Hausman está acompañado en la mesa de conferencias por varios otros cofundadores: Sergey Levine, un joven profesor asociado con gafas de UC Berkeley; Brian Ichter, un tipo amigable y barbudo que anteriormente trabajó con Hausman en Google; y Chelsea Finn, una profesora asistente en Stanford University que se une a través de un enlace de video.

El equipo reunido ha encendido la esperanza de una revolución robótica que se inspira en otros avances recientes en IA, especialmente las sorprendentes capacidades de los grandes modelos de lenguaje (LLMs) que alimentan IA conversacionales como ChatGPT. Firmemente creen que pueden llevar ese mismo nivel de asombro al mundo físico, y hacerlo pronto.

El Futuro de la IA en el Mundo Físico

Las habilidades lingüísticas de la IA comenzaron a cambiar en 2018, cuando OpenAI mostró que un modelo de aprendizaje automático conocido como transformador podía generar fragmentos de texto sorprendentemente coherentes cuando se le daba una cadena inicial. Los científicos informáticos habían pasado décadas tratando de escribir programas para manejar el lenguaje en toda su complejidad y ambigüedad. El modelo de OpenAI, conocido como Generative Pretrained Transformer o GPT, mejoró constantemente a medida que se le alimentaba con cantidades cada vez mayores de datos extraídos de libros y la internet, eventualmente siendo capaz de mantener conversaciones coherentes y responder a una amplia gama de preguntas.

En 2022, Hausman e Ichter, entonces en Google, junto con Levine, Finn y otros, mostraron que los LLMs también podían ser una base para la inteligencia robótica. Aunque los LLMs no pueden interactuar con el mundo físico, contienen mucha información sobre objetos y escenas gracias al vasto alcance de sus datos de entrenamiento. Ese nivel de conocimiento, aunque imperfecto, puede ser suficiente para dar a los robots la capacidad de idear planes de acción simples.

La Prueba de Fuego

El equipo conectó un LLM a un robot de un solo brazo en una cocina simulada en la sede de Google en Mountain View, California, dándole el poder de resolver problemas abiertos. Cuando se le dijo al robot «Derramé mi Coca-Cola en la mesa», usó el LLM para idear un plan de acción sensato que implicaba encontrar y recuperar la lata, dejarla en la basura y luego obtener una esponja para limpiar el desorden, todo sin ninguna programación convencional.

El Futuro de Physical Intelligence

A pesar de los avances asombrosos en IA en los últimos años, nadie ha descubierto cómo hacer que los robots sean particularmente inteligentes o capaces. Las máquinas encontradas en fábricas o almacenes son esencialmente autómatas de alta tecnología, realizando movimientos precisamente coreografiados sin rastro de ingenio o ingenio.

Physical Intelligence cree que puede cambiar esto. Con una inversión de $400 millones y una valoración de más de $2 mil millones, la startup está lista para revolucionar el mundo de la robótica. La expectativa es alta, y solo el tiempo dirá si pueden cumplir con su promesa de dar a los robots una comprensión similar a la humana del mundo físico.


A Resumidas Cuentas

¿Quién? Physical Intelligence, una startup de IA.

¿Qué? La startup ha recaudado $400 millones de inversores para desarrollar robots con una comprensión similar a la humana del mundo físico.

¿Cuándo? 14 de noviembre de 2024.

¿Dónde? San Francisco, California.

¿Por qué? Para revolucionar el campo de la robótica y dar a los robots una mejora profunda en inteligencia artificial.

¿Cómo? Alimentando datos de sensores y movimiento de robots que realizan vastas cantidades de demostraciones en su modelo maestro de IA.

¿Con qué recursos? Con una inversión de $400 millones de inversores, incluidos OpenAI y Jeff Bezos.

Fuente: Wired
Nota: IA se utilizo en la preparación de este contenido.
Foto: Designer de Microsoft

¡Te gustó lo que leíste? 🎉 ¡Suscríbete a nuestro newsletter y recibe lo mejor de lalalatv directo en tu bandeja! Sé el primero en enterarte de lo más nuevo y emocionante. ¡Es fácil y gratis! 😎📬
×

Suscríbete a nuestro boletín.


Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *