Amazon Web Services ha presentado Strands Labs, una nueva organización de GitHub creada para albergar proyectos experimentales relacionados con el desarrollo de IA basada en agentes. La iniciativa está vinculada al Strands Agents SDK, un conjunto de herramientas de código abierto que permite a los desarrolladores construir agentes de IA utilizando Python o TypeScript.
Strands Labs incluye tres proyectos: Robots, Robots Sim y AI Functions. Cada proyecto explora diferentes aspectos del desarrollo de agentes, desde la integración robótica hasta los flujos de trabajo de generación de código.
El proyecto Strands Robots se centra en conectar agentes de IA con hardware físico. Proporciona una interfaz unificada que permite a los agentes construidos con el marco Strands interactuar con sensores y dispositivos robóticos. En ejemplos de demostración, AWS muestra un agente controlando un brazo robótico SO-101 utilizando el modelo NVIDIA GR00T. GR00T es un modelo de visión-lenguaje-acción (VLA) que toma imágenes de cámara, posiciones de las articulaciones del robot e instrucciones de lenguaje como entrada y genera acciones de las articulaciones como salida.
El proyecto Robots también se integra con LeRobot, un marco abierto diseñado para simplificar la interacción con hardware y conjuntos de datos robóticos. Al combinar las abstracciones de LeRobot con los modelos VLA, los desarrolladores pueden construir agentes que procesen datos visuales, interpreten instrucciones y realicen acciones físicas.
El proyecto Strands Robots Sim proporciona un entorno de simulación para la experimentación robótica. En lugar de utilizar hardware físico, los desarrolladores pueden ejecutar agentes dentro de entornos basados en la física que simulan el comportamiento del robot. El sistema admite entornos del punto de referencia Libero robotics y puede integrar políticas VLA a través de un servicio de inferencia. El simulador recopila observaciones de cámaras y articulaciones de robots y las alimenta a modelos de políticas que producen comandos de motor. El entorno puede grabar las ejecuciones de simulación como video y admite bucles de control iterativos para la depuración o la experimentación.
El tercer proyecto, AI Functions, explora un enfoque diferente para escribir software con agentes de IA. En lugar de implementar una función directamente, los desarrolladores definen el comportamiento deseado utilizando descripciones en lenguaje natural y condiciones de validación escritas en Python. Un decorador llamado @ai_function activa el bucle del agente Strands, que genera código para satisfacer la especificación y valida el resultado utilizando precondiciones y postcondiciones. Si la validación falla, el sistema vuelve a intentarlo automáticamente. El marco puede generar implementaciones que analicen archivos, realicen transformaciones de datos o ejecuten otras tareas mientras devuelven objetos Python estándar como DataFrames de Pandas.
Las reacciones de la comunidad al anuncio se han centrado en la integración robótica y la naturaleza experimental de los proyectos.
Clare Liguori, Ingeniera Principal Senior en AWS, publicó en X:
Pienso en Strands Labs como un patio de recreo para la próxima generación de ideas para el desarrollo de agentes de IA, desde cómo construir robots agentivos hasta cómo hacer que nuestras aplicaciones cotidianas sean más agentivas.
Otros destacaron el experimento AI Functions como un ejemplo del creciente interés en la programación basada en especificaciones, donde los desarrolladores definen el comportamiento y las reglas de validación mientras que los agentes generan el código subyacente.
El Ingeniero de Diseño John Hanacek compartió:
Robots animados por marcos agentivos junto a humanos, compartiendo una capa de percepción y conciencia para coordinar acciones.
AWS declaró que Strands Labs continuará expandiéndose con experimentos adicionales aportados por diferentes equipos de Amazon. La organización está destinada a funcionar como un campo de pruebas para ideas relacionadas con la orquestación de agentes, la integración robótica y el desarrollo de software asistido por agentes antes de que potencialmente se muevan al SDK central de Strands.
