Genie Envisioner World Simulator toma datos de vídeo para ayudar a controlar robots. 2.0 Fuente: AGIBOT
AGIBOT anunció hoy la liberación de Genie Envisioner 2.0, o GE 2-Sim, que dijo marcó un avance significativo en la evolución de los modelos mundiales, desde los modelos de acción mundial hasta los “ simuladores mundiales totalmente interactivos. ”
El nuevo sistema introduce lo que la compañía describió como un “motor de evolución física” para la IA encarnada. Es un entorno basado en modelos donde los robots pueden ser entrenados, evaluados y optimizados a escala, sin depender únicamente de costosos ensayos y errores del mundo real.
De entender el mundo a aprender dentro de él
En 2025, AGIBOT introdujo lo que afirmó fue el primer modelo mundial impulsado por la industria, Genie Envisioner. La plataforma de código abierto permitió a los robots comprender el mundo a través de modelos integrados de visión, lenguaje y acción, dijo la empresa con sede en Shanghai.
Con Genie Envisioner 2.0, AGIBOT dijo que ha cambiado más el paradigma, de permitir a los robots comprender el mundo y luego permitirles aprender dentro de un mundo generado por los modelos.
La empresa afirmó que esta transición refleja un cambio más amplio en la IA encarnada, de representar al mundo a simular el mundo mismo. A medida que los modelos mundiales evolucionan hacia entornos estables y de alta fidelidad que responden a acciones de manera físicamente coherente, desbloquean la capacidad de formar robots a escala en entornos sintéticos.
AGIBOT dijo que cree GE 2-Sim marca un punto crítico de inflexión hacia el logro de una verdadera ley de escalada en la inteligencia encarnada.
Los modelos de acción mundial pueden mostrar la evolución del estado. Haga clic aquí para ampliar. Fuente: AGIBOT
De modelos de acción mundial a simuladores mundiales
En el núcleo de esta evolución está el desarrollo continuo del marco del modelo de acción mundial (WAM), que amplía los modelos mundiales tradicionales incorporando explícitamente las acciones como variable de primera clase.
En lugar de modelar sólo estado, WAM captura el bucle completo de:
- Estado → Acción → Evolución del Estado
Esto permite que los modelos mundiales sirvan de base para el aprendizaje de políticas y la generación de acciones. A partir de esta fundación, AGIBOT ha desarrollado progresivamente una serie de sistemas:
- EnerVerse: Extende entornos encarnados en un modelo mundial 4D computable
- Genie Envisioner Act (GE-Act): Bridges world representation and action trayectoriactory generation
- Act2Goal: Permite el control a largo plazo, impulsado por objetivos
Si bien estos avances permitieron que los modelos mundiales apoyaran el aprendizaje de políticas, el despliegue en el mundo real exponía limitaciones clave: una alta dependencia de los entornos físicos, una evaluación costosa y limitaciones de escalabilidad de datos.
Esto llevó a una realización fundamental. El próximo avance no está en una representación más fuerte, sino en la transformación de modelos mundiales en simuladores totalmente funcionales.
Hacer que el mundo sea manejable: Hacia una simulación interactiva
Para permitir esta transición, AGIBOT introduce un conjunto de nuevas capacidades que empujan modelos mundiales hacia la simulación interactiva:
- EnerVerse-AC: Presenta un modelado mundial con condiciones de acción para la predicción futura
- Genie Envisioner Sim (GE-Sim):
g) Un simulador neural para la evaluación de políticas cerradas
Al mismo tiempo, AGIBOT establece un nuevo paradigma de datos y formación:
- Real2Edit2Real: Los datos del mundo real se vuelven editables y extensibles, aumentando significativamente la escala y la diversidad
- Fidelity-Aware Data Composition: Combina datos reales y generados para equilibrar el realismo y la generalización
Juntos, estos avances transforman los modelos mundiales de los sistemas de representación en la infraestructura a nivel ambiental.
Un simulador mundial puede hacer la simulación más interactiva y productiva. Haga clic aquí para ampliar. Fuente: AGIBOT
Genie Envisioner 2.0: Un motor de evolución física ’
Genie Envisioner 2.0 representa la culminación de esta evolución, un sistema que ya no es sólo generativo, sino operativo. Las capacidades clave incluyen:
Dinámica mundial impulsada por la acción
El sistema responde directamente a acciones de robot, generando cambios ambientales de alta fidelidad que siguen limitaciones físicas y semánticas. El mundo se convierte en un proceso formado por la interacción, en lugar de una representación estática.
Modelo temporal largo-horizon
Soporta simulación estable de nivel minuto, permitiendo la generación continua de secuencias de tareas completas en lugar de clips fragmentados.
Congruencia espacial simulada
Unifica la percepción multivista, la consistencia en 3D y la propriocepción robótica en una sola representación, transformando la percepción de las imágenes en un mundo encarnado totalmente interactivo.
Evaluación integrada y modelo de recompensa
Un modelo de recompensa general nativo permite la autoevaluación y optimización basada en la retroalimentación textual, apoyando el aprendizaje de refuerzo en el modelo mundial sin recompensas diseñadas por humanos.
Hacia una interacción en tiempo real
Con una mayor eficiencia de la inferencia, GE 2-Sim se acerca a la operación en tiempo real, lo que permite:
- Eval en el modelo mundial
- RL en el modelo mundial
- Teleoperación en el modelo mundial
Esto marca la transición de modelos mundiales de herramientas offline a entornos de sistemas interactivos.
El motor de simulación central puede proporcionar datos para alimentar la IA. Haga clic aquí para ampliar. Fuente: AGIBOT
Un cambio de paradigma: Cuando los modelos se convierten en mundos
A medida que estas capacidades convergen, la IA encarnada está experimentando una transformación fundamental, desde “utilizando modelos para comprender el mundo” hasta “aprender y tomar decisiones dentro de mundos generados por modelos. ”
Por un lado, la integración de los modelos WAM y de acción en lenguaje de visión (VLA) permite un cambio de control reactivo a la toma de decisiones generativa y predictiva.
Por otro lado, los simuladores mundiales permiten a los robots explorar, iterar y optimizar a escala, ya no limitados por la disponibilidad de datos en el mundo real, sino por la fidelidad de la simulación misma.
Cuando estas dos trayectorias convergen, los robots van más allá de reproducir manifestaciones humanas para explorar, adaptar y evolucionar continuamente dentro de entornos generados por modelos.
Hacia una nueva base para la inteligencia encarnada
AGIBOT prevé modelos mundiales evolucionando desde herramientas para el entendimiento, a plataformas para el aprendizaje, y en última instancia a infrastructu
re que impulsa la evolución continua.
Cuando los modelos se convierten en mundos, la realidad ya no es el único campo de entrenamiento. Cuando se pueden construir mundos, el aprendizaje se puede escalar. Y cuando la evolución sucede dentro de los modelos, los límites de la IA encarnada pueden ser fundamentalmente redefinidos.
Nota del editor:En la 2026 Cumbre de Robotics " Expo los días 27 y 28 de mayo en Boston, habrá sesiones sobre IA encarnada y física. La inscripción está abierta.
El post AGIBOT revela Genie Envisioner 2.0 para avanzar modelos mundiales en simuladores escalables para la IA encarnada apareció primero en The Robot Report.
Fuente: The Robot Report
Seguí las últimas noticias de robótica en español.

