En tales problemas de aprendizaje y planificación de la sincronización, los agentes Debe seleccionar sus operaciones dentro de un tiempo limitado, mientras solo detecta partes del entorno centradas en la ubicación actual del agente.
El agente de búsqueda heurística en tiempo real utiliza las siguientes acciones para seleccionar acciones Búsqueda limitada prospectiva y evaluación del estado límite con funciones heurísticas.
A través de la experiencia repetida, refinaron el valor heurístico del estado para evitar bucles infinitos y converger a Una mejor solución.