- O módulo de percepção. Esta seção pega informações sensoriais brutas, como imagens, vídeo e propriocepção, e as codifica em uma representação latente compacta do ambiente.
- O módulo de previsão. Este é um modelo dinâmico que lida com a distribuição de probabilidade e captura a causalidade e a estrutura temporal. Prevê probabilisticamente o próximo estado latente e os resultados esperados de quaisquer ações.
- O módulo de planejamento (controle). Este módulo utiliza o resultado do modelo de previsão para simular trajetórias futuras e selecionar ações que otimizem as conquistas em direção a uma meta.
“Em sua essência, um modelo mundial é uma representação interna que um sistema de IA constrói para simular o ambiente externo. Ao processar continuamente dados sensoriais, um robô constrói um projeto dinâmico de seu entorno”, explica o fundador da Aurorain, Luhui Hu. “Esta fusão de percepção, previsão e planejamento reflete os processos cognitivos em humanos, preparando o terreno para um comportamento robótico mais avançado.”
Modelos mundiais abrem imensas possibilidades
Parece não haver quase limites para o potencial de espera nos modelos mundiais, mesmo que deixemos de lado as aspirações da AGI por enquanto. Aqui estão apenas algumas das muitas maneiras pelas quais os modelos mundiais podem impactar nossas vidas.
Experiências visuais envolventes
Com os modelos de mundo, está finalmente se tornando possível construir mundos convincentes com os quais você pode interagir e experimentar. Estas são as primeiras capacidades que estão disponíveis, graças a modelos como os desenvolvidos pela Decart, que podem até ser usados como simulações jogáveis e sem motor de jogo.
