Ao incorporar-se diretamente no pipeline de desenvolvimento, o Aardvark pretende transformar a segurança de uma preocupação pós-desenvolvimento em uma proteção contínua que evolui com o próprio software, acrescentou Jain.

Da semântica do código aos patches validados

O que torna o Aardvark único, observou a OpenAI, é sua combinação de raciocínio, automação e verificação. Em vez de simplesmente destacar vulnerabilidades potenciais, o agente promete uma análise em vários estágios – começando pelo mapeamento de um repositório inteiro e construindo um modelo de ameaça contextual em torno dele. A partir daí, monitoriza continuamente novos commits, verificando se cada alteração introduz riscos ou viola padrões de segurança existentes.

Além disso, ao identificar um problema potencial, o Aardvark tenta validar a explorabilidade da descoberta em um ambiente de área restrita antes de sinalizá-la.