Quando a Anthropic anunciou seus modelos Claude 4, o marketing se concentrou fortemente em recursos aprimorados de raciocínio e codificação. Mas depois de passar meses trabalhando com assistentes de codificação de IA, aprendi que a verdadeira revolução não é sobre gerar melhores trechos de código – trata -se do surgimento de uma agência genuína.
A maioria das discussões sobre os recursos de codificação da IA se concentra restringir -se na correção sintática, no escores de referência ou na capacidade de produzir código de trabalho. Mas meu teste prático do Claude 4 revela algo muito mais significativo: o surgimento de sistemas de IA que podem entender os objetivos de desenvolvimento holisticamente, o trabalho persistentemente em relação às soluções e navegar autonomamente em obstáculos-recursos que transcendem a mera geração de código.
Em vez de confiar em benchmarks sintéticos, decidi avaliar a agência de Claude 4 por meio de uma tarefa de desenvolvimento do mundo real: construindo um plug-in omniFocus funcional que se integra à API do OpenAI. Isso exigiu não apenas escrever código, mas entender a documentação, implementar o tratamento de erros, criando uma experiência coerente do usuário e solucionando problemas – tarefas que exigem iniciativa e persistência além de gerar código sintaticamente válido.
