A inteligência artificial esconde mais complexidade do que qualquer onda tecnológica anterior. Escrever código, conectar APIs e dimensionar a infraestrutura agora parece fácil, mas essa facilidade esconde uma camada crescente de decisões invisíveis abaixo da superfície. Os problemas difíceis subiram para o julgamento, a coordenação e o pensamento sistêmico.
A postagem de 2023 de Shawn “Swyx” Wang é amplamente creditada por definir o novo conceito de “engenheiro de IA” como alguém que aplica efetivamente modelos básicos por meio de APIs ou ferramentas de código aberto para construir, avaliar e produzir sistemas de IA, em vez de treiná-los.
Como a visão do engenheiro de IA foi comprovada, cada nova camada de abstração continua afastando os engenheiros dos primitivos da programação e dos aspectos internos da estrutura. Como resultado, estão a surgir novos tipos de competências ocultas, adequadas a um mundo onde grandes modelos de linguagem (LLMs), e não humanos, geram o primeiro rascunho do nosso software.
Avaliação é o novo IC
A integração contínua (CI) já definiu uma boa higiene de engenharia. Hoje, a mesma disciplina de medição, teste e automação tornou-se essencial para os sistemas de IA.
Jeff Boudier, líder de produto e crescimento da Hugging Face, a plataforma de código aberto que sustenta grande parte do ecossistema atual de compartilhamento e avaliação de modelos, descreve essa mudança como o próximo grande padrão na prática de software. “A avaliação é o novo IC”, disse ele ao InfoWorld. “A verdadeira vantagem da engenharia não é escolher o modelo certo, mas construir sistemas que possam medi-los, testá-los e trocá-los continuamente.”
Hugging Face construiu sua plataforma em torno desse princípio. Sua biblioteca Evaluate padroniza o processo de avaliação de modelos em centenas de tarefas, enquanto o AI Sheets fornece uma interface sem código para comparar modelos em conjuntos de dados personalizados. Os desenvolvedores podem executar fluxos de trabalho de avaliação em GPUs sob demanda por meio do Hugging Face Jobs e acompanhar o progresso em tabelas de classificação abertas que comparam milhares de modelos em tempo real. Juntas, essas ferramentas transformam a avaliação em uma disciplina contínua de engenharia. “O músculo mais importante que as empresas precisam construir”, disse Boudier, “é a capacidade de criar seus próprios conjuntos de dados de avaliação com perguntas relevantes e boas respostas que reflitam como seus clientes realmente falam”.
Especialistas da academia e da indústria concordam que este foco na avaliação irá remodelar o desenvolvimento de software. No Podcast de Lenny, Hamel Husain, consultor do Parlance Labs, chamou as avaliações de “uma forma sistemática de analisar seus dados LLM, criar métricas e iterar para melhorar”. No mesmo podcast, Shreya Shankar, pesquisadora PhD na UC Berkeley, observou que as avaliações fornecem “um grande espectro de maneiras de medir a qualidade do aplicativo”, desde a verificação da funcionalidade principal até a avaliação de como os sistemas respondem ao comportamento ambíguo ou inesperado do usuário. O engenheiro Shaw Talebi descreveu o impacto em uma postagem no X: “Construir sistemas LLM parecia mais orar aos deuses da IA do que engenharia. Mas tudo mudou quando aprendi sobre o desenvolvimento orientado à avaliação”.
O que o teste foi para o software, a avaliação está se tornando para a IA. É o processo que transforma a imprevisibilidade do modelo em algo que os engenheiros podem compreender e controlar.
Adaptabilidade como princípio central do design
Se a avaliação define qualidade, a adaptabilidade define a longevidade. Mas adaptabilidade na era da IA significa algo muito diferente de aprender novas estruturas ou linguagens. Agora significa projetar sistemas que possam sobreviver às mudanças semanalmente ou mesmo diariamente.
“Ainda estamos numa fase em que a investigação avança mais rapidamente do que os engenheiros”, disse Boudier. “Toda semana no Hugging Face há um novo modelo entre os cinco primeiros. Não se trata de qual você escolhe, mas de construir tecnologia que permite trocar sem dor quando um melhor aparece.”
As gerações anteriores de engenheiros adaptaram-se às mudanças de hardware ou aos longos ciclos de produtos. Os engenheiros de IA se adaptam a uma fronteira em movimento. APIs de modelo, janelas de contexto, preços de inferência e benchmarks de desempenho podem mudar em um mês. O desafio não é aprender uma ferramenta, mas construir processos que absorvam interrupções contínuas.
Barun Singh, diretor de produtos da Andela, um mercado global de talentos que conecta empresas com engenheiros de software remotos e outros tecnólogos de mercados emergentes, acredita que esta é a habilidade que define a década. “Em muitos aspectos, todo o trabalho do conhecimento está passando por essa mudança massiva, mas a engenharia de software está passando primeiro pela maior mudança”, disse ele ao InfoWorld. “As ferramentas de IA podem acelerar sua compreensão ou criar uma falsa sensação de produtividade com uma enorme dívida.”
Singh vê a adaptabilidade como técnica e cognitiva. “Quanto mais você consegue pensar em alto nível e no nível básico simultaneamente, mais avançado você é”, disse ele. “A pessoa que tem um profundo conhecimento da arquitetura clássica e experiência real com LLMs em produção é a contratação mais difícil no momento.” Singh também destaca a necessidade de limites como marca de maturidade profissional. “Criar limites para o seu trabalho na forma de testes, para que você detecte erros antes que eles cheguem à produção, torna-se ainda mais importante na era da IA.” Nesse sentido, adaptabilidade não significa perseguir novidades. Trata-se de projetar sistemas e fluxos de trabalho que possam acomodá-lo com segurança.
De-risking como uma disciplina de engenharia
A terceira habilidade que molda a engenharia de IA é a redução de riscos. Os engenheiros agora precisam pensar como responsáveis pela conformidade, garantindo que as fontes de dados, os modelos e os pipelines possam resistir ao escrutínio.
Michelle Lee, conselheira geral residente da Wilson Sonsini, disse ao InfoWorld que os engenheiros devem assumir a responsabilidade por essas questões. “Eles estão muito mais próximos das considerações de dados e de arquitetura”, disse ela. Lee observou que os reguladores em todo o mundo já estão perguntando quem é o responsável quando os sistemas de IA causam danos e que a transparência sobre os dados de treinamento e o comportamento do modelo está se tornando um requisito de engenharia.
Na AI Conference 2025, realizada em São Francisco em outubro, Jessica Li Gebert, consultora de monetização de dados da Neudata, descreveu isso como um risco e uma oportunidade. Ela chamou os dados empresariais de “um tesouro”, mas alertou que muitas empresas não têm ideia de como passar do reconhecimento desse valor para a sua concretização. “Há uma enorme lacuna de conhecimento”, disse ela, “entre acreditar que seus dados têm valor e realmente entender como desbloqueá-los com segurança”. Engenheiros que possam construir governança e controles de linhagem serão fundamentais para preencher essa lacuna.
Michael Hejtmanek, colega de Gebert e vice-presidente de soluções corporativas da Neudata, acrescentou que a maioria das empresas ainda vê o compartilhamento de dados com desenvolvedores de IA como “um perigo ou risco intransponível”. Engenheiros fluentes em sistemas de dados e gerenciamento de riscos se tornarão essenciais para a adoção da IA.
Projetando o que os modelos não conseguem
Nas últimas duas décadas, as empresas competiram por talentos de desenvolvimento, aperfeiçoando a ergonomia da criação de software: pipelines de integração contínua, plataformas em nuvem e fluxos de trabalho colaborativos que tornaram o código mais testável, reproduzível e observável. A próxima fase dessa competição dependerá dos sistemas que tragam o mesmo rigor à IA.
Os engenheiros que constroem ciclos de avaliação, registos de modelos e quadros de governação não estão apenas a acompanhar o ritmo da inovação. Eles estão definindo como a inteligência é integrada aos aplicativos e fluxos de trabalho empresariais. Da mesma forma que a CI trouxe mais confiabilidade, previsibilidade e segurança ao desenvolvimento de software, esses novos sistemas tornarão o comportamento do modelo mensurável, melhorável e responsável.
