Embora os bots de IA tenham começado a dominar tarefas em navegadores e no Windows, as empresas que usam Mac têm sido amplamente esquecidas até agora. A OpenAI pretende mudar isso com a aquisição da fabricante de interfaces de IA generativa Software Applications Incorporated.
A base dessa integração é o Sky, um assistente generativo baseado em IA e compatível com entrada de linguagem natural para macOS que a startup com sede em São Francisco vem desenvolvendo para ajudar os usuários a automatizar várias tarefas.
“Esteja você conversando, escrevendo, planejando ou codificando, a Sky entende o que está na sua tela e pode agir usando seus aplicativos”, escreveu a startup em seu portal descrevendo a Sky.
Dando controle de IA do sistema operacional
A ideia de automatizar tarefas para usuários de desktop não é totalmente nova. No ano passado, em outubro, a Anthropic se tornou o primeiro fornecedor de LLM a mostrar a possibilidade de controlar um computador ou algumas partes de seu sistema operacional.
Essa capacidade, que a Anthropic chamou de “uso do computador”, permitiu aos desenvolvedores instruir Claude 3.5 Sonnet, por meio da API da Anthropic, a ler e interpretar o que está na tela, digitar texto, mover o cursor, clicar em botões e alternar entre janelas ou aplicativos.
Ela chamou a atenção de especialistas e empresas, pois a capacidade representava um grande avanço em relação às práticas de automação mais tradicionais, como as ferramentas de automação robótica de processos (RPA), que exigiam mais tempo e mão de obra para serem configuradas e, ainda assim, exigiriam manutenção constante.
Outro problema com as ferramentas RPA era que os usuários corporativos ou desenvolvedores teriam que alterar o código ou script conforme a interface do sistema operacional mudasse. Em contraste, a capacidade da Anthropic demonstrou que os LLMs podem entender o que estão vendo, eliminando a necessidade de alterar scripts à medida que as interfaces mudam.
Poucos dias após o anúncio da Anthropic, o Google também entrou na briga do uso de computadores baseados em IA apresentando Jarvis, uma oferta projetada para automatizar tarefas como pesquisa e compras dentro o navegador Chrome com a ajuda do Gemini 2.0 LLM da empresa.
Na mesma época, a OpenAI teria revelado que estava trabalhando em um recurso semelhante desde fevereiro do ano passado.
A aquisição da Sky e sua integração ao ChatGPT, de acordo com Charlie Dai, analista principal da Forrester, é um passo significativo da OpenAI para ganhar uma participação considerável no mercado nascente, porém em evolução, de automação baseada em IA, impulsionado pela IA agêntica.
É provável que a OpenAI comercialize casos de uso que envolvam automatização de fluxos de trabalho em aplicativos, assistência de codificação e integração com ferramentas de colaboração para aumentar a produtividade, disse Dai, acrescentando que a empresa está visando o macOS, pois é popular entre desenvolvedores e profissionais criativos, proporcionando-lhe uma base de clientes considerável.
A integração da Sky ao ChatGPT não é o único produto que a OpenAI possui como parte de sua presença no macOS.
Na semana passada, lançou o ChatGPT Atlas – um navegador com ChatGPT integrado – projetado para automatizar tarefas como reservas diretamente na janela do navegador, ecoando Jarvis do Google.
Espera-se que a OpenAI lance Atlas para Windows, iOS e Android no futuro. A Microsoft, parceira próxima da OpenAI, introduziu recursos semelhantes para Windows por meio do modo Copilot em seu navegador Edge.
