O lançamento deste fim de semana pelo Baidu de um modelo de fundação multimodal nativo de código aberto chamado Ernie 4.5 e um modelo de raciocínio, Ernie X1, poderia diminuir as barreiras de adoção da IA, intensificar a concorrência e remodelar estratégias de preços em todo o setor, informou um analista na segunda-feira.
Para que isso ocorra, disse Thomas Randall, o líder de pesquisa da IA no Info-Tech Research Group, “o sucesso desses modelos dependerá da validação de desempenho, adoção de desenvolvedores e confiança corporativa.
A gigante da tecnologia chinesa disse em um lançamento que a introdução das duas ofertas “ultrapassa os limites dos modelos multimodais e de raciocínio”, acrescentando que Ernie X1 “apresenta desempenho a par com o Deepseek R1 a apenas metade do preço”.
A Baidu disse que planeja integrar os modelos novos Ernie (representações aprimoradas por meio da integração do conhecimento) em seu ecossistema de produtos e que a integração incluirá a pesquisa do Baidu e outras ofertas.
Além do modelo de raciocínio, o Baidu disse que seu Modelo de Língua de Linguagem de Ernie Bot (LLM) está “sendo libertado ao público antes do cronograma”. Seu plano original era tornar Ernie Bot totalmente livre para usuários individuais a partir de 1º de abril.
Para usuários e desenvolvedores corporativos, dizia -se, o Ernie 4.5 está agora disponível via APIs na plataforma Maas da Baidu Ai Cloud, Qianfan, enquanto o Ernie X1 está programado para estar disponível na plataforma “Soon”.
Jason Andersen, analista da Moor Insights & Strategy, disse: “Embora o preço-desempenho de treinamento do modelo seja uma consideração, não está claro se isso é suficiente para diferenciar um desenvolvedor ou uma empresa”.
Por exemplo, ele disse: “Este modelo, como Deepseek, é de código aberto. Portanto, provavelmente veremos os provedores de hospedagem de IA a captarem ao lado de outros modelos. Uma vez que estiver nos locais de ferramentas da AWS ou do Azure, ele cumprirá a promessa? ”
“Para ser mais específico”, acrescentou, “quais tarefas serão mais adequadas?
De acordo com Randall, o plano de Baidu de Ernie 4.5 “pode acelerar ainda mais a inovação por meio de melhorias orientadas pela comunidade, desafiando o domínio de código fechado do Openai e do Google.
Ele disse: “A competição regional pode se intensificar, com Alibaba, Tencent e Bytedance quase certamente procurando responder investindo mais nessa tecnologia. As empresas ocidentais podem enfrentar novas restrições ou concorrência na China, à medida que as empresas optam por modelos caseiros por razões de conformidade. ”
Baidu disse no comunicado que o Ernie 4.5 alcança o seguinte através do que se refere como habilidades linguísticas refinadas:
- Melhorias na “compreensão, geração, raciocínio e memória, juntamente com aprimoramentos notáveis na prevenção de alucinação, raciocínio lógico e capacidades de codificação”.
- A capacidade de integrar e entender o conteúdo de texto, imagens, áudio e vídeo, além de “superar o GPT-4.5 em vários benchmarks enquanto custa apenas 1% do GPT-4.5”.
O modelo de raciocínio Ernie X1, disse Baidu, suporta “várias ferramentas, incluindo pesquisa avançada, perguntas e respostas sobre documentos, entendimento da imagem, geração de imagens da IA, interpretação de código, leitura da página da web, mapeamento de Treemind, pesquisa acadêmica do Baidu, pesquisa de informações comerciais e pesquisa de informações de franquia.”
O lançamento de ambos ocorre 10 dias depois que a Alibaba Cloud da China lançou QWQ-32B, um modelo de raciocínio compacto construído sobre seu mais recente modelo de grande idioma (LLM) QWEN2.5-32B, que diz o desempenho “comparável a outros grandes modelos de ponta”.