Chutes.ai
Chutes também oferece planos a partir de US$ 3. Com o Chutes você tem acesso a muitos mais modelos. Seu desempenho é desanimador. Eu recomendaria Chutes em vez de Z.ai só porque você pode usar mais modelos, mas esse é o único motivo. A sua política de privacidade é ambígua. Tive problemas para me inscrever; basicamente, a autenticação com Google ou GitHub não está funcionando no momento. Com base na recomendação de outro usuário do Discord, usei uma VPN e criei uma conta sem usar o Google ou GitHub, e funcionou.
Sintético
Synthetic oferece um plano de US$ 20 por mês que inclui GLM-4.6, Qwen3-480B, Kimi K2, DeepSeek-V3.1 e muitos outros modelos. O Synthetic é relativamente novo e tem sido super aberto e envolvente no Discord. Eles têm uma política de privacidade muito clara: não armazenam suas solicitações ou conclusões por mais de 14 dias sem o seu consentimento. Observe que há problemas como chamadas de ferramentas suspensas (também conhecidas como buffer) por um longo tempo e, ocasionalmente, vazamento de chamadas de ferramentas nativas ou chamadas de ferramentas no fluxo de mensagens, em vez de chamadas adequadas compatíveis com OpenAI. Você pode usar uma CLI como LLxprt Code ou Code Puppy, ou um IDE como Roo Code, que oferece suporte a endpoints OpenAI. A Synthetic também está desenvolvendo seu próprio agente de codificação chamado Octofriend.
Cérebros
Os planos da Cerebras começam em US$ 50. Eu rasguei um novo para eles em minha última coluna, mas eles melhoraram muito seu TPM geral (tokens por minuto) e limites de solicitação. Cerebras é agora o fornecedor mais rápido, sem exceção. Suas políticas observam explicitamente que eles não usam seus prompts. Cerebras é o Qwen3-Coder-480B mais rápido que você pode acessar. Embora o modelo Qwen3 suporte contexto de 256K, a versão Cerebras é limitada a 131K. Achei isso utilizável, mas desafiador. No entanto, ainda tenho uma assinatura em meu kit de ferramentas porque é o acesso mais rápido a um dos melhores modelos abertos do mercado. Cerebras tem um nível gratuito, mas mal é suficiente para testes de conexão.
