Lemonade, criado pela AMD, é um aplicativo de servidor mais GUI para executar modelos locais de IA, semelhante a projetos como LM Studio (ou, mais distante, ComfyUI). O que falta em configurabilidade, ele tenta compensar com uma integração mais ampla com aplicativos de terceiros que usam APIs padrão e com suporte para tempos de execução que não sejam da NVIDIA.

Lemonade funciona com uma variedade de tempos de execução e mecanismos de back-end. Ele suporta GPUs AMD, NPUs Ryzen, Vulkan e execução de CPU (embora não para todas as tarefas), junto com o llamacpp, whispercpp, sd-cpp, kokoro, ryzenai-llm e flm extremidades traseiras. Além de fornecer seu próprio conjunto de APIs, a Lemonade interopera com um amplo conjunto de padrões do setor, incluindo OpenAI, Ollama, Anthropic e llama.cpp. Os modelos GGUF e ONNX são suportados.