“Essa ideia não é nova e Snowflake certamente não é o primeiro a ilustrar seu valor, é claro. A SAP, por exemplo, introduziu esta ideia com o seu plug-in de modelo, Finch, no início de 2024”, disse Bradley Shimmin, analista-chefe da Omdia.
No entanto, apesar das alegações de Snowflake de perda mínima de precisão dos LLMs otimizados para SwiftKV, Shimmin alertou que poderia haver compensações em termos de quão complexos eles são para implementar, o quanto eles degradam a capacidade e quão compatíveis são com a arquitetura de inferência subjacente.
“Métodos como a quantização são muito populares porque não impõem tantas compensações. Portanto, se os clientes acharem que esta técnica do Snowflake tem valor semelhante, imagino que eles a usarão talvez até mesmo junto com outras técnicas, conforme exigido por qualquer projeto que tenham em mãos”, explicou Shimmin.