Question d’entretien chez Oracle

Describe 3 different optimisations applied to LLM inference.

Réponse à la question d'entretien

Utilisateur anonyme

7 juil. 2025

KV caching, speculative decoding, operator fusion