J'ai passé un entretien chez Deutsche Telekom (München, Bavaria)
Entretien
Mehrere Runden mit einem Recruiter die sehr angenehm aus anderen Bereichen und sogar flexibel das Interview gerescheduled haben. Dann 2 Personen im Tech Interview mit spezifischen technischen ML Fragen. Kamein ein bisschen zu spät, aber Pünktlichkeit scheint generell bei Bewerbungen (zumindest von Firmen Seite aus nicht mehr so wichtig zu sein). Gingen aber eher wenig auf evtl. übertragbare bisherige Erfahrung und Fähigkeiten aus anderen Bereichen ein.
Questions d'entretien [1]
Question 1
How do you scale a LLM microservice if it has 10min cold start up time?
How to load balance LLM service?
How to scale up high servicec load?
Whats the difference between ... and rerank?
Explain why and how NN activation maps in consume GPU memory.
Explain activation functions and its function in FFNs.
What is LORA?
How do you decrease model size (Quantization, etc)?
How do you decide to shift to more complex model architecture (how do you evaluate that the simpler model reached its max capability)?
More questions I don't remember