Site Reliability Engineer (SRE) (Cloud / Linux)

Regular (CDI) - France
Nous recherchons un ou une Site Reliability Engineer (SRE) (Cloud / Linux) pour rejoindre notre équipe infra. Ton expérience et ta maîtrise technique te permettront de trouver toutes les root causes complexes des problèmes en production et de faire les bons choix pour permettre à Doctolib de scaler. Tu seras responsable de l'amélioration constante de la fiabilité de notre service utilisé quotidiennement par des milliers de professionnels de santé en France et en Europe.

Les enjeux
 
- Travailler sur un service web hautement disponible et à forte charge
- Faire évoluer une plateforme fortement automatisée
- Anticiper les impacts d'une très forte croissance sur l'infrastructure (plus de 30 millions de visites mensuelles - X3 en un an)
 
Les missions :
 
- Maintien en condition opérationnelle de la plateforme
- Évolution et management de l’infrastructure (Infrastructure As Code)
- Suivi de production (capacity planning, gestion des incidents)
- Migration vers du full cloud
- 30% du temps est dévoué au run, et les autres 70% restants seront alloués au développement de nouveaux produits et features, l'automatisation, le scaling, la création de documentation et la réflexion stratégique

Le profil recherché :
 
- Expérience similaire de 10 ans minimum dans un environnement de production Linux haute disponibilité
- Maitrise de l'administration système Linux
- Expertise réseau en environnement Linux
- Expérience avec Kubernetes
- Connaissance du cloud idéalement de type AWS, sinon GCP ou Azure
- Maitrise des méthodes de load balancing (idéalement avec HAProxy)
- Maitrise des méthodes de gestion de cluster et failover automatique
- Grosse expérience de serveur web (idéalement avec Nginx)
- Maitrise des technologies de virtualisation (idéalement KVM)
- Maitrise des méthodes de supervision : métrologie / alerting (de préférence Datadog), analyse de log (stack ELK)
- Bonne connaissance d’un outil de configuration management (de préférence Chef)
- Bonne connaissance d'un langage de scripting (de préférence Ruby)
- Bilingue anglais-français professionnel
 
Ce que nous t’offrons : 

- Une équipe de 900 passionnés avec qui construire un projet et grandir
- Une couverture santé au top, bien sûr !
- Team buildings : des DoctoParties, DoctoMonthly Meetings, DoctoWeekends..
- Une offre de restauration et de sport complète et variée
- La chance participer à l'évolution de tout un secteur !!

Les autres opportunités Engineering