Surveiller les bons indicateurs permet de détecter les problèmes avant qu'ils n'impactent vos utilisateurs. Voici les KPIs indispensables et comment les configurer.
Le processeur est souvent le premier goulot d'étranglement. Une utilisation CPU trop élevée ralentit toutes les opérations.
Normal
< 70%
Attention
70-85%
Critique
> 85%
À surveiller aussi : Load average (1, 5, 15 min), I/O wait, steal time (VM)
Le manque de RAM force le système à utiliser le swap (disque), ce qui dégrade fortement les performances.
Normal
< 80%
Attention
80-90%
Critique
> 90% ou swap actif
À surveiller aussi : Swap usage, OOM killer events, cache/buffers
Un disque plein peut bloquer complètement un serveur. Les bases de données et les logs sont les premiers coupables.
Normal
< 70%
Attention
70-85%
Critique
> 85%
À surveiller aussi : Inodes, I/O latency, SMART status (disques physiques)
La bande passante et la latence réseau impactent directement l'expérience utilisateur.
La métrique la plus importante : votre serveur répond-il aux requêtes ?
Checks à configurer :
Vérifiez que vos services critiques tournent et répondent correctement.
Serveur web
Apache/Nginx : processus, workers, connexions
Base de données
MySQL/PostgreSQL : connexions, queries/s, slow queries
PHP-FPM
Workers actifs, queue, temps de traitement
Cache
Redis/Memcached : hit ratio, mémoire utilisée
Une sauvegarde qui n'est pas vérifiée n'existe pas. Monitorez vos backups.
Détectez les tentatives d'intrusion et les comportements anormaux.
Trop d'alertes tue l'alerte. Si votre équipe reçoit 100 notifications par jour, elle ne regardera plus. Configurez des seuils réalistes et regroupez les alertes similaires.
Un pic de CPU de 3 secondes n'est pas un problème. Configurez des alertes qui se déclenchent uniquement si le seuil est dépassé pendant X minutes.
Distinguez les alertes critiques (SMS/appel) des alertes informatives (email). Le serveur web down = appel immédiat. Disque à 75% = email pour action sous 24h.
Notre forfait à 150€/mois inclut le monitoring 24/7 de tous ces KPIs, avec alerting intelligent et intervention en cas d'incident.
Demander un devis