Salut à tous,
Après avoir écumé les internets à la recherche d'une solution à mon problème, je fais appel à la communauté : SAIT-ON JAMAIS.
Merci, avant de répondre,
d'avoir lu ce qui suit pour bien comprendre ce qui a déjà été tenté.
Le problème :
Aléatoirement (au moins en apparence), et quelque soit le nombre de joueurs connectés, un "lag" gigantesque (montée en escalier de la barre inférieure du netgraph) empêche tous les joueurs d'interagir pendant 1 à 3 secondes je dirais.
Le serveur :
Matos + Distrib
Dedibox QC DELL
Modèle: DELL® PowerEdge R210
Processeur: 1x Intel® Xeon® X3450
Architecture: 4x 2.66GHz, 64 Bits, Virtualisation
RAM: 8 Go DDR3 ECC
Disque dur: 2 x 1 To SATA2 RAID
RAID: Matériel, Dell PERC H200, (Raid 0/1)
Ubuntu 12.04.4 LTS
Services actifs
- UN serveur UrT
- Un serveur Mumble
- 5-6 sites à trafic faible, chacun reposant sur du classique MySQL + PHP
- Même pas de service mail (Google Apps power)
- UFW, bloquant pas mal de tentatives d'accès
- Pas grand chose de plus...
Manip initiales pour déterminer l'origine du problème
- Vérification de l'usage CPU : Un petit htop pendant les sessions permet de constater une montée d'usage à 50+% de certains coeurs... mais rien d'alarmant a priori. A VOIR.
- Vérification de l'usage RAM : Aucun dépassement de 1Go de ram. Pas de problème ici donc a priori.
- Vérification du Swap : Jamais utilisé. Pas de problème ici donc a priori.
- Vérification des accès disque : Pas de dépassement de quelques centaines de Ko/s
Les solutions envisagées :
Le problème semblant également intervenir sur d'autres jeux (divers tests rapides sur Warsow), j'ai vite isolé un problème issu d'UrT.
Malgré tout... j'ai quand même tenté quelques choses à ce niveau.
Hypothèse problème lié à UrT
- Passage en taskset sur un (ou deux... pour le test) coeurs de mon cher processeur
- Augmentation du com_hunkmegs à 1024
D'où une commande de lancement UrT comme ça :
screen -AmdS urbanterror taskset -c 6,7 UrbanTerror42/Quake3-UrT-Ded.x86_64 + set dedicated 2 + com_hunkmegs 1024 + set net_port 27960 +exec server.cfg
Résultat : Non concluant, pas de changement
Hypothèse problème lié à Apache
- Test de couper Apache pendant les essais sur le serveur (j'avais constaté quelques erreurs Apache dans les log laissant clairement penser à des tentatives d'attaque, tombant à des moments assez proches des lags, sans conviction)
Résultat : Non concluant, pas de changement
Hypothèse problème lié au Kernel
- Test de mise à jour du Kernel (j'étais encore sur un kernel d'il y a deux ans, passage sur un "v3.9-raring" dans un premier temps - non concluant, puis sur une "3.13.4-031304-lowlatency" au cas où la lowlatency change quelque chose...)
Résultat : Non concluant, pas de changement
Hypothèse problème lié à des paramètres du Kernel
- Modifications du systcl.conf (principalement vm.swappiness, nr_requests, etc)
Résultat : Non concluant, pas de changement
Hypothèse problème lié à des taches CRON
- Arrêt du service CRON le temps de tester.
Résultat : Non concluant, pas de changement
Voilà, si quelqu'un a une idée, je suis preneur
. Merci d'avance !
Sinon il faudra que je vois avec Online parce que je viens au bout de mes hypothèses et... l'option d'une défaillance sur ma Dédibox commence à trotter dans la tête.
|U`u|Zurpateur (2014-*) | |O_o|Rangina (2010-2014) | Un`DeaD (2008-2010) | -Sygn-KuBuS (2007) | UP*Clem (2001-2002)