"Lag" / montée collective de ping pendant X secondes

Tout ce qui concerne la configuration et l'administration des serveurs.
Rendez-vous dans Outils de communication & communautaires pour la conception de sites Internet.
Répondre
KuBuS
Messages : 1050
Enregistré le : 05 févr. 2008, 02:12
Localisation : Saint-Cloud

"Lag" / montée collective de ping pendant X secondes

Message par KuBuS » 23 févr. 2014, 14:34

Salut à tous,

Après avoir écumé les internets à la recherche d'une solution à mon problème, je fais appel à la communauté : SAIT-ON JAMAIS.

Merci, avant de répondre, d'avoir lu ce qui suit pour bien comprendre ce qui a déjà été tenté.

Le problème :
Aléatoirement (au moins en apparence), et quelque soit le nombre de joueurs connectés, un "lag" gigantesque (montée en escalier de la barre inférieure du netgraph) empêche tous les joueurs d'interagir pendant 1 à 3 secondes je dirais.

Le serveur :

Matos + Distrib

Dedibox QC DELL
Modèle: DELL® PowerEdge R210
Processeur: 1x Intel® Xeon® X3450
Architecture: 4x 2.66GHz, 64 Bits, Virtualisation
RAM: 8 Go DDR3 ECC
Disque dur: 2 x 1 To SATA2 RAID
RAID: Matériel, Dell PERC H200, (Raid 0/1)
Ubuntu 12.04.4 LTS

Services actifs

- UN serveur UrT
- Un serveur Mumble
- 5-6 sites à trafic faible, chacun reposant sur du classique MySQL + PHP
- Même pas de service mail (Google Apps power)
- UFW, bloquant pas mal de tentatives d'accès
- Pas grand chose de plus...

Manip initiales pour déterminer l'origine du problème
- Vérification de l'usage CPU : Un petit htop pendant les sessions permet de constater une montée d'usage à 50+% de certains coeurs... mais rien d'alarmant a priori. A VOIR.
- Vérification de l'usage RAM : Aucun dépassement de 1Go de ram. Pas de problème ici donc a priori.
- Vérification du Swap : Jamais utilisé. Pas de problème ici donc a priori.
- Vérification des accès disque : Pas de dépassement de quelques centaines de Ko/s

Les solutions envisagées :

Le problème semblant également intervenir sur d'autres jeux (divers tests rapides sur Warsow), j'ai vite isolé un problème issu d'UrT.
Malgré tout... j'ai quand même tenté quelques choses à ce niveau.

Hypothèse problème lié à UrT
- Passage en taskset sur un (ou deux... pour le test) coeurs de mon cher processeur
- Augmentation du com_hunkmegs à 1024

D'où une commande de lancement UrT comme ça :
screen -AmdS urbanterror taskset -c 6,7 UrbanTerror42/Quake3-UrT-Ded.x86_64 + set dedicated 2 + com_hunkmegs 1024 + set net_port 27960 +exec server.cfg

Résultat : Non concluant, pas de changement

Hypothèse problème lié à Apache
- Test de couper Apache pendant les essais sur le serveur (j'avais constaté quelques erreurs Apache dans les log laissant clairement penser à des tentatives d'attaque, tombant à des moments assez proches des lags, sans conviction)

Résultat : Non concluant, pas de changement

Hypothèse problème lié au Kernel
- Test de mise à jour du Kernel (j'étais encore sur un kernel d'il y a deux ans, passage sur un "v3.9-raring" dans un premier temps - non concluant, puis sur une "3.13.4-031304-lowlatency" au cas où la lowlatency change quelque chose...)

Résultat : Non concluant, pas de changement

Hypothèse problème lié à des paramètres du Kernel
- Modifications du systcl.conf (principalement vm.swappiness, nr_requests, etc)

Résultat : Non concluant, pas de changement

Hypothèse problème lié à des taches CRON
- Arrêt du service CRON le temps de tester.

Résultat : Non concluant, pas de changement

Voilà, si quelqu'un a une idée, je suis preneur :). Merci d'avance !
Sinon il faudra que je vois avec Online parce que je viens au bout de mes hypothèses et... l'option d'une défaillance sur ma Dédibox commence à trotter dans la tête.
|U`u|Zurpateur (2014-*) | |O_o|Rangina (2010-2014) | Un`DeaD (2008-2010) | -Sygn-KuBuS (2007) | UP*Clem (2001-2002)

Avatar du membre
Blapecool
Conseil d'Administration
Conseil d'Administration
Messages : 1504
Enregistré le : 19 mars 2009, 17:10
Localisation : Sur la Terre

Re: "Lag" / montée collective de ping pendant X secondes

Message par Blapecool » 23 févr. 2014, 16:29

Quelques questions en vrac :

Tu utilises le binaire 64 ou 32 bits ? Tu utilises probablement le binaire 64bits. Si oui, bascule sur le binaire 32bits.
Tu restart tes serveurs de manière régulière ? (ie: tout les jours)
Les lags se passent à un moment précis (fin de round, capture, kill....) ?

KuBuS
Messages : 1050
Enregistré le : 05 févr. 2008, 02:12
Localisation : Saint-Cloud

Re: "Lag" / montée collective de ping pendant X secondes

Message par KuBuS » 23 févr. 2014, 16:52

64 bits.
Hum, basculer sur le binaire 32 bits va nécessiter une réinstall de tout ? :)
Pour les tests, les reboot (du serveur physique) ont été nombreux, donc visiblement pas lié !
Pas de logique dans les lags (à l'instant en cours de dernier round mais sans logique apparente).
Ah, par contre ça me fait penser : je pourrais tester de désactiver l'enregistrement des logs... qui sait.
|U`u|Zurpateur (2014-*) | |O_o|Rangina (2010-2014) | Un`DeaD (2008-2010) | -Sygn-KuBuS (2007) | UP*Clem (2001-2002)

Avatar du membre
Blapecool
Conseil d'Administration
Conseil d'Administration
Messages : 1504
Enregistré le : 19 mars 2009, 17:10
Localisation : Sur la Terre

Re: "Lag" / montée collective de ping pendant X secondes

Message par Blapecool » 23 févr. 2014, 17:14

Non, tu installe juste les libs de compatibilié 32bits ("sudo apt-get install ia32-libs" si mes souvenirs sont bons)
Tu pourra lancer le serv avec les binaires 32bits. Je te conseille vivement de les utiliser. Chez les GH on les utilise à place des binaires 64bits car ils causent des lags. Et ça doit sûrement venir de là aussi pour toi.

Pour les logs, c'est pas un soucis normalement. Celà dit, si tu as peur, tu peux les faire écrire dans un tmpfs :p

KuBuS
Messages : 1050
Enregistré le : 05 févr. 2008, 02:12
Localisation : Saint-Cloud

Re: "Lag" / montée collective de ping pendant X secondes

Message par KuBuS » 23 févr. 2014, 20:02

EH MAIS CA A L'AIR DE MARCHER.
J'aurais jamais cru que faire tourner un jeu en mode compatibilité 32bit sur un serveur 64bit alors même qu'une version 64bit existait pouvait mieux fonctionner...

Bon, bah on verra ce que ça donne mais merci bien, ça m'aura en tout cas permis d'optimiser un peu d'autres points du serveur :).
|U`u|Zurpateur (2014-*) | |O_o|Rangina (2010-2014) | Un`DeaD (2008-2010) | -Sygn-KuBuS (2007) | UP*Clem (2001-2002)

KuBuS
Messages : 1050
Enregistré le : 05 févr. 2008, 02:12
Localisation : Saint-Cloud

Re: "Lag" / montée collective de ping pendant X secondes

Message par KuBuS » 23 févr. 2014, 20:51

L'espoir aura été vain.

Re le "lag en en escalier" une fois sur deux maps d'affilée :(.
|U`u|Zurpateur (2014-*) | |O_o|Rangina (2010-2014) | Un`DeaD (2008-2010) | -Sygn-KuBuS (2007) | UP*Clem (2001-2002)

Avatar du membre
Blapecool
Conseil d'Administration
Conseil d'Administration
Messages : 1504
Enregistré le : 19 mars 2009, 17:10
Localisation : Sur la Terre

Re: "Lag" / montée collective de ping pendant X secondes

Message par Blapecool » 25 févr. 2014, 17:42

Ta commande de démarrage est toujours ?

Code : Tout sélectionner

screen -AmdS urbanterror taskset -c 6,7 UrbanTerror42/Quake3-UrT-Ded.i386 + set dedicated 2 + com_hunkmegs 1024 + set net_port 27960 +exec server.cfg
Tu as essayé sans taskset avec le binaire 32bits ?

KuBuS
Messages : 1050
Enregistré le : 05 févr. 2008, 02:12
Localisation : Saint-Cloud

Re: "Lag" / montée collective de ping pendant X secondes

Message par KuBuS » 25 févr. 2014, 19:20

J'ai surtout fait un SMART depuis et constaté des erreurs en lecture sur mon disque dur.

Un ticket est ouvert chez Online/Dedibox.

Merci en tout cas :).
|U`u|Zurpateur (2014-*) | |O_o|Rangina (2010-2014) | Un`DeaD (2008-2010) | -Sygn-KuBuS (2007) | UP*Clem (2001-2002)

Répondre