Haute disponibilité
Cette page est destinée à fournir des conseils et des retours d’exéprience sur les configurations haute disponibilité (ou HA - High Availability) de bots et plateformes Tock.
A venir : plus de détails sur les manières d’obtenir une haute disponibilité sur les différents composants Tock, et des retours sur notre utilisation en production depuis plusieurs années (cf vitrine / utilisateurs).
Redondance et résilience
Une seule instance de tock/build_worker
doit exister.
Il est recommandé d’utiliser une seule instance de tock/bot_admin
et tock/kotlin_compiler
.
Pour les autres composants, en particulier le composant bot (non fourni) mais également tock/nlp_api
et
tock/duckling
, il est recommandé de déployer plusieurs instances pour assurer une meilleure disponibilité
voire de meilleures performances.
Performance
Comme indiqué dans la section installation, le premier paramètre à surveiller est la mémoire disponible.
A forte charge - nous avons expérimenté plus de 80 req/s sur nos propres bots - le facteur limitant devient la base de données MongoDB, qu’il faut alors redimensionner en conséquence quand le besoin s’en fait sentir.