STONITH

Skrót STONITH jest bardzo obrazowym (akronim od Shoot The Other Node In The Head) określeniem bardzo prostej, ale skutecznej techniki zapewniania sobie wyłącznego dostępu do współdzielonych zasobów w obrębie klastra. Najprościej mówiąc, technika ta polega na zdalnym wyłączeniu (lub zrestartowaniu) węzła przez inny węzeł. Niezbyt rozbudowane API biblioteki STONITH pozwala na programowe wyłączanie/resetowanie maszyn wykorzystując plugin'y obsługujące różne urządzenia resetujące implementowane w płytach głównych jak również w zasilaczach awaryjnych UPS. Możliwe jest także działanie polegające na zgłoszeniu potrzeby zresetowania węzła operatorowi i odebraniu od niego potwierdzenia.

Dzięki zastosowaniu STONITH przejmujący usługi węzeł zapasowy może ,,zastrzelić'' niepoprawnie działający węzeł główny, aby mieć pewność, że nie będzie dzielił z nim zasobów (adresu IP, dysku itd.). Jeśli po restarcie węzeł główny jest w stanie wrócić do pełnej funkcjonalności, to w normalny sposób powróci on do klastra i przejmie swoje zadania.

Zastosowanie STONITH wiąże się z ryzykiem, że w wyniku nietypowej awarii (przede wszystkim połączenie heartbeat) dwa węzły w klastrze stwierdzą potrzebę wzajemnego resetowania i zaczną to robić cyklicznie. Zazwyczaj problemu tego unika się dopuszczając możliwość wywołania tylko jednej funkcji STONITH w tym samym czasie w obrębie klastra, lub stosując opóźnienia wywołania funkcji o losowo dobieranej długości.

Pawel Topa 2003-12-12