2020.06.09 iscsid のtimeout

参考
node.conn[0].timeo.noop_out_interval(デフォルト5秒)
pingによるコネクションの死活監視間隔

node.conn[0].timeo.noop_out_timeout (デフォルト5秒)
pingによるコネクションの死活監視がコネクションエラーと判定するまでの待ち時間

node.session.timeo.replacement_timeout(デフォルト120秒)
コネクションエラーが発生してからI/Oエラーを返すまでの待ち時間。この時間までに死活監視がコネクション復帰を報告すればI/Oエラーは返らない。

デフォルト設定で障害が発生した場合、下記のような流れとなります。

死活監視のpingが発行される(タイミングによって障害発生から1〜5秒経過)
pingがタイムアウトする(+5秒経過)
継続して死活監視のpingが発行され、最終的にpingが成功しないとOSにI/Oエラーが返る(+120秒経過)
ASMがI/Oエラーを検出して障害ストレージを切り離し、残りのストレージで処理を再開する(即時)