こんにちは。 ニフクラエンジニアミートアップ事務局の鮫島です。
2023年2月22日(水)に第57回ニフクラエンジニアミートアップを開催しました。
今回は「Zabbix超入門」というテーマです。 オープンソースの統合システム監視ソフトウェアである Zabbixは、サーバーを中心としたさまざまなITリソースを対象にログデータを収集して、障害の検知・通知はもちろんダッシュボードで可視化したデータを分析するなど幅広く活用されています。
今回は、ソフトウェアを活用したサーバーの監視初心者向けに、Zabbixの基礎の基礎から解説する内容でした。
fujitsufjct.connpass.com
Zabbix超入門
Zabbixのサポートサービスを手掛けるSRA OSS社の中の人、村中拓磨氏による、代表的なシステム監視ツールZabbixを活用したシステム監視の基礎を初心者向けに解説するセッションが今回のメインコンテンツでした。
そもそも監視って何なのか
そもそも、なぜ監視が必要か?という根本的なところからスタートです。
本来稼働しているはずのサービスに障害が発生した場合、監視しているかしていないかで、大きな差がでるとのこと。
例:迅速な対応ができる
原因特定ができる
未然防止ができる
結果的に監視を行うことで、安定したサービス運用が可能になり、顧客への影響を最小限に抑えられるというメリットがあります。
また、何を監視すればいいのか?たとえば、サーバーリソースのメモリーやCPU使用率とかアプリケーションのプロセスが動いているかなど、監視できる項目はたくさんありますが、やみくもに監視するのではなく、そのシステムにおいて必要な要素を洗い出して、より効率的な監視をすることが重要とのことでした。
詳しくは動画のこのあたりからご覧ください。
Zabbixとは
Zabbixに概要については、説明するまでもないので割愛しますが、ここではZabbixというソフトウェアがどのような仕組みでどういたものを対象に監視を行っているかの説明がメインになります。
基本的には、まずZabbixを動かすためのサーバー(Zabbixサーバー)を1台用意して、さらに監視対象のサーバーにエージェントをインストールする必要があります。
そして、監視対象のサーバーからZabbixサーバーに送られたデータは、たとえば障害発生と認定された場合、メールやSlackなどで通知を行うことが出来ます。
Zabbix用語の基礎知識
なお、ここからはZabbixならはの用語(一般用語っぽいが、Zabbixにおいて特定の機能や動作を示す用語)が出てくるので覚えておいた方が良いようです
テンプレート
Zabbixでは、テンプレートという機能があり、それを活用することで数十台数百台のサーバーを監視する場合(大量のホストに同じ設定をする)でもテンプレートを作っておけばいちいちアイテムやトリガーの設定を手動で行わなくとも済みます。
監視を行うのが初めてで、何から始めたらよく分からない場合でも、デフォルトでいい感じのテンプレが搭載されてるのでそれを使ったり、自分でそれを少しづつカスタマイズするとよさそうです。
Zabbixの操作画面
Zabbixの操作は、Webインターフェースを通じて行います。
監視データの確認、障害発生の有無や設定などはすべて同じ画面で行えるようです。
デフォルト画面が、いわゆるダッシュボードになっていますが、アイテムが取得したデータをグラフ表示したり、障害発生履歴を確認したり、ネットワークマップという画面で、インフラの構成を可視化した上で障害の状況を把握したり…といったことが可能です。
Zabbixを動かしてみよう
Zabbixのインストールから、実際に監視システムを作って動かしてみる一連の流れの解説になります。
インストールはこちらの公式サイトのダウンロードぺージに一連の手順を記載されているそうです。
インストール後に、下記の流れで監視システムの構築を行います。
ホスト作成→アイテム作成→トリガー作成
今回は、監視対象サーバーのCPU使用率が40%を超えたら障害と認定するような設定にします。
実際の画面を表示しながら、設定方法を解説していますので、下記をご覧ください。
QAセッション
QAセッションは、セッションの最中からSlidoに大量の質問だけでなく感想やコメントが入り乱れてカオスな状態になっていました。
いつも熟練の「仕切り」を見せてくれる宮原氏が「これはどうすればいいですかねー」と言ってしまうほどの状態でした。
※最終的には全クリア
前半テンプレートや、MIB(Management Information Base)ファイルとネットワーク機器の設定の話が盛り上がっていました。
テンプレートに関しては、デフォルトで用意されているサンプルのテンプレートをベースにカスタマイズしたり、そういったテンプレートをGitで公開してナレッジを共有すると良さそうでした。
その他、ネットワーク機器の監視は、エージェント使ったほうが良いけど監視エージェントを入れるのを嫌がるユーザーも多い…といった「あるある」な話題も印象に残りました。 質問に対し一般参加者が回答する流れは、最近定着している感じですが、参加型のセッションは盛り上がりますね。
・・・いうことで、「Zabbix超入門」大盛況のうちに終わることができましたが、ぜひ皆さんもご自宅の環境で監視を試してみてはいかがでしょうか、
SRA OSS様のテックブログは参考になるので興味がある方は必読です。
それではまた次回をお楽しみに。
最後に宣伝です。
FJcloud-V無料トライアル実施中!
ぜひ、この機会に国産クラウドFJcloud-Vをお試しください。
こちらをクリック↓↓↓↓↓↓↓