国立大学法人金沢大学様 導入事例
通報を受けての後追いではなく先手での障害対応を実現
プロフェッショナルサービスも組み合わせ、全台監視を実現

通報を受けての後追いではなく先手での障害対応を実現
プロフェッショナルサービスも組み合わせ、全台監視を実現
ユーザーからの通報ではじめて障害を把握し、後追いの対応になっていた
オープンソースであること
GUIがわかりやすく、機能が豊富なこと
監視データを蓄積し、サービス品質向上や次の設計に反映
監視ノウハウを蓄積した上で、外注も組み合わせて全台監視
先手を打って障害に対応し、影響範囲を最小化
パートナーの力を生かして工数削減
東京ドーム51個分に上る広大なキャンパスを擁する金沢大学では、ユーザーからの通報ではじめて障害を把握する状況を改善し、先回りして動けるような体制を整えるためZabbixを採用した。プロフェッショナルサービスを組み合わせ、全台監視を実現している。
金沢大学では「地域と世界に開かれた教育重視の研究大学」という基本理念の元、金沢地区6拠点、能登地区3拠点、加賀地区2拠点にまたがる東京ドーム51個分に上る広大なキャンパスで、約1万2000人の学生が学んでいる。
同大学総合技術部情報部門では、教育や研究に不可欠なキャンパスネットワーク「KAINS」やサーバなどのインフラ構築・運用管理を担ってきた。KAINSはキャンパスの広さを反映し、約400台のネットワークスイッチや約1100台の無線LANアクセスポイントなどで構成されており、ピーク時で約2万台のデバイスがつながる規模だ。しかもBYODを許可しているため、端末の種類は多岐にわたる。
金沢大学 総合技術部 情報部門 部門長の浜 貴幸 氏は、「ユーザーに制限を意識させず自由に使えるけれども、実はトレーサビリティを確保し、しっかり安全が担保されているサービスを目指して運用しています。その上で、快適でいつでも使える、ちょうど空気や水と同じように使える環境を意識しています」と言う。
ただ、昔からそんな環境が整っていたわけではない。2000年代は、「MRTG」や「Cacti」などを用いてトラフィック量程度は把握していたものの障害監視までは行っておらず、利用者から「ネットワークが切れて使えません」といった連絡があってはじめて障害を把握していた。いわば人が「トラップ」の役割を果たしているような状態だった。当然、前後の状況も残っていないため原因究明にも手間取り、解決までに時間を要していた。
「学内にサービスを提供する立場としては、きちんと監視して障害を検知し、ユーザーの申告よりも前にこちらから動けるような状況を作り出すことが大事だと考えました」(浜氏)
こうした考えから金沢大学は、2011年のネットワーク更改に合わせて監視ソリューションを導入することに決定した。ここで採用したのがZabbixだ。
第一の理由はオープンソースであることだった。「大学の文化には、プロプライエタリに縛られず、もし問題があっても自分たちでどうにかできる良さがあるオープンソースがなじみやすいと考えました」(浜氏)
いくつかの比較記事を元に、GUIが見やすく、フィルタなどの機能も充実している点を評価し、「まずは入れてみよう」とZabbix 1.8を導入し、KAINSとSINETなどをつなぐコアスイッチをなど基幹部分の死活監視・トラフィック監視から開始した。
「最初はアイテムとトリガー、アクションといったZabbix特有の概念や関係性になじみがありませんでしたが、ひとたび考え方を理解した後はわかりやすく使えるようになりました。また、導入はもちろん、アップグレードも非常に簡単にできる点に感動しました」(同技術専門職員、松能 誠仁 氏)
Zabbixからのアラートは、メールで通知するだけでなくTeamsとも連携している。さらに、執務室内にSNMPトラップと連携した警告灯を設置し、異常があれば部屋にいる技術職員らがすぐに気づける環境も整えた。レベルに応じて警告灯の色が変わるため、すぐ対応しなければいけない事態なのかどうかもぱっと見て判断できる。
より詳細に状況を確認する必要があれば、同じく執務室に設置した大型ディスプレイに表示しているZabbixのダッシュボードを見るだけで、「何が起きているか」を把握できるようにした。これは、限られた人的リソースの中で円滑な運用を実現し、また職員間のコミュニケーションを活発化してスキル向上につなげるといった効果も狙ったものだ。
Zabbixの導入によって、ユーザーから連絡があってから慌てて後追いで対応する体制から、「先手」を取って障害に対応できるようになった。「仮に障害が起きて連絡をもらっても、『その件はすでに把握しており対処中です』と答えることで納得いただけ、クレームにつながりにくくなりました」(浜氏)
また長期にわたってデータを取得することで、障害原因の特定が容易になり、サービス品質の向上にもつながっている。「過去にファイアウォールのメモリリークが発生したことがありました。Zabbixでメモリの使用率を過去数ヶ月にさかのぼって確認することで、原因究明につながりました」(松能氏)
蓄積したデータは、次のネットワーク更改に向けた資料としても有効だ。リソースの利用量や変動の傾向を定量的に把握し、見える化することで、推定や思い込みに頼らない適切な設計やサイジングが可能になった。
こうして金沢大学では2016年、2021年とネットワークを更改するたびに監視範囲を拡大してきた。2021年の更改ではZabbix 7.0へと移行するとともに、KAINSのすべてのネットワーク機器に加え、DNSやメールなどの各種サービス、仮想サーバ基盤、さらに学内データセンターの電力消費量や室温にまで監視対象を広げている。
「ありとあらゆるシステムをZabbixで監視し、取れるものは全部とっておき、できるだけ長い期間保存しておこうという考えで運用しています」(浜氏)
ただ、全台の監視となると工数がかかるのも事実だ。そこであらためてプロフェッショナルサービスを導入し、ちょっとした変更や監視アイテムの追加といった作業をコラボレーションシステムおよびNTT西日本に依頼することで、負荷の少ない運用へと切り替えた。
「我々はただ『監視してくれ』と丸投げするのではなく、明確で詳細なオーダーを出したいと考えています。10年の運用を通して自分たちの監視設計やノウハウを固め、どう設定すべきかを把握できるようになったことから、外注を活用することにしました」(浜氏)
このように監視のあり方を理解した上でプロフェッショナルサービスを活用することで、手が空いた分を他のプロジェクトに回すことができている。「人数が少ないため、自分たちがやっていた作業をオフロードしながら増幅できるというのは非常に価値のあることだと思います」(浜氏)
全ての機器を漏れなく監視することで、たとえば新年度が始まり新入生がキャンパスにやってくるようになれば一気に接続デバイス数が増える、といった状況がはっきりと見えるようになった。
何より効果を感じたのが、2024年1月に発生した能登半島地震への対応だ。震災当時、浜氏は能登に帰省しており、携帯電話での通話すら困難な状況に陥ったが、メンバーにショートメッセージで「Zabbixのダッシュボードを確認してほしい」と一言伝えるだけで状況確認を済ませることができ、非常に助かったという。二件ほどアラートが出ていた機器があったが軽微なもので、短いやりとりで対応を済ませることができた。
「全デバイスをモニターして情報を集めていたため、アラートが出ていなければ正常に稼働していると判断できました。そうでなければ、各システムの担当者に逐次確認して回る必要があり、状況を把握するのにもっと時間がかかっただろうと思います」(浜氏)
ネットワークを運用している以上、障害はどうしても起こる。「『何かおかしい』という兆候をきちんと拾うには、システムのすべての状況を把握し、そのデータをどう生かしていくかを考えていく必要があります。Zabbixはそのために必要なツールだと思っています」(浜氏)
金沢大学は次期システムに向けた検討も開始しているが、その際にはZabbixで収集したデータを生かし、最適な設計を実現していく計画だ。また、Zabbix 6.0で搭載されたアノマリー検知やベースライン監視といった機能もうまく活用していきたいと考えている。「今はアラートの対処をどうすべきかを人が判断しているところがありますが、そこに統計情報などを活用し、もっとスマートな運用を実現していきたいと思います」(浜氏)
さらに、Zabbixカンファレンスで耳にしたセッションをヒントに、各研究室が運用する実験機器や設備を監視する学内向けの「マネージドZabbixサービス」も展開できないかとも検討中だ。「インフラを提供するだけでなく、研究支援にコントリビュートできるのではないかと考えています」(浜氏)
金沢大学は、1862(文久2)年に創設された加賀藩彦三種痘所を源流とし、旧制第四高等学校などの前身校の歴史と伝統を受け継ぐ総合大学です。豊かな伝統文化が醸成された学都金沢の恵まれた環境に位置します。160年という長い歴史の中で、わが国の高等教育と学術研究の興隆に貢献し、我が国を代表する基幹的大学へと発展してきました。現在に至るまで、教育、研究およびそれらを基にした社会貢献により地域と世界に資するべく、不断の改革を続けています(学長メッセージより抜粋)。 諸先輩が築き上げてきた歴史を礎に、金沢大学憲章に掲げる「地域と世界に開かれた教育重視の研究大学」という基本理念に立脚して、金沢大学の揺るぎない未来ビジョンを『志』として、学内並びに社会に示します。
質問事項にお答えくださいまたは、マーケティングチームまでお気軽にお問い合わせください。