KDDI株式会社様導入事例

KDDIが提供するクラウドサービス「KDDI クラウドプラットフォームサービス(KCPS)」の品質を支える、早期発見・早期復旧を極限まで突き詰めた運用監視とその裏側

KDDI logo
 

OBJECTIVE

あらゆる状況、動作、顧客環境の障害を監視し、対応するために柔軟な関しフローが必要だった

業務の効率化、パフォーマンスの向上、ダウンタイムの改善

REQUIREMENTS

CloudStackやその他のシステムと簡単に連携でき、豊富な利用実績のあるエンタープライズ向け監視ソリューション

約2万台の監視対象を効率的に監視するための自動登録機能

APPROACH

冗長構成約40台のZabbixサーバーで数十万アイテムの監視を実施

ZabbixとCloudプラットフォームが自動的にリンクするシステムの実装

OUTCOME

CloudStack及び社内他システムとの連携

カスタマイズのしやすいグラフ表示機能

自動登録による導入時の効率とパフォーマンスの改善

充実したサポート体制


「Quality Cloud」を掲げ、Citrix CloudPlatformをベースに高品質なクラウドサービス「KDDIクラウドプラットフォームサービス」を企業向けに提供しているKDDI。そのキャリアグレードの品質を支えるのは、Zabbixを活用したたゆみない運用監視だ。Zabbixを活用し、早期発見・早期復旧を実現している同社に、そのポイントを聞いた。

Mr. Takeshi Maehara
KDDI
プラットフォーム開発本部
クラウドサービス開発部
開発1G
リーダー
前原 剛 氏

Mr. Masato Kato
KDDI
プラットフォーム開発本部
クラウドサービス開発部
開発1G
マネージャー
加藤 真人 氏

Mr. Jun Endo
KDDI
プラットフォーム開発本部
クラウドサービス開発部
開発1G
課長補佐
遠藤 淳 氏

99.9999%の稼働率(2014年7月-9月実績)を誇るQuality Cloud、「KDDIクラウドプラットフォームサービス(KCPS)」

「KDDIクラウドプラットフォームサービス(KCPS)」は、KDDIが2012年7月から企業向けに提供しているInfrastructure as a Service(IaaS)だ。クラウド基盤ソフトウェア「Citrix CloudPlatform」をベースに、通信事業者として蓄積してきたさまざまなノウハウを反映し、高品質なサービスを実現している。その品質が評価され、Citrix CloudPlatformベースのサービスとしては、日本最大規模、グローバルでも有数の規模を誇るまでに成長した。(2014年11月現在)

「クラウドの利用にはセキュリティ面が心配だ」といった、多くの日本企業が抱く懸念に対して、インターネット経由の接続だけでなく、専用閉域網経由でイントラネットと接続するサービスを標準提供し安全性を確保。また、共有仮想サーバーだけでなく、プライベート性を重視した専有サーバーメニューもKDDI独自開発により提供しており、クラウド利用を考えるお客さまに安心して安全に利用できる環境を整えている。

また、KDDI クラウドプラットフォームサービス(KCPS)のSLAは稼働率99.99%だが、ここ数ヶ月はそれを上回る99.9999%という稼働率を連続して達成中だ。その実現のポイントは、綿密かつきめ細かな運用、監視にあるという。KDDIの前原剛氏(プラットフォーム開発本部 クラウドサービス開発部 開発1G リーダー)は、「故障が発生しないに越したことはないが、サーバーというものは機械である以上、どうしても故障は起こってしまう。そうした前提に立ち、故障発生時にいかにすばやくサーバーを再立ち上げ、障害時間を短く押さえられるかがポイントだ」と述べる。

※稼働率=月間稼働時間累計/(月間稼働時間累計+月間故障時間累計)ただしメンテナンス時間を除く

Citrix CloudPlatformとZabbixの連携で監視を実現

KDDI クラウドプラットフォームサービス(KCPS)の品質を支える「運用監視」。そこに一役買っているのが「Zabbix」だ。CloudPlatformの標準機能に加え、独自に作成したシェルスクリプトやZabbixの組み合わせによって、その時々の状況に応じた、柔軟な監視フローが実現できているという。

KDDI クラウドプラットフォームサービス(KCPS)では、冗長化した約40台のZabbixサーバーを通じて、インフラを構成する約2万台に上るホストを対象に数十万項目のアイテムを監視している。もともとKDDI内部のシステム運用にZabbixを活用していたこともあってオペレーターが操作に慣れていた上、監視項目や検知時のアクション設定のチューニング、カスタマイズが自由に行える柔軟性などを評価したという。

加えてもう1つ、大きな理由がある。CloudPlatformとの連携が可能なことだ。KDDIではIaaSの基盤となる設備に加え、監視オプションを申し込んだお客さまの仮想サーバーの稼働状況も監視している。だがそのままでは「何らかの理由でお客さま自身が仮想サーバーを再起動した場合でも、異常と判断してアラートが飛んでしまう。そこで、ZabbixとCloudPlatformが自動連携して、意図的に停止したものについては警告しないという仕組みを実現した」(KDDI プラットフォーム開発本部 クラウドサービス開発部 開発1G マネージャー 加藤真人氏)。また、自動連携の実現により、約2万台という監視対象に対する運用監視を「このホストのIPアドレスは何か、OSの種類は何か」と1つ1つ確認することなく、効率的に行えるようになったという。

この仕組みを実現したのは、Zabbix社のパートナーとして導入コンサルティングやサポートサービスを提供している、インテリジェンス ビジネスソリューションズ(IBS)の製品だ。「Zabbixが元々備えている機能を活用し、CloudPlatform側の動きを取り出せるようにした」(IBS プラットフォームソリューション部 OSSテクノロジグループ 小坂剛人氏)。動きの速いCloudPlatformのバージョンアップにも引き続き追随していくという。

Mr. Taketo Kosaka
インテリジェンスビジネスソリューションズ
プラットフォームソリューション部
OSSテクノロジグループ
小坂 剛人 氏

Mr. Naoyuki Kajiwara
インテリジェンスビジネスソリューションズ
プラットフォームソリューション部
OSSテクノロジグループ
シニアエンジニア
梶原 直之 氏

Mr. Naoya Tsuchiyama
インテリジェンスビジネスソリューションズ
プラットフォームソリューション部
OSSテクノロジグループ
土山 直也 氏

IBSとの二人三脚でテンプレート化、自動化を推進

KDDIが評価するZabbixの特徴の1つに、監視設定のテンプレート化によって作業効率を改善できる点があるという。KDDI プラットフォーム開発本部 クラウドサービス開発部 開発1G 課長補佐の遠藤淳氏は、「現在、KDDI クラウドプラットフォームサービス(KCPS)の監視対象として、お客さまのサーバー監視用、KDDIのサーバーならびにネットワークの設備監視用の他、KCPS以外のサービス設備監視監視でもZabbixを活用しているが、それぞれの特徴に合わせてIBSとテンプレートを作り、効率的に運用できている」と述べる。

ただこれも、一朝一夕に実現できたものではなかった。例えば、Zabbixサーバーの導入当初は監視項目が相当数に上っており、ディスク容量が大きくふくれあがった。この結果、監視サーバーの挙動自体が不安定になることもあったという。その経験を活かし「現在はIBSがパラメーターを整理し、パフォーマンスのチューニングによってスムーズに監視できるような状況を維持している」(遠藤氏)。

また、「実は、導入当初はしきい値の設定などにいくつか間違いがあった」と加藤氏は振り返る。ほんの少しのずれでも、何千台という規模で仮想サーバーが動き、何万種類という監視項目があるクラウド環境では大きな問題になりかねない。

そこでKDDIとIBSでは、設定の生成から投入、設定内容が期待通りに反映されているかどうかのチェックまでを自動化するツールを作り、さらなる運用の効率化に取り組んでいるという。「従来型のシステムならばまだしも、クラウド環境の設定を人の目でチェックするには限界がある。その部分も含め、きちんとシステム化している」(加藤氏)。前原氏も、「クラウドのスピード感はものすごいものがあり、KDDIクラウドプラットフォームサービス(KCPS)においても、とてつもない勢いで増設が行われている。自動化は避けて通れない状況だ」と述べている。

また、システムというのは運用を続けているうちに、個別の監視が必要な箇所が増え、共通テンプレート部分が相対的に少なくなってしまうものだが、そうした部分もIBSとともに整理を行い、再テンプレート化を実現したという。

時には、「かなり深く、即答できないような質問をいただくこともある」と、IBS プラットフォームソリューション部 OSSテクノロジグループ シニアエンジニアの梶原直之氏は振り返る。こうした時には、「単純に製品としての仕様を答えるのではなく、監視に当たって何を実現したいのかを汲み取って、最適な答えを返すように心がけている」と、IBS プラットフォームソリューション部 OSSテクノロジグループ土山直也氏は述べている。

さらなる品質向上を実現すべく、運用監視はよりいっそう重要に

さらなる品質強化に向けてあらためて設計を一から見直すとともに、クラウドの品質をお客さまが見える世界を作り、安心してご利用いただけるようにしたいという。

「ここでいう『品質』の中には、きめ細かな監視やすばやいレポート提出といった内容も含まれている。いっそう高い品質を提供していくには、いかに早く障害に気付き、いかに早く復旧させるかが重要。その実現において、運用監視、Zabbixが果たす役割は非常に大きい」と前原氏は述べ、品質の裏打ちとなる監視の重要性を強調した。

また遠藤氏は「将来的には、マルチテナント環境で顧客が自ら監視項目を設定し、確認できるような仕組みがZabbixに加わることに期待したい」と述べる。こうした機能を活用した、KDDIクラウドプラットフォームサービス(KCPS)のさらなる発展に期待したい。


システム概要

Zabbixサーバー数: 約40台

冗長化: あり(Active-Active構成)

マルチテナント監視: あり

監視対象機器数: 約20,000台

トリガー数: 約800,000

アイテム数: 約400,000

Zabbixがインストールされているハードウェア: 仮想マシン及び物理サーバー

CPUコア数:4〜16コア(用途により異なる)

メモリ:16GB〜128GB(用途により異なる)


Internet

※CloudPlatformの正式名称は、Citrix CloudPlatform powered by Apache CloudStackです。Citrix、CloudStack、およびCloudPlatformは、Citrix Systems, Inc.の米国あるいはその他の国における登録商標または商標です。


KDDI株式会社概要

本社: 東京都千代田区
設立: 1984年
従業員数 :27,073名
資本金: 141,851百万円
(2014年3月31日現在)
www.kddi.com

 

KDDI logo

KDDIは移動通信・固定通信の両方を併せ持つ、総合通信事業者として時代の変革をリードする企業を目指しています。個人のお客さま向けには「au」ブランドのもと、移動体通信 (au携帯電話) 事業と固定通信 (ブロードバンド・インターネット/電話) 事業を展開し、シームレスにつながる新しい通信環境の実現に貢献しています。また、法人のお客さまには、FMCネットワークからデータセンター、アプリケーション、セキュリティ対策まで全てのICT領域でサービスを提供し、ビジネスを強力にサポートしています。クラウドサービス開発部としては、法人向けのお客様にクラウドサービスを提供しています。KDDIのクラウドの特徴としては、「クラウド、ネットワーク、モバイルをOneStopで」「自由にお客様目線で」「QualityCloud」をコンセプトに提供しています。

 

監視ソリューションの活用事例をご紹介いただける場合は

質問事項にお答えください

または、マーケティングチームまでお気軽にお問い合わせください。

Information Required to Prepare Zabbix Case Study
 

* Required fields

1. Please provide us with some information about your company
a) Company's name *


b) Your name, surname *


c) Job title *


d) E-mail address *


e) Description of your company's business *


f) Year of company establishment *


g) HQ location (address) *


h) Company's phone number


i) Number of employees with reference date (e.g., 580 employees on December 31, 2013)


j) Amount of revenue for a previous period (e.g., $1.2 mill. for year 2013)


k) Name several biggest customers


l) Short information/reference on why you have chosen Zabbix Monitoring Solution (provided by the person who made the decision e.g. CEO, CTO, senior engineer or any other responsible decision-maker) *

 
 
2. Reason for your organization to use monitoring solution
a) What were the challenges for you when you started to look for a monitoring solution? (the more details you provide, the better overview of the problem we can provide in a case study) *


b) What was the last drop that pushed you to search for a monitoring solution?

 
 
3. Why did you choose Zabbix
a) Which monitoring software (if any) did you compare before choosing Zabbix?


b) What made you to choose Zabbix? *


c) What, in your opinion, are those benefits of Zabbix that make it stand out over other monitoring solutions?

 
 
4. If you were using Zabbix before you have applied for any Zabbix professional services, please describe:
a) What were the reasons for you, which made you to look for Zabbix professional services


b) Was it easy to apply for Zabbix professional services


c) How satisfied are you with Zabbix professional services, and do you plan to continue purchasing Zabbix services in the future


d) Do you believe it's worth to use Zabbix services, in terms of peace of mind and economic reasons.

 
 
5. How was the process of implementing Zabbix? Was it easy? If hard, how did you manage it? *

 
 
6. What are the outcomes of implementing Zabbix within your organization
a) Name the issues that were solved after implementing Zabbix? Did you manage to solve all the issues you hoped to? *


b) How was the performance improved after implementing Zabbix? *

 
 
7. Please specify:
a) Current parameters of your company's IT infrastructure (number of monitored devices implemented systems, topology of Zabbix installations (Zabbix Servers + Zabbix Proxies + locations (everything on 1 machine or distributed across several), etc.) *


b) Parameters of Zabbix installation (number of hosts, triggers, items, users) *


c) Information on hardware, where Zabbix is installed *


d) Your Zabbix performance data (NVPS) *

 
 
8. Additional notes
Please feel free to add any additional information you would like us to know, which was not covered by the above mentioned questions

 
 
Privacy Policy 商標ポリシー