NTTドコモR&Dの技術ブログです。

Datadogダッシュボードでオブザーバビリティを向上させビジネス価値を引き出す方法

はじめに

はじめまして。
NTTドコモ 第二プロダクトデザイン部の野部大貴です。
社会人2年目となる現在は、電子決済サービス「d払い」のバックエンドサーバ開発を担当しています。

現在、チーム一丸となって改善活動を重ねている点、

それはオブザーバビリティ*1です!

ここで我々は、モニタリング/セキュリティプラットフォームDatadog *2をフル活用しています!

私たちのようにシステムを担当している部隊は、一般的にシステム観点でデータを扱うことが多いですが、我々はこれにとどまらずビジネス観点でもモニタリングしています。
そこで、システム観点のモニタリングをする際の心構えに加え、オブザーバビリティを高める事でビジネスに貢献するための工夫についてご紹介します。

システム観点特化のダッシュボード

まずはシステム観点特化のダッシュボードです。

バックエンドサーバは AWS *3で構築されており、どのコンテナ*4でタスク*5が何台起動しているか、リクエスト数、レイテンシ、CPU使用率といったシステムメトリクスを網羅的にモニタリングできます。

ここで図上に青枠で示すように、コンテナごとに情報をグルーピングし、必要最低限の情報に絞り込むことで、モニタリング側の可視性を高めることを意識しています。
小さなレイアウトの工夫ではありますが、これが疎かになると重要な情報を見落とすリスクがあるため、非常に重要な意識の一つだと考えています。
このように、システム観点での監視に関しては問題なく活用できています。

しかし、「システム担当だからシステム観点でだけデータを扱えば良い」という姿勢では、更なるサービスの改善、お客様により良い価値を届けるという大元の目的の達成に時間がかかってしまいます。
そこで、さらなるデータ活用を目指そう、BizDevOpsの姿勢でビジネスの観点でもデータを扱おう、という姿勢で様々なダッシュボードを作成しています。

ビジネス観点でもモニタリングできるダッシュボード

次に、ビジネス観点もモニタリングできるダッシュボードということで、2つの例を説明します。

例えば「機能A」のダッシュボードでは、特定の機能をお客様が利用する際に必ず実行するAPIのリクエスト数を可視化し、本機能をどれだけの方に利用頂いているかを把握できるようにしました。
また、ビジネス的な目標値に色を付けしたり[Marker機能]、大まかな傾向も見れるようにしました[Trendline機能]
これにより、当初想定していた期間内に目標達成できるかどうか?を把握しやすくなり、この結果に基づいて新たな施策を実施するかどうかを議論するきっかけにもなります。

一方、「機能B」のダッシュボードでは、複数の導線がある契機について、それぞれで必ず実行するAPIのリクエスト数やその比率を可視化しました。
これにより、どちらの導線の方が需要あるのかという視点でデータ分析が可能となります。
このような可視化を実現するために、開発段階から機能配置やAPIの構成を考慮することも重要な意識です。

このように、システム担当の我々でもビジネス観点でデータを監視、分析できるようにと様々なダッシュボードを作成してきました。
では最後に、組織を超えてビジネス担当のにも積極的にダッシュボードを活用してもらうにはどうすればよいか、これを意識して作成したダッシュボードの例をご紹介します。

ビジネス担当でも分かりやすいダッシュボード

最後に、ビジネス担当でも分かりやすいダッシュボードということで、以下の例を挙げて説明します。

システム担当が普段利用しているAPI名だけを記載しても、ビジネス担当にとっては理解しづらいものになってしまうため、ビジネス担当にも分かりやすい表現を心がけることが重要です。
新しいものに触れる人にとって、一目見ただけでは何の情報なのかが分からず難しそうだと思われると、関心を持ってもらえない可能性があります。
したがって、まずは興味を引くような工夫が重要です。
そこで、英数字のAPI名("ABC001"等)だけでなく、実際の操作名("ユーザが残高をチャージする"等)も記載するようにしました。

その上で、エラー数、エラー率、レイテンシ、リクエスト数といった重要な指標を網羅的に把握できるようにしました。
また、比較分析の観点から、前週や前月との増減も確認できるようにしています[Timeshift機能]
これにより、さまざまな側面からの分析が可能になってきました!

まとめ

上記の様にダッシュボードと向き合う中で、システム担当の我々がビジネス観点でもデータを見る、見れるように環境整備するという意識が高まってきました。
現在はシステム担当の我々がダッシュボードをモニタリングすることが多いですが、ビジネス担当のメンバーにもダッシュボードを積極的に活用してもらえるように、より分かりやすい&より魅力的なダッシュボードを作っていこうと思っています!

ちなみに「Datadogダッシュボードで見える化する新たなビジネス価値想像のチャンス」と題して、DatadogSummitというイベントでプレゼンしてきました!
動画は こちら です!ぜひご覧になってください!

最後まで読んでいただきありがとうございました。


*1:機能が意図通りに動作しているか、何か問題が発生していないかを確認するプロセス

*2:クラウド アプリケーションのためのモニタリングとセキュリティの統合プラットフォーム

*3:アマゾンが提供するクラウドコンピューティングサービス

*4:アプリケーションのコード、ライブラリ、およびクラウドで実行するのに必要なその他の依存関係を含むソフトウェアコードパッケージのこと

*5:どのアプリケーションをどのコンテナで実行するのか、といった設定をまとめた指示書のようなもの