NTTドコモR&Dの技術ブログです。

データ分析

HMMマップマッチングとオープンソースツールの活用

クロステック開発部で位置情報を活用したサービス開発をしている小倉です。 スマートフォンを始めとするモバイル端末を多くの人が持ち歩くようになった現代において、その端末から取得される位置情報データはますます重要な価値を持っています。 しかし、位…

なぜAIの「正解」は現場で使われないのか? インタラクティブな分析ツールを商圏分析を例に考える

こんにちは! サービスイノベーション部の山本優汰です。 普段は社内におけるデータ・AI活用の促進を目標に、データ分析やAIエージェントの開発に取り組んでいます。 多くのデータサイエンティストが直面する普遍的な問題の一つに、「AIや分析ツールを導入し…

city2graphで簡単に異種グラフをつくって広島駅大規模再開発をネットワーク科学的に検証してみた

広島駅再開発のインパクトをOSSライブラリ『city2graph』で分析。位置情報データやネットワーク科学を駆使し、都市のアクセシビリティ向上と未来の街づくりに迫る。NTTドコモ江口公基によるレポート。

事業計画達成に必要なアクション設計とシャープレイモデルの実践導入

はじめに NTTドコモデータプラットフォーム部の青山皓太です。 NTTドコモグループでは、2025年度の事業目標達成に向けて、データ活用とDX(デジタルトランスフォーメーション)推進を軸に、事業成長プランの策定からマーケティング施策の実行、業務変革まで…

インターン体験記:エコ行動記録アプリにおけるPUSH配信のデータ分析

こんにちは! NTTドコモ クロステック開発部 モビリティデータ活用技術開発担当の三浦です。 NTTドコモでは、8/25〜9/5に現場受け入れ型インターンシップを実施しました。本インターンシップはリモートと現地のハイブリッド形式での開催となり、参加者は各チ…

平均値 vs 中央値 ~誤差が小さくなるのは?~

はじめに はじめまして、NTTドコモ クロステック開発部の古田です。 普段はデータサイエンティストとして、ネットワークの通信品質データや位置情報データの分析をしています。 分析の中でデータを統計化する場面が多くあるのですが、データを代表する値とし…

Splunkダッシュボード作成のTips💡

はじめまして。NTTドコモサービスデザイン部の三輪と申します。NTTドコモ R&D Advent Calendar 2025の19日目を担当いたします。 本記事では、ログの統合分析プラットフォームであるSplunk Cloudにおけるダッシュボードについて、その作り方やTipsについてご…

Two-Tower レコメンドをちゃんと理解する ― TFRS / 対照学習 / HNSW まで

ドコモR&D戦略部、川畠雄司です。普段は仮想ユーザーモデルを用いて実ユーザーの行動を予測する「仮想マーケティング」技術の研究や、その社会実装に向けた開発・運用に従事しています。 本記事では「Two-Towerモデル」について解説します。 Google(YouTub…

SDK開発者の悩み「データ分散問題」を解決する、Measurement Protocol活用術

こんにちは!NTTドコモ マーケティング戦略部の井上裕太です。 普段はコンシューマー向けアプリに導入されているSDKの開発チームに所属し、プロダクトオーナー業務の一端を担っています。 SDK開発者のみなさん、「自分たちが提供しているSDKが、実際にアプリ…

ドコモのSnowflake環境におけるコストとパフォーマンスの最適化戦略

こんにちは。NTTドコモ データプラットフォーム部の重冨です。 本記事ではドコモのデータプラットフォームにおけるコストとパフォーマンスの最適化の取り組みについて紹介します。 NTTドコモのデータプラットフォームについて NTTドコモではデータ分析基盤と…

地域メッシュ計算ロジック詳解:緯度経度⇔コード相互変換をPythonで実装してみた

はじめに NTTドコモ データプラットフォーム部の中村光宏と申します。 この記事では地理的情報のデータを分析する際に重要な「地域メッシュコード」について、定義やその計算⽅法を解説します。 地域メッシュコードを⼿軽に扱うなら jismesh ライブラリ等便…

# AIの『賢い節約術』〜 Matryoshka Representation Learning で縮めてみよう 〜

この記事は、Advent Calendar 2025の18日目の記事になります。 はじめに こんにちは。サービスイノベーション部の石井です。 業務では大規模モデル*1や需要予測等の技術を活用したマーケティング支援を行なっております。 データサイエンスでは、テキストや…

時系列予測のSHAP値から、LLMで「納得できるビジネス文書」に翻訳

AIとデータ分析を駆使してモデルの予測をビジネス担当者にわかりやすく説明。LLMを使った新たなレポーティング自動化の試みを詳細解説。

Snowflakeのタスクとストアドプロシージャについて試してみた

自己紹介 この記事はドコモR&D Advent Calendar 2025の16日目の記事です。 初めまして!NTTドコモ サービスイノベーション部 ビッグデータ基盤担当の竹鼻です。入社3年目になります。社内のビッグデータ基盤の保守運用や機能の開発に携わる担当をしています…

GitHub Copilotを育ててSQLを効率的にdbtモデル化した事例

1. はじめに ドコモのデータプラットフォーム部の中村光宏と申します。 この記事では、GitHub CopilotのCustom Instructions を強化しチームのKPI管理に使っていた既存のSQLをdbtモデルに変換した経験と学びをまとめました。 まだベストプラクティスが少ない…

データ活用を社内文化へ──PdMが挑むキャズム越え。SECIモデル活用事例

ドコモが推進するデータ民主化。社内向けプラットフォームPochiのプロジェクトを通じ、SECIモデル活用でデータ活用を浸透させる方法を詳述。PdMやプロジェクト管理に興味ある方におすすめ。

Iceberg × dbt × BigQuery × Snowflakeでつくる、マルチDWHパイプライン

Apache Icebergを用いて、SnowflakeとBigQueryを横断するマルチDWHのデータパイプラインを実現しました。 開発・運用の効率性を高くするためdbtで実装したが、その中で気を付けなければいけない点が多くありました。 想定する読者 Icebergを用いたパイプライ…

1日で作る対話型検索 – Snowflake Cortex Searchで実現するRAGシステム

## TL;DR - テキストデータの検索性向上のために、SnowflakeのAI機能Cortex Searchの検証を行った。 - Cortex Searchのハイブリッド検索とCOMPLETE関数を組み合わせ、RAGによる対話型検索機能を実装した。 - 自然文の問いに対して、関連する声を根拠とした要…

RecSys Challenge 2025 3位入賞解法紹介🥉

サマリー 「RecSys Challenge 2025」において、ドコモチーム(SenseLab)として参加し、世界第3位に入賞しました。著名な企業や大学が合計416チーム参加するコンペでした。 RecSys Challenge では離反予測や購買傾向予測などECサイトにおける複数の異なる分析…

Kaggle Masterになったので感謝を綴ります

NTTドコモ Advent Calendar 2025 の1日目と、Kaggle Advent Calendar 2025 の2日目の記事です。 はじめに こんにちは、データプラットフォーム部の鈴木明作です! データサイエンスを始めるきっかけとなった、Kaggleにおいて、先日にKaggle Masterという称号…

生成AIを活用したマンスリーフィードバック面談補助ツール

はじめに 株式会社ドコモCS 113事業部 愛知113センターの稲垣新之介と申します。 普段はコールセンターにてスーパーバイザーとして業務に従事しております。 このたび、Microsoft社が提供するAIチャット「Copilot Chat」の活用事例を、2025年8月5日にNTTドコ…

最難関国際会議KDD 2025でドコモが現地発表!

サマリ 初めまして NTT ドコモ R&D戦略部の現在3年目社員の村上友希です。 普段は因果推論や機械学習を用いたデータ分析業務に従事しています。 データ分析コンペであるKDD CUP2025にて全4部門中2部門で特別部門賞を受賞、KDD Workshopにて論文が2本採択され…

インターンシップ体験記:LLMを用いた行動予測シミュレーション

こんにちは!NTTドコモ R&D戦略部の青栁です。 普段の業務では、ドコモデータやLLM(大規模言語モデル)を活用したマーケティング技術の研究開発をしています。 弊社では、2025/8/25 ~ 9/5に現場受け入れ型インターンシップを実施しました。 私が所属するチ…

インターン体験記:イーサリアムの取引データから詐欺アカウントを検出してみた

こんにちは!NTTドコモ サービスイノベーション部の九島です。 NTTドコモでは、8/26 ~ 9/6に現場受け入れ型インターンシップを実施しました。 本インターンシップはリモートと現地のハイブリッドの実施となり、参加者はチームに配属された後、2週間の業務体…

【Python】Spotifyの人気楽曲データから日本と世界の音楽トレンドを比較してみた

はじめに こんにちは、NTTドコモ サービスイノベーション部の内藤(@dcm_naitou)です。 普段はマーケティング分野へのAI技術の導入・運用業務に携わっています。 今回は、Spotify ChartsとSpotify APIから2023年の人気楽曲データを取得し、日本と世界で音楽…

エンジニアのためのGoogle Analytics活用術:GA4のカスタムアラート通知をSlackで即座に共有する方法

こんにちは! NTTドコモ 第一プロダクトデザイン部の堤公希です。 コンシューマ向けアプリの開発部に所属し、アプリのプロダクトオーナー業務の一端を担っております。 私のチームでは、Google アナリティクス 4(GA4)を利用したモバイルアプリのデータ分…

Datadogダッシュボードでオブザーバビリティを向上させビジネス価値を引き出す方法

はじめに システム観点特化のダッシュボード ビジネス観点でもモニタリングできるダッシュボード ビジネス担当でも分かりやすいダッシュボード まとめ はじめに はじめまして。 NTTドコモ 第二プロダクトデザイン部の野部大貴です。 社会人2年目となる現在は…

テーブルデータの取り扱い方 (LLM編)

LLMを活用したテーブルデータの理解技術を探求する、企業の業務改善に役立つ手法を紹介する内容です。プロンプトデザインやRAG手法の詳細を学べます。

SHAP-IQ: 機械学習モデル解釈の最新手法を紹介

TL;DR 機械学習のモデル解釈手法SHAPを拡張した、SHAP-IQ (Interaction Quantification) が提案された 単一の特徴量だけでなく、複数の特徴量間の交互作用も近似して、モデルの解釈性を深めることが可能 pythonライブラリshapiqで利用可能。NeurIPS2024 (Dat…

とりあえずStreamlitでたった1ヶ月で生成AIアプリ(ダッシュボード解釈支援)を作ってみた

はじめに こんにちは、NTTドコモサービスイノベーション部の田尾と上田です。 田尾は業務では主に、社内で生成AIに関連するイベントの運営を担当しています。具体的には、生成AIを活用したアイデア創出コンテストや、社内での事例共有会を企画・実施していま…

KDDCup 2024 Amazon Multi-Task Online Shopping Challenge for LLMs における訓練用データセット構築

はじめに NTTドコモ クロステック開発部の小原です。 本記事では、KDDCup 2024 Amazon Multi-Task Online Shopping Challenge for LLMs (以下、本コンペ)の解法で使用されたデータセット構築についてご紹介します。我々ドコモも本コンペへ取り組んでいたもの…

位置情報から移動経路推定してみた

こんにちは。NTTドコモ サービスイノベーション部の大澤です。普段は位置情報をメインとしたデータ活用に関する業務をしています。 この記事ではPythonを用いて、移動した経路を位置情報から推定する方法について紹介したいと思います。 概要 突然ですが、図…

大学院で防災研究していた私が、会社の力とちょっとしたデータの可視化でちょっぴり世の役に立った話

はじめに NTTドコモ データプラットフォーム部(以下DP部)23新卒の江口公基です。 普段はドコモが保有する顧客基盤データ(以下ドコモデータ)による価値創出のためのパートナー企業向けデータプロダクトの企画/開発を行っております。私は特にドコモデータの中…

Stanで動かすベイズ的機械学習 ~医療費データの分析例~

本記事は、ドコモアドベントカレンダー2024 19日目の記事です こんにちは!NTTドコモ クロステック開発部の畑元です。業務ではヘルスケア領域におけるデータ分析やAI開発を行っています。 この記事ではベイズ推論による機械学習とRStanを用いた分析例をご紹…

愚痴も仕事の原動力なり

はじめに NTTドコモ サービスデザイン部でCiRCUSというシステムを担当している夏目です。 タイトルの通り、仕事に対する愚痴を聞いてもらいつつ、華麗に乗り切った話を書きます。 どんな仕事をしていても、もっとこうできたらいいのになぁとか、なんでこんな…

Cloudwatch Logs Insightsでログを集計する話

簡単にアプリケーションログを分析できるCloudWatch Logs Insightsの活用法を紹介。初心者が理解しやすいクエリ例と新機能を詳しく説明します。

データの海で迷わない!ドコモのデータカタログ運用のお話

1. はじめに Alationとは? 2. ドコモのデータ活用基盤とデータカタログ 2-1. ドコモのデータ活用基盤について 2-2. AlationとSnowflakeの連携機能 3. データカタログの運用の話 3-1. カタログ運用その1:DWH開発者によるカタログ運用 3-2. カタログ運用その…

Graph Foundation Model について調べてみた

はじめに こんにちは。サービスイノベーション部での石井です。 業務ではデータサイエンスやAI等の技術を活用したビジネス適用を行なっております。 データサイエンス分野に長く関わっていると手法やトレンドにも徐々に大きな変化が起きてきていると感じてい…

データ加工ツールで人気のdbtを導入するとデータマート運用が簡単になった話

目次 はじめに 1. ドコモにおける顧客分析の難しさとCX分析基盤 2. CX分析基盤を運用するときの課題 2.1. 基盤運用で発生する問題について 2.2. リカバリ対応が困難な問題 2.3. ドキュメント修正が煩雑な問題 2.4. 取り組むべき2つの課題 3. 課題に対するソ…

dbtとTableauで安定したデータパイプラインとダッシュボードを運用できるようになった話

1. はじめに 2. 堅牢性を強化に至った背景 対象のダッシュボード ダッシュボードが抱えていた課題 コード管理の煩雑さ データソース由来の品質問題の波及 3. 課題への対処方針 コード管理の煩雑さの解消方針 より高いデータ品質の確保 参考:dbtとは? 4. db…

Google Analytics 4をStreamlitに導入してグロースできる環境を実現してみた

自己紹介 NTTドコモ データプラットフォーム部(以下DP部)藤平です。 システムやアプリケーションはリリースしたら終わりではなく、利用者の声や利用状況に合わせたUIの改善など日々成長させていく必要があります。 DP部が提供するデータアプリケーションプ…

国際学会SIGSPATIALワークショップの位置情報予測コンペHumob2024 ドコモ3位入賞解法&アメリカ現地参加レポート

NTTドコモ R&D Advent Calendar 2024 の1日目の記事です。 はじめに NTTドコモ クロステック開発部の鈴木明作です! こちらの記事では、国際学会SIGSPATIAL 2024のワークショップで開催されたユーザの位置情報予測コンペであるHumob challenge 2024にドコモ…

データ分析コンペ KDDCUP 2024 OAG-IND 入賞解法の紹介

TL;DR NTT DOCOMO R&Dは,KDDCUP2024 OAG-INDタスクにおいて380チーム中6位入賞しました. KDD2024/KDDCUP2024に関する情報及び現地レポートについては,こちらの記事をご覧ください. 本記事では,OAG-INDタスクにおけるNTT DOCOMO R&Dの解法をご紹介します…

データのつながりを解き明かす!Graph Embeddingの考え方と適用例の紹介

はじめに こんにちは、サービスイノベーション部の山路です。 普段の業務ではデジタルマーケティングに関する技術検討や研究開発を行っています。本記事では、近年取り組んでいるグラフデータを活用したレコメンド技術に関して、その根幹となるGraph Embeddi…

「引用論文の影響度合いを予測せよ」:データ分析コンペKDDCUP2024 OAG-PST 8位入賞解法紹介

TL;DR NTTドコモ R&Dチームはデータ分析のトップカンファレンスであるACM KDD主催のデータ分析コンペKDDCUP2024 に参加し、Open Academic Graph (OAG) Challenge部門のTask3 Paper Source Tracing(PST) コンペにおいて 8位に入賞しました。 PSTコンペは、論…

データ分析コンペKDDCUP 2024 OAG-AQA 6位入賞解法の紹介

TL;DR データ分析コンペであるKDDCUP 2024 OAG-AQA にて6位 入賞したので、入賞解法を紹介します。 KDD概要と現地参加した発表の様子はこちらの記事をご覧下さい。 はじめに NTTドコモ クロステック開発部の鈴木明作です! ドコモR&Dでは、データマイニング…

KDDCUP2024に入賞したので現地でポスター発表してきました

データ分析コンペであるKDD2024にて、ドコモの2チームが3つのタスクで入賞(6位・6位・8位)しました。手法詳細は以下をご覧ください タスク1nttdocomo-developers.jp タスク2nttdocomo-developers.jp タスク3nttdocomo-developers.jp 昨年度のKDD2023の様…

スバラしき逆行列の世界

はじめに NTTドコモ サービスイノベーション部の中村圭佑です。普段の業務では画像認識や生成系AIに関する研究開発を行っています。ネット上の日本語記事で数値的な逆行列の計算方法を網羅した記事が少ないなぁと感じたので備忘録的に書いておこうと思います…

AWS re:Invent 2023 Las Vegasの参加報告と生成AI, データ分析, ETL系の新サービスを触ってみる!

NTTドコモ R&Dイノベーション本部 サービスイノベーション部 ビッグデータ基盤担当 3年目社員の小澤です. 普段の業務では, 1日数百TBにわたる弊社のLTE/5GSA基地局の通信制御信信号をリアルタイムで分析可能とし, ネットワークエリア品質向上に役立つデータ…

CNNとメルスペクトログラムを用いて音楽感情認識を試してみた

はじめに はじめまして、NTTドコモ サービスイノベーション部、2年目社員の韓です。 今回、アドベントカレンダーのラスト記事を書かせていただきます!初めてのブログ投稿のため、お手柔らかにお願いいたします<m(__)m> 本記事では、画像認識の分野で良く使われるCNN</m(__)m>…