NTTドコモR&Dの技術ブログです。

KDDCUP2023に入賞したので現地でポスター発表してきました

TL;DR

  • データ分析コンペであるKDD2023にて、ドコモの2チームが入賞(6位、9位)しました。手法詳細はこちらを御覧ください。
  • 本記事では今回参加した国際会議であるKDD2023について、現地の様子をメインに紹介します

はじめに

はじめまして、NTTドコモ サービスイノベーション部の前沖です! ドコモR&Dでは、データマイニングの世界最高峰の国際学術会議であるKDDで開催されているKDDCUPに毎年参加しており、 今年はKDDCUP2023のTask3において、ドコモの2チームが上位入賞(NTT-DOCOMO-LABS-RED 6位、NTT-DOCOMO-LABS-BLUE 9位)しました。 入賞チームは、KDD開催地であるアメリカ ロングビーチでの発表権を得られ、ドコモの2チームから現地参加してポスター発表を行なってきました。 こちらの記事ではKDD2023の概要と現地の様子について紹介していきます。ドコモチームの解法についてはこちらの記事で紹介しているので、興味のある方はぜひ御覧ください。

KDDとKDDCUPとは?

KDDは「知識発見とデータマイニング」(Knowledge Discovery and Data Mining)の略で、データサイエンス分野におけるトップ会議に位置づけられる国際会議の一つです。

KDDの一環として開催されるKDDCUPは、1997年から開催される権威と歴史のある競技形式のコンペティションであり、例年世界的にもトップクラスのデータ分析者が集まる大会となっています。 ドコモは2016年からKDDCUPへの参加を始め、2016年ファイナリスト、2019年1位、2020年複数部門で入賞(最高3位)、2022年入賞(9位)のため、2023年の今回は2年連続で5回目の入賞となります。

KDD2023 基本情報

  • 会議名称
    • 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining
  • 公式HP
  • 開催期間
    • Sunday, August 6, 2023 – Thursday, August 10, 2023
  • 開催地
    • Long Beach Convention Center, California USA (現地開催のみ)
  • 論文数と採択率
    • Research Track: 22.1%
    • Applied Data Science (ADS) Track: 25.4%

KDD2023の会場となったロングビーチコンベンションセンター

今年のKDDは、アメリカのロングビーチコンベンションセンターで開催され、2000人以上の参加者が集まりました。KDDには研究重視のResearch Trackと実応用重視のApplied Data Science (ADS) Track という2種類のTrackが存在しています。 今年はResearch Trackでは313件、ADS Trackでは184件の論文が採択されており、その採択率はResearch Trackが22.1%、ADS Trackが25.4%となっています。ともに採択率は例年20%前後であり、採択されるのは非常に狭き門となっています。

Research TrackとADS Trackの論文の他にも、WorkshopやTutorial、Keynote講演など、様々なプログラムが催され、充実した5日間となっています。

ADS Track採択論文のキーワードクラウド

取り上げられるトピックとしては、ワードクラウドにある通りレコメンドやグラフが多く、それらを中心に連合学習や因果推論、大規模言語モデル(Large Language Models; LLM)などが取り上げられていました。 特に、LLMについてはKeynote講演でも取り上げられており、KDDにおいてもその関心の高さが伺えました。

LLMに関するKeynote講演

ドコモ発表

今回のKDDではドコモから次の3件の発表を行いました。

KDDCUP入賞チームのポスター発表

KDDCUP Workshop会場

私たちの現地参加の主目的であるKDDCUP Workshopでは、KDDCUP2023の優勝チームを含む複数の上位チームから、口頭及びポスターでの解法発表があり、ドコモの2チームはポスター形式での発表を行ってきました。

前沖によるポスター発表

会場はほぼ全員がKDDCUPに実際に参加したメンバーで埋まっていたようでした。このため、参加者の熱量も高くポスター発表では互いの手法について活発な質疑が行われました。最後にはポスター発表者での写真撮影も行われ、和気あいあいとした雰囲気のWorkshopとなりました。

連合学習Workshopでのポスター発表

KDDCUPのドコモチームメンバーである井上は、KDDCUPとは別枠でWorkshopに論文が採択されておりこちらでもポスター発表を行いました。 井上が発表を行ったWorkshopはInternational Workshop on Federated Learning for Distributed Data Miningという連合学習に関するWorkshopであり、 "SparseVFL: Communication-Efficient Vertical Federated Learning Based on Sparsification of Embeddings and Gradients"という題目の論文についてポスター発表を行いました。 これはVertical Federated Learningにおいて、学習時に必要なデータ通信量と訓練時間を削減するロジックを開発した研究です。詳細に興味がある方はOpenReviewに論文が公開されているのでそちらを御覧ください。 このポスター発表は学術的な観点からの技術解説が中心で、研究者の方々との交流が深まりました。

井上によるポスター発表

会場の様子

コンベンションセンター前

開催地となったロングビーチはカラッと晴れており、日本の夏と比べて涼しく過ごしやすい気候でした。日中は30度近くまで上がるものの、日が落ちると20度を下回り肌寒くなるぐらいでした。その一方で、会場では冷房が効きすぎていると感じるほどで私は常に長袖の上着を羽織っていました

コーヒーブレイク

セッションの合間のコーヒーブレイクでは軽食も提供され、参加者同士の交流が活発に行われていました。大ホールには様々な企業のブースが設置され、最新技術の紹介や人材募集が行われていました。

バンケット会場

最終日の前日の夜にはバンケットが開催され、大ホールでビュッフェ形式での食事が提供されました。会場にはテーブルや飲食物に加えてなぜか卓球台も置かれており、終始にぎやかなムードで進行しました。

バンケットでは主にKDD2023の総評が行われました。この中で、大勢の参加者の前でKDDCUPの上位入賞チーム表彰も行われ、KDDにおけるKDDCUPの重要性の高さが感じられました。

次回のKDDはバルセロナでの開催が予定されています。来年はより上位での入賞を目指して頑張っていきたいと思います。

おわりに

本記事では現地の空気感や個人的な印象を中心にKDD2023をレポートしました。 私個人としては今回初めてKDDCUPに参加し入賞して、現地で発表を行う機会が得られたことは非常に大きな刺激となりました。 今回のKDDCUP参加と学会現地参加で得られた知見を活かして、引き続き研究開発に取り組んでいきたいと思います。

ドコモ現地参加メンバーでの集合写真。 左から古山、鈴木、落合、橋本、前沖、井上。