TL;DR
- データ分析コンペであるKDD2023にて、ドコモの2チームが入賞(6位、9位)しました。手法詳細はこちらを御覧ください。
- 本記事では今回参加した国際会議であるKDD2023について、現地の様子をメインに紹介します
はじめに
はじめまして、NTTドコモ サービスイノベーション部の前沖です! ドコモR&Dでは、データマイニングの世界最高峰の国際学術会議であるKDDで開催されているKDDCUPに毎年参加しており、 今年はKDDCUP2023のTask3において、ドコモの2チームが上位入賞(NTT-DOCOMO-LABS-RED 6位、NTT-DOCOMO-LABS-BLUE 9位)しました。 入賞チームは、KDD開催地であるアメリカ ロングビーチでの発表権を得られ、ドコモの2チームから現地参加してポスター発表を行なってきました。 こちらの記事ではKDD2023の概要と現地の様子について紹介していきます。ドコモチームの解法についてはこちらの記事で紹介しているので、興味のある方はぜひ御覧ください。
KDDとKDDCUPとは?
KDDは「知識発見とデータマイニング」(Knowledge Discovery and Data Mining)の略で、データサイエンス分野におけるトップ会議に位置づけられる国際会議の一つです。
KDDの一環として開催されるKDDCUPは、1997年から開催される権威と歴史のある競技形式のコンペティションであり、例年世界的にもトップクラスのデータ分析者が集まる大会となっています。 ドコモは2016年からKDDCUPへの参加を始め、2016年ファイナリスト、2019年1位、2020年複数部門で入賞(最高3位)、2022年入賞(9位)のため、2023年の今回は2年連続で5回目の入賞となります。
KDD2023 基本情報
- 会議名称
- 29th ACM SIGKDD Conference on Knowledge Discovery and Data Mining
- 公式HP
- 開催期間
- Sunday, August 6, 2023 – Thursday, August 10, 2023
- 開催地
- Long Beach Convention Center, California USA (現地開催のみ)
- 論文数と採択率
- Research Track: 22.1%
- Applied Data Science (ADS) Track: 25.4%
今年のKDDは、アメリカのロングビーチコンベンションセンターで開催され、2000人以上の参加者が集まりました。KDDには研究重視のResearch Trackと実応用重視のApplied Data Science (ADS) Track という2種類のTrackが存在しています。 今年はResearch Trackでは313件、ADS Trackでは184件の論文が採択されており、その採択率はResearch Trackが22.1%、ADS Trackが25.4%となっています。ともに採択率は例年20%前後であり、採択されるのは非常に狭き門となっています。
Research TrackとADS Trackの論文の他にも、WorkshopやTutorial、Keynote講演など、様々なプログラムが催され、充実した5日間となっています。
取り上げられるトピックとしては、ワードクラウドにある通りレコメンドやグラフが多く、それらを中心に連合学習や因果推論、大規模言語モデル(Large Language Models; LLM)などが取り上げられていました。 特に、LLMについてはKeynote講演でも取り上げられており、KDDにおいてもその関心の高さが伺えました。
ドコモ発表
今回のKDDではドコモから次の3件の発表を行いました。
KDDCUP 2023 入賞発表(ポスター)
- NTT-DOCOMO-LABS-REDチーム論文: Word Filtering Approach for Next Product Title Generation
- NTT-DOCOMO-LABS-BLUEチーム論文: Prediction of next product title by simple deletion of the last word
International Workshop on Federated Learning for Distributed Data Mining 採択論文(ポスター)
KDDCUP入賞チームのポスター発表
私たちの現地参加の主目的であるKDDCUP Workshopでは、KDDCUP2023の優勝チームを含む複数の上位チームから、口頭及びポスターでの解法発表があり、ドコモの2チームはポスター形式での発表を行ってきました。
会場はほぼ全員がKDDCUPに実際に参加したメンバーで埋まっていたようでした。このため、参加者の熱量も高くポスター発表では互いの手法について活発な質疑が行われました。最後にはポスター発表者での写真撮影も行われ、和気あいあいとした雰囲気のWorkshopとなりました。
#KDD2023 A massive thank you to everyone who attended this year's KDD Cup Workshop! Thrilled to have over 100 attendees join. The enthusiasm and insights from the teams and the audience were truly inspiring. Kudos to all for making it a memorable event! @AmazonScience pic.twitter.com/7Vk7695TbO
— Wei Jin (@weisshelter) 2023年8月12日
連合学習Workshopでのポスター発表
KDDCUPのドコモチームメンバーである井上は、KDDCUPとは別枠でWorkshopに論文が採択されておりこちらでもポスター発表を行いました。 井上が発表を行ったWorkshopはInternational Workshop on Federated Learning for Distributed Data Miningという連合学習に関するWorkshopであり、 "SparseVFL: Communication-Efficient Vertical Federated Learning Based on Sparsification of Embeddings and Gradients"という題目の論文についてポスター発表を行いました。 これはVertical Federated Learningにおいて、学習時に必要なデータ通信量と訓練時間を削減するロジックを開発した研究です。詳細に興味がある方はOpenReviewに論文が公開されているのでそちらを御覧ください。 このポスター発表は学術的な観点からの技術解説が中心で、研究者の方々との交流が深まりました。
会場の様子
開催地となったロングビーチはカラッと晴れており、日本の夏と比べて涼しく過ごしやすい気候でした。日中は30度近くまで上がるものの、日が落ちると20度を下回り肌寒くなるぐらいでした。その一方で、会場では冷房が効きすぎていると感じるほどで私は常に長袖の上着を羽織っていました
セッションの合間のコーヒーブレイクでは軽食も提供され、参加者同士の交流が活発に行われていました。大ホールには様々な企業のブースが設置され、最新技術の紹介や人材募集が行われていました。