はじめに
本記事をご覧いただきありがとうございます。 NTTドコモ クロステック開発部の画像⽣成AIチーム(福島、井⼿、⼩原、中村圭佑)です。 近年話題の⽣成AIについて、先⽇の記事や昨日の記事でご紹介した通り、Slackアプリの形で画像⽣成AI&VLM(Vision Language Model)の2種類の⽣成AIが利⽤可能なシステムを社内向けに提供しました。
画像⽣成AIを使って思い通りの画像を⽣成するにはコツがいること、また世の中では画像⽣成AIの不適切な利⽤も散⾒されることから、このシステムの提供に際して、正当な画像⽣成AIの利⽤促進を⽬的とした全社向けのイベントを実施しました。 当初の予定では第1回画像生成コンペ (Image Generation Competition) を定員50名で実施する予定でしたが、想定以上の参加申込があったため急遽2回に分けて開催しました。
本記事では、昨日の記事の後編として、NTTドコモ全社に向けて開催したイベントの様⼦をご紹介いたします。
社内向けの画像⽣成システム(画像⽣成・VLM基盤)の概要
先⽇の記事で紹介した通り、Slack上でBotとの対話形式で画像⽣成AI・VLMが利⽤可能な社内システムを提供しています。 本イベントでは、このシステムの画像⽣成AIを利⽤しました。 画像⽣成モデルとしてはAmazon Titan Image Generatorを利⽤しています。
参考として、以下の画像はそのシステムを筆者が実際に使用して画像を生成したときの画面です。
余談ですが、図2では猫の画像を生成しましたが、画像中の筆者やシステム(ImgVLM_prod)のアイコンも生成画像を利用しています。
全社向け画像生成コンペティション
ここからは、正当な画像⽣成AIの利⽤促進を⽬的とした全社向けのイベントの内容をご紹介いたします。
イベント内容①:画像⽣成AIの活⽤⽅法のハンズオン(各回共通)
LLM付加価値基盤という社内向けLLM(大規模言語モデル)サービスの浸透もあり、NTTドコモ社内でも業務にテキスト生成AIを活用する人も以前に比べて大きく増えてきました。 しかし、それでも画像⽣成AIをはじめて使うという⽅も多いため、画像生成AI向けの基本的なプロンプトの書き⽅等のレクチャーを各イベントの冒頭で⾏いました。 画像⽣成AIのプロンプトは「呪⽂」と呼ばれることもありますが、ChatGPT等のテキスト⽣成AIとは異なり、漠然とした指⽰から開始するようなことが難しいため、⾃分が描きたいイメージを⾔葉で具現化して与えてあげる必要があります。 イベント中には、図3のように、描きたいものを決める→画⾵や画⾓などの詳細情報を追記していく、といったゼロからの基本的なプロンプトの組み⽅から、ChatGPT等のLLMを活⽤してプロンプトをブラッシュアップするといった応⽤的な組み⽅まで、ハンズオン形式で参加者へ紹介しました。
また画像⽣成AIの不適切な利⽤を避けるため、著作権や肖像権等を侵害しないための画像⽣成AIの利⽤ルールの浸透も本イベントの⽬的の⼀つとしました。
イベント内容②:【第1回】画像⽣成コンペティションの開催
実際に皆さんに画像⽣成AIを使ってもらうイベントとして、【第1回】画像⽣成コンペティションではコンペティション形式で以下の2つのお題に取り組んでもらい、生成した画像に対して参加者同士で投票してもらってTop3を決めました。
1. NTTドコモの新たなブランドスローガン「つなごう。驚きを。幸せを。」のイメージ画像を作ってみよう
多くの企業にはブランドスローガンがあり、それらは企業が顧客に伝えたい世界観やメッセージを表しています。 そして、「百聞は一見に如かず」という言葉の通り、言葉よりも目で見てわかる画像の方が伝わりやすい場合もあります。 ということで、記念すべき第1回画像生成コンペの最初のテーマとして、NTTドコモのブランドスローガンのイメージ画像の生成に挑戦してもらいました!
ちなみに、NTTドコモのブランドスローガンイメージ画像はこちらです。
参加者それぞれが生成した画像に対して参加者同士で投票してもらった結果、以下の4件が入賞となり、うち2件は接戦の末の同率1位となりました!
抽象度の高いテーマでしたが、参加者の皆様が生成した画像は全体的に人と人を繋いだ温かい画像が多く、優しい人が多いNTTドコモらしい画像が多かったです。
2. 未来のデバイスやスマートフォンを考案しよう
何かをブレストしたり、あるいは新しいアイディアをチーム内で提案する時に、言葉での説明も大事ですが、インパクトがあったり具体的にイメージできる画像の準備も大事な場合があります。 そこで、続いてのお題として、新しいアイディアを提案するときのイメージ画像を生成する練習として、参加者のイメージする未来のデバイスやスマートフォンのイメージ画像を生成してもらいました!
参加者それぞれが生成した画像に対して参加者同士で投票してもらった結果、以下の4件が入賞となり、うち2件は接戦の末の同率2位となりました!
どれも未来的で素晴らしいデバイスですね! このようなデバイスが一般化している未来が待ち遠しいです。
3. 総合優勝
2つのお題の生成結果のうち最も投票数が多かった以下の画像を、【第1回】画像⽣成コンペティションの総合優勝といたしました!
第2回
参加申し込みが想定以上だったことから急遽開催が決まった【第2回】画像⽣成コンペティションでは、以下の2つのお題に取り組んでもらい、生成した画像に対して参加者同士で投票してもらいTop3を決めました。
1. 参加者が考える新たな自社キャラクターを考えよう
NTTドコモに限らず、キャリアは魅力的なキャラクターを自社アピールに活用しています。 そこで、今回のお題では、参加者が考える新たな自社キャラクターを生成してもらいました!
参加者の皆様が生成した画像はどれもかわいいキャラクターばかりでしたが、参加者同士での投票の結果、以下の3件が入賞となりました!
入賞しただけあって、どれもかわいいキャラクターですね! 筆者は左端のキャラクターがお気に入りです。
2. 3年後の自分のキャリア(働き方)や参加者ご自身の部署のイメージを表現しよう
自分のキャリアについてしっかり考えている人は、その考えをもとに異動したい部署や働き方を工夫していることがあり、参考になることが多いと思います。 そこで、最後のお題は、3年後の自分のキャリア(働き方)やご自身の部署のイメージを表現してもらいました!
漠然としたイメージをプロンプトとして画像を生成すると、運営側がお試しで生成した図8の画像のように、未来感があまりないものになってしまいます。 そのため、しっかりした画像を生成するには参加者のイメージをきちんと言語化することが重要で意外と結構大変だと思います。
参加者が試行錯誤しながら生成した画像のうち、以下の3件が入賞となりました!
こうして見てみると、参加者それぞれの価値観が表れています。 特に、2件はいわゆるノマドワーカー的な、場所にとらわれない自由な働き方をイメージしているようです。 筆者は在宅リモート中心の働き方なのですが、一日中部屋で仕事をしていると息が詰まりそうになることもあるので、私もこのような綺麗な砂浜で海を見ながら働いてみたいです。 残りの1件は、近未来的な会議室での議論を表現しているようです。 リモートと出社のどちらが良いかという議論はありますが、こういう会議室があると出社のモチベーションが上がりそうです。
3. 総合優勝
2つのお題の生成結果のうち最も投票数が多かった以下の画像を、【第2回】画像⽣成コンペティションの総合優勝といたしました!
まとめ
今回は画像⽣成AIを⽤いた部内イベントの模様について紹介いたしました。 今回のイベントでは全国の支社・支店やNTTドコモ関連企業などから広く参加者を募ったことで、さまざまなバックグラウンドの方にご参加いただけただけでなく、アンケートにおける満足度(5段階評価)が第1回が4.88、第2回が4.70と非常に好評価でしたので、主催者の一人として大変嬉しく思います。 また、各参加者からのフィードバックとしては、画像生成AIの存在は知っていたが初めて触ったというお声や、実際に社内資料作成時に画像生成を活用したというご報告をいただけました。 これにより、本基盤を開発した目的の一つである、社内で気軽に画像生成を業務利用できるようにすることの一助になれたと思います。
また、NTTドコモでは画像生成・物体検出・姿勢推定・一般物体認識・特定物体認識・文字認識・類似画像検索など、多岐にわたるAI技術の研究開発に取り組んでいます。 インターンや新卒・キャリア採用を積極的に実施しておりますので、ご興味を持たれた方はぜひ以下のリンクから詳細をご覧ください。
最後までお読みいただき、ありがとうございました。
連絡先
NTTドコモ R&Dイノベーション本部 クロステック開発部 複合価値創出担当 画像認識チーム
- 福島悠介 yuusuke.fukushima.fw@nttdocomo.com
- 井手秀徳 hidenori.ide.vw@nttdocomo.com
- 小原裕輝 yuuki.kohara.du@nttdocomo.com
- 中村圭佑 keisuke.nakamura.fc@nttdocomo.com