はじめに
NTTドコモ クロステック開発部の画像生成AIチーム(福島、井手、小原、中村圭佑)です。近年話題の生成AIについて、先日の記事の通り、Slackアプリの形で画像生成AI&VLM(Vision Language Model)の2種類の生成AIが利用可能なシステムを社内向けに提供しました。
画像生成AIを使って思い通りの画像を生成するにはコツがいること、また世の中では画像生成AIの不適切な利用も散見されることから、このシステムの提供に際して正当な画像生成AIの利用促進を目的とした社内向けのイベントを開催しました。本記事では、こちらのイベントの様子をご紹介いたします。
前編となる本記事では我々の所属する部署内で実施したイベントについて記載しますが、明日公開予定の後編ではドコモの全社に向けて同様のイベントを開催した様子もご紹介いたします!
社内向けの画像生成システム(画像生成・VLM基盤)の概要
先日の記事の通り、Slack上でBotとの対話形式で画像生成AI・VLMが利用可能な社内システムを提供しています。本イベントでは、このシステムの画像生成AIを利用しました。画像生成モデルとしてはAmazon Titan Image Generatorを利用しています。
イベント内容①:画像生成AIの活用方法のハンズオン
本イベントを開催した当時は、はじめて画像生成AIを使うという方も多かったため、基本的なプロンプトの書き方からレクチャーを行いました。画像生成AIのプロンプトは呪文と呼ばれることもありますが、Chat-GPT等のテキスト生成AIとは異なり漠然とした指示から開始するようなことが難しく、自分が描きたいイメージを言葉で具現化して与えてあげる必要があります。
イベント中には以下のスライドのように、描きたいものを決める→画風や画角などの詳細情報を追記していく、といったゼロからの基本的なプロンプトの組み方から、Chat-GPT等のLLMを活用してプロンプトをブラッシュアップする、といった応用的な組み方までハンズオン形式で利用者へ紹介しました。
また画像生成AIの不適切な利用を避けるため、著作権や肖像権を侵害しないための画像生成AIの利用ルールの浸透も本イベントの目的の一つとして実施しています。
イベント内容②:画像生成AIを用いたコンペティションの開催
実際に皆さんに画像生成AIを使ってもらうイベントとして、コンペティション形式で以下の2つのお題に取り組んでもらいました。
1. 来客者用の応接室に飾る画像を作ってみよう
会社の応接室って、何か「それっぽい」絵が飾られていますよね。そういった画像こそ生成AIの得意分野ということで、部のみなさんに部署の応接室に飾りたい画像を作ってもらいました!
多種多様な画像を生成いただきまして、ドコモの本業である通信事業者っぽい画像とか、ドコモの創設者(っぽい貫禄の人というだけの偽者)の画像とか、思いもよらない画像もありました。
参加者同士での投票の結果、以下の3件が入賞となりました!
実際に額縁に入れて、サービスイノベーション部の応接室にも飾られています。もし打ち合わせなどで私たちの部署にご来訪される方がいらっしゃいましたら、注目してみてください。
2. お題の画像に出来るだけ近い画像をプロンプトを工夫して作ってみよう
頭の中にイメージした画像を、うまく言語化して画像生成AIを用いて作成する練習として、以下のお題画像に出来るだけ近しい画像をプロンプトのみで作ってもらうお題で競ってもらいました。
運営サイドでは、色々試した上で以下のような画像を作って「近いものが出来た!」と満足していたのですが・・
実際の参加者の皆さんからは、20分そこらで以下のような画像をプロンプトだけで作成頂きました!映っている物体だけでなく、画角までかなり元画像に近しいものが生成できています。一方で、文字を崩さずに画像中に描画するのは(当時の画像生成AIモデルでは特に)困難だったことも見て取れます。
余談ですが、今回のように参照する画像があって近しい派生画像を作成したい場合、プロンプトを頑張って作るtxt2img(入力がテキスト、出力が画像)よりもimg2img(入力が画像、出力も画像)の画像生成AIを用いるのが一般的です。我々が利用している画像生成AIモデルであるAWS Bedrock Titanでは画像コンディショニングという機能で実現が可能です。
こちらの機能では、入力となる参照画像を用意して、作成する画像に描きたい内容をプロンプトで表現することでimg2imgの生成ができます。 例えば、今回のコンペで利用した参照画像から文字部分を消した派生画像を生成したい場合、次のように文字の内容には一切触れないプロンプトで画像コンディショニングを行うと、以下のような派生画像が生成できました。
a vibrant travel-themed illustration. It features a bright orange vintage car on a beach, with a surfboard and various vacation items stacked on its roof. The items include yellow suitcases, a beach ball, a guitar, and a hat. The scene is set against a clear blue sky and ocean backdrop, creating a cheerful and summery atmosphere. The overall design is colorful and eye-catching, evoking a sense of adventure and excitement for summer travel
まとめ
今回は画像生成AIを用いた部内イベントの模様について紹介いたしました。
参加者からのフィードバックとしては、我々はR&Dの部署なので画像生成AIを使うのが初めてだった!という方は少なかったものの、上手なプロンプトの書き方に苦労していたので嬉しかったという方もいらっしゃれば、生成AI画像をどのようなルールの下で使えば安全なのか懸念していたので、適正な使い方が理解できて助かったという方までいらっしゃいました。
後編では全社にて画像生成AIを活用したイベントの開催模様についても紹介いたしますので、ぜひそちらもあわせてご覧ください!
引用
本記事で利用した画像は以下より引用しました。