NTTドコモ サービスイノベーション部の外山です。昨今の生成AIの進化スピードには驚かされます。
本記事では、Gemini 3 Pro、Sora 2、Suno v4.5-all、そしてWindows標準のClipchampを活用して、無料で映像作品作りを始めるための具体的な手順を解説します。
- 全体フロー
- 曲と映像はどちらが先か
- Gemini 3 Pro:シナリオとプロンプトを制作する
- Sora 2:映像素材を生成する
- Suno AI v4.5:楽曲を作成する
- Clipchamp:映像と楽曲の統合および仕上げ
- ビジネス現場での活用
- 公開前に知っておくべき権利関係とAIガバナンス
- まとめ
全体フロー
本記事ではPV制作を想定し、以下の4ステップで進めます。
- 【構成】Gemini 3 Pro:映像シナリオ、歌詞、プロンプト作成
- 【映像】Sora 2:映像生成
- 【楽曲】Suno:楽曲生成
- 【編集】Clipchamp:映像と楽曲を統合
曲と映像はどちらが先か
まず初めに、制作をスムーズに進めるための手順について触れておきますが、MVを作るか、PVを作るかで順番が変わります。
パターン1:MV(Music Video)を作る場合
Music Firstが大事
「楽曲」が主役になります。
音のリズムや歌詞の展開(Aメロ、サビなど)に合わせて映像を切り替えるといい感じに仕上がるため、曲を先に完成させます。
- 手順例:
- Geminiで曲調(Styles)プロンプトを生成する。
- (必要に応じて) Geminiで歌詞を作成する。
- SunoにStylesとLyricsを入力して楽曲を生成する。(Sunoにも歌詞やスタイルを生成する機能がある)
- Geminiに出力された曲・スタイルを入力し、最適なシナリオを決め、15秒毎カットにする。
- シナリオをSora 2に入力し映像素材を作る。
- 最後にClipchampで楽曲・映像を統合する。
- ⚠️ 無料制作における考慮: Sora 2は無料で15秒映像を1日30本(24時間毎のローリング回復)生成できます。ただ、一発で思い通りの映像を生成できるわけではないため、まずは「サビ(30秒程度)」だけを対象に映像を作り始めるのが無難かもしれません。4分程度のフルコーラスを作るには、数日かけて素材を生成する必要があります。
パターン2:PV(Promotion Video)を作る場合
Video Firstが大事
「映像(商品やメッセージ)」が主役になります。
あらかじめ映像の世界観を定めた上で曲を生成しないと、映像と曲がマッチしないPVになってしまう可能性が高くなります。
- 手順例:
- Geminiでシナリオを決め、15秒毎カットにする。
- シナリオをSora 2に入力し映像素材を作る。
- 映像素材をClipchampで繋ぎこんで一本の映像を作成する。
- GeminiにClipchampで統合した映像(もしくはシナリオ)を読み込ませ、映像の雰囲気に合う曲を生成するためのSuno用プロンプトを出力するよう指示する。
- 出力されたプロンプトをSunoに貼り付けて曲を生成する。
- 最後にClipchampで楽曲・映像を統合する。
なお、本稿ではPV制作の流れを前提として進めます。
Gemini 3 Pro:シナリオとプロンプトを制作する
「15秒刻み」でシナリオを構成する
無料版のSora 2の映像生成の最大尺は15秒です。そのため、Gemini 3にシナリオを作らせる段階で、あらかじめ「15秒ごとのカット割り」を指定しておきます。これにより同じテンポでのシナリオ展開を狙います。
【Gemini 3への指示プロンプト例】
あなたはプロの映像監督です。クリームシチューの1分CM(PV)の構成案を作成してください。
# 条件
- どのようなストーリーとして映像を作成すると良いかシナリオを提案してください。
- ホッとする世界観にしてください。
- 30本程度シナリオを検討し、最も良いものを提示してください。
- 全体を『15秒ごと』のシーンに分割してください。
- 各15秒のシーンに対して、具体的な映像描写についてSora 2に入力するためのJSONプロンプトを作成してください。
Google AI プラン比較
高速モードでもシナリオ・プロンプト作成等に支障はありませんので、Gemini 2.5 flashでもこと足りますが、複雑な構成を目指す場合は、Gemini 3 Proに頼った方が良いかもしれません。
| 項目 | Standard | Google AI Pro | Google AI Ultra |
|---|---|---|---|
| 月額料金 | 0円 | 2,900円 | 36,400円 |
| 思考モード with Gemini 3 Pro | 5回/日 | 100回/日 | 200回/日 |
| 高速モード with Gemini 2.5 flash | 制限非公開 | 無制限 | 無制限 |
| コンテキスト長 | 3.2万トークン | 100万トークン | 100万トークン |
詳細なプランはこちら
主なGeminiアップデート
- 2024年12月11日:Gemini 2.0 Flash リリース
- 2025年4月17日:Gemini 2.5 Flash リリース
- 2025年8月1日:Gemini 2.5 Deep Think リリース(Google AI Ultraプランのみ)
- 2025年11月18日:Gemini 3 Pro リリース(推論・マルチモーダル性能が向上)
- 2025年12月4日:Gemini 3 Deep Think リリース(Google AI Ultraプランのみ)
詳細なアップデート情報はこちら
Sora 2:映像素材を生成する
OpenAIが2025年9月に一般公開したSora 2。物理演算の正確さが向上しています。
⚠️ 注意:無料での利用には「招待コード」が必要
Sora 2は一般公開されましたが、アクセス集中を防ぐため、新規の無料ユーザー登録には「招待コード(Invite Code)」が必要な状態が続いています。 (招待コードの取得方法については本記事では割愛します。)
Sora 2 映像生成プロンプトの例
先ほどGeminiに出力させたプロンプトを使用します。
{
"scene_id": "01_The_Cold_Walk",
"duration": "15s",
"visual_description": "Cinematic wide shot of a busy Tokyo street at night during a heavy snowfall. The atmosphere is freezing, with cold blue and cyan lighting tones. A young Japanese woman in a thick wool coat and scarf walks against the wind, looking tired and cold. Her breath forms visible white clouds. Streetlights create a bokeh effect in the background. The camera tracks her from a distance, then slowly zooms in on her shivering expression. High contrast, photorealistic, 8k resolution.",
"camera_movement": "Slow tracking shot with a subtle zoom in.",
"lighting": "Cold street lighting, high contrast, blue hues.",
"subject_action": "Walking against wind, shivering, rubbing hands together."
}

Sora 2 プラン比較
実はChatGPT Plusに課金しても生成本数・解像度・映像の尺は無料プランと変わりません。
1080pや長尺(25秒)を求める場合は、最上位のProプランが必要です。
10秒~25秒までのカットしか生成できないため、長尺の映像を作成するためにはカットを何本かつなげる必要があります。
| 項目 | Free | Plus | Pro |
|---|---|---|---|
| 月額料金 | $0 (要・招待コード) | $20 | $200 |
| 生成本数(24時間ローリング制限*) | 30本/日 | 30本/日 | 100本/日 |
| 映像の尺 | 10秒 or 15秒 / 1カット | 10秒 or 15秒 / 1カット | 最大25秒 / 1カット |
| 解像度 | 最大 720p | 最大 720p | 最大 1080p |
| 商用利用 | 可能 | 可能 | 可能 |
| 透かし | 強制的に有り | 無しを選択可能 | 無しを選択可能 |
詳細なプランはこちら
⚠️「24時間ローリング制限」とは?
多くのサービスで採用されている「毎日0時に全回復」する方式(デイリーリセット)とは異なり、使った分が、それぞれ個別に24時間後に回復する仕組みです。
例:今日の朝10時に5本生成 → 明日の朝10時に5本分回復
アップデート履歴
- 2024年12月9日:Sora 1 リリース(ChatGPT Plus, Proプランのみ)
- 2025年9月30日:Sora 2 リリース
詳細なアップデート情報はこちら
Suno AI v4.5:楽曲を作成する
「楽曲生成AI」として定番のSunoは昨今、音質と表現力が大幅に向上しています。
曲のスタイルを決める
スタイル決めにもGeminiを利用すると便利です。
Sora 2で生成した映像素材が複数ある場合は、後段で説明するClipchampを使って1本に繋ぎこんだうえで入力します。
Geminiのチャット欄にある「+」ボタンから、映像ファイルを選択し、次のプロンプトを入力します。
映像サイズが大きい等でアップロードできない場合は、Geminiで生成したシナリオをそのままアップロードしてください。
Sunoスタイル生成プロンプトの例
あなたは世界的な映像楽曲ディレクターです。 添付した映像ファイルを詳細に分析し、この映像の世界観、感情、カット割りのテンポ感に完璧にマッチするBGMを、楽曲生成AI「Suno」で作成するためのプロンプトを考案してください。
以下の条件とフォーマットに従って出力してください。
# 分析の視点
- 視覚的特徴: 色使い、光の当たり方、場所(都会、自然、宇宙など)から音色を連想する。
- 動きとテンポ: 映像内の被写体の動きやカメラワークの速さから、最適なBPM(テンポ)を割り出す。
- 感情: 映像が視聴者に与える印象(楽しみ、悲しみ、希望、恐怖、興奮など)をジャンルに変換する。# 出力フォーマット
## 映像分析
- コンセプト:
- 推奨ジャンル:
- 推奨BPM:## Suno AI 入力用データ(ここを英語で作成)
Sunoの「Custom Mode」に入力するための形式です。- Title (Idea):
(曲のタイトル案を英語で記述)- Style of Music:
(ジャンル、サブジャンル、使用楽器、ムード、BPMなどを英語のキーワードで、カンマ区切りで具体的かつ詳細に記述してください。インストゥルメンタルにすべきか、ボーカルを入れるべきかを判断し、インストゥルメンタルが良いと判断した場合は"Instrumental"を含めてください。)
例:Cinematic, Cyberpunk, Aggressive, Heavy Bass, Synthesizer, 140bpm, Dark atmosphere- Song Description:
(どのような曲の展開にするか、英語の自然な文章で記述してください。)
例:An epic orchestral track starting with quiet strings, gradually building up with heavy drums to a dramatic climax.## 注意事項
- Style of Music と Song Description / Prompt 併せて1000字以内に収めること。
カスタムモードへの切替
Sunoにログインし、左側の「Create」をクリックします。 画面上部のタブで「Custom Mode」に設定します。
歌詞の入力
必要に応じてLyrics欄に歌詞を貼り付けます。Instrumentalの場合は記載不要です。
Lyrics欄の魔法の杖のような橙色アイコンを押下すると、Sunoが歌詞を生成してくれます。
歌詞を記入する場合、Sunoに構成を理解させるためのmetaタグを記述します。metaタグが無い場合、AIがどこがサビなのか判断できず、平坦な曲になりやすいです。そのため、Geminiで歌詞を作成する場合は下記のフォーマットで出力するよう指示出しするのがおすすめです。
【metaタグの記述例】
[Intro]
(イントロの歌詞や、Instrumentalなどの指定)[Verse]
(Aメロの歌詞)[Chorus]
(サビの歌詞)[Outro]
(終わりの歌詞)
スタイルの指定と生成
Styles欄にGeminiで作成したStyle of MusicとSong Descriptionを入力します。 もしくは単に"Chillhop"などと希望ジャンルを入力し、魔法の杖のような橙色アイコンを押下すると、Sunoが記述を自動で膨らませてくれます。

最後にCreateを押下すると、2曲生成されます。自分が気に入る楽曲と巡り合うには多少試行錯誤が必要かもしれません。

Suno プラン比較
無料プランでも「v4.5-all」が使えるようになりましたが、商業目的で使用する場合は有料プランが必須です。
ブラックフライデー等の不定期イベントで割引が受けられることがあります。
| 項目 | Basic (無料プラン) | Pro Plan | Premier Plan |
|---|---|---|---|
| 月額料金 | $0 | $10 (年払いで$8) | $30 (年払いで$24) |
| クレジット | 50 credits / 日 (5回生成=10曲分) |
2,500 credits / 月 (250回生成=500曲分) |
10,000 credits / 月 (1,000回生成=2,000曲分) |
| 商用利用 | 不可 | 可能 | 可能 |
| 生成モデル | v4.5-all | v5 pro | v5 pro |
| 同時生成数 | 2曲 | 最大10曲 | 最大10曲 |
| 楽曲所有権 | Suno AIに帰属 | ユーザーに帰属 | ユーザーに帰属 |
詳細なプランはこちら
アップデート履歴
- 2024年5月30日:v3.5 リリース&無料開放
- 2024年11月19日:v4 リリース(Pro or Premier Planのみ)
- 2025年5月1日:v4.5 リリース(Pro or Premier Planのみ)
- 2025年9月23日:v5 リリース(Pro or Premier Planのみ)
- 2025年10月21日:v4.5-all 無料開放
詳細なアップデート情報はこちら
Clipchamp:映像と楽曲の統合および仕上げ
素材が揃ったら、最後にこれらを一本の映像に統合します。Windows標準搭載のClipchampは、ブラウザでも動作する映像編集ツールです。
Sora 2で生成した映像に含まれる音声の消去にも使用できます。
なぜ Clipchamp なのか?
- 手軽さ:Windows PCなら標準搭載されており、MacやChromebookでもブラウザで利用できます。
- AI自動キャプション:AIが自動で文字起こしして字幕にしてくれます。
- 操作性:Sora 2で作ったクリップを並べ、Sunoの曲に合わせて長さを調整する作業が直感的に行えます。

Microsoft Clipchamp プラン比較
映像の一本化や楽曲統合、字幕挿入などの基本機能は無料で十分利用でき、Premium版と遜色有りません。
| 項目 | Free | Premium |
|---|---|---|
| 月額料金 | 0円 | 1,374円 (※1) |
| 解像度 | 最大 1080p (HD) | 最大 4K (UHD) |
| 透かし | なし (※2) | なし |
| ストック映像・音声・画像 | 無料素材のみ | プレミアム素材 |
| フィルター・効果 | 無料フィルター・エフェクト | プレミアムフィルター・エフェクト |
| ブランドキット | 利用不可 | 利用可 (ロゴ・フォント・カラーの保存) |
※1 :Microsoft 365 Personal または Familyを契約しているユーザーは無料。
※2 :無料プランに含まれない機能を使用して映像を書き出すと、透かしが入ります。
詳細なプランはこちら
アップデート履歴
- 2021年9月7日:Microsoftにより買収、翌年Windows標準アプリへ
- 2024年4月18日:無音部分の削除実装
- 2024年6月18日:NPU最適化(AI処理の高速化)
- 2024年8月8日:AIノイズ除去、画像の背景削除実装
詳細なアップデート情報はこちら
ビジネス現場での活用
本稿のフローは、実際のビジネスや開発現場でも使えます。動画はテキストや静止画以上の情報量を瞬時に伝達できます。
また、無料のフローなので資金を気にせず何度も試すことが可能です。
使用例
1. 新規プロダクトの「コンセプトムービー」
まだコードを1行も書いていない段階で、プロダクトの世界観を共有するために使えます。
「未来のユーザーによる利用シーン」や「プロダクトが解決する課題(ペインポイント)」を映像化し、企画書やモックだけでは伝わりにくい空気感をステークホルダーに伝え、合意形成を早めます。
2. 自身・自社の「ビジョン・ミッション」の映像化
言葉だけでは抽象的になりがちな「ビジョン・ミッション」を、視覚的なストーリーとして表現します。
Geminiを使用してミッションステートメントなどを映像プロンプトに変換します。
対外向けスライドの冒頭やオープニング動画などで活用できます。
3. 技術仕様やデータフローの「視覚化」
複雑なアーキテクチャや、目に見えないデータの流れを表現し、対外的に理解を促すことができます。
ライトニングトークやカンファレンスで、聴衆を飽きさせないダイナミックなプレゼンが可能になります。
4. 社内イベント・ハッカソンの「ティザー」
社内イベント・ハッカソン等社内行事への参加率を上げるための予告映像に利用できます。
公開前に知っておくべき権利関係とAIガバナンス
生成AIを使えば誰でも簡単にクリエイティブな作品を作れますが、これを対外的に公開したり業務利用したりする際には、個人利用と異なる注意が必要です。
1. 著作権と商用利用
「無料で作れる」ことと「自由に使える」ことはイコールではありません。
- Sunoの出力を商業目的で使用する場合は、Pro Plan以上への加入が必須となります。
- プロンプトで既存の有名アーティストやキャラクター等具体名を指定して生成した場合、出力物が既存の著作物に酷似し、著作権侵害となるリスクがあります。意図的に模倣するプロンプトの業務利用は避けるべきです。
2. 企業におけるAIガバナンスと入力データ
業務で利用する場合、会社として「そのAIツールの利用が許可されているか」を確認する必要があります。
- 自社で許可されていない生成AIに、未発表の製品スペックや社内会議の議事録をそのまま入力しないでください。個人用プランやデフォルト設定では、入力内容がAIの学習データとして利用される可能性があります。そのため、サービスにEnterprise(企業向け)プランが設定されている場合、そちらの利用を推奨します。
- 会社が許可していないツールを個人の判断で業務利用すること(シャドーAI)は、セキュリティリスクとなります。必ず情報システム部門や法務部門のガイドラインに従ってください。
3. フェイク・肖像権とAIラベル
映像生成AIは、実在しない人物をリアルに描けますが、トラブルの元にもなります。
- プロンプトで特定の有名人や、許可を得ていない社員に似せた人物を生成・公開することは、肖像権やパブリシティ権の侵害になる恐れがあります。
- YouTube、Instagram、TikTok等のプラットフォームでは、利用規約により公開時にAI生成コンテンツ(改変または合成されたコンテンツ)へのラベル表示が義務付けられています。
- これらを怠ると、アカウント停止や収益化剥奪(BAN)のリスクがあります。生成AIによる映像を投稿する際は、必ずプラットフォームの指定する方法で「AI生成」であることを申告してください。
4. 意図しない商標・意匠の映り込み
映像生成AIは、学習データに含まれる既存の製品デザインやロゴを再現してしまうことがあります。
- 生成された映像内の人物が着ているTシャツに、有名ブランドに似たロゴが入っていたり、背景に既存のキャラクターが映り込んでいたりする場合があります。これらをそのまま公開すると商標権侵害のリスクがあります。
- 例えば「スポーツカー」と指定しただけなのに、特定のメーカーの車体デザイン(意匠)に酷似した車が生成されることがあります。これらをそのまま公開すると意匠権侵害のリスクがあります。
- 公開前に必ず全フレームを目視確認し、既製品を想起するロゴやデザインがあれば、Clipchamp等でぼかすか、映像素材を生成し直してください。
5. 入力データ側の権利侵害
「AIから出力されたもの」だけでなく、「AIに入力したもの」自体が権利侵害になっていないか注意が必要です。
- 例えばSunoに、既存曲をそのまま入力して「カバー曲」を作ることは、個人的な利用の範囲を超えて公開する場合、著作権法上の許諾手続きが必要になります。
- 生成AIに入力する情報がオリジナルであるか確認する、もしくは自社で権利を持つコンテンツを使用してください。
6. 補償の有無
本記事で紹介した各サービスにおける個人向けプランには、AI生成物が第三者の権利を侵害して訴えられた際の法的補償が含まれておりません。本格的に業務フローに組み込む場合は、法的補償が含まれる企業向けプランの契約をご検討ください。
まとめ
本稿では、無料で映像作品を作るための具体的な手順を解説しました。
- シナリオ:Gemini 3 Proで「15秒刻み」の映像構成&曲のスタイルを作成。
- 映像:Sora 2で30本/日の枠を活用し、15秒カットを根気強く生成する。
- 楽曲:Suno v4.5-all で楽曲を生成。
- 編集:Clipchampで映像・楽曲(音声含む)を統合し、必要に応じてAI字幕を入れる。
2025年の締めくくりに、皆様もぜひオリジナルの映像制作に挑戦してみてください。
免責事項
本記事に掲載されている情報は、すべて2025/12/9時点の情報のものです。
本記事で紹介したフロー、サービスまたはプロンプトを利用した結果生じた、いかなる損害(アカウントの停止・削除、第三者からの権利侵害による訴訟、金銭的損失、データの消失、デバイスの不具合等)について、筆者および所属企業・組織は一切の責任を負いません。ツールの利用およびコンテンツの公開は、全て利用者自身の責任と判断において行ってください。
生成AIの分野は技術の進歩や規約の改定が非常に早いため、以下の点にもご留意ください。
情報の正確性について
各ツールのプラン内容、生成本数制限、商用利用の可否といった仕様は、予告なく変更される場合があります。契約や利用にあたっては、必ず各サービスの公式サイトで最新の利用規約をご確認ください。法務判断について
記事内の法的リスク(著作権、商標権、AIガバナンス等)に関する記述は一般的なガイドラインを示すものであり、法的な助言を構成するものではありません。個別の業務利用や公開判断については、必ず自社法務部門や弁護士等の専門家にご相談の上、自社のコンプライアンス基準に従ってください。