NTTドコモR&Dの技術ブログです。

生成AI

【Unity × Gemini】XRグラス「MiRZA」と「File API」 で作るカメラ画像 + RAGのAI作業ガイドアプリ

※ 本記事は 2026/3/31 以前にNTTコノキューにて記載した記事になります 記事まとめ 本記事はNTTコノキュー アドベントカレンダー2025の、12/19公開記事になります。 はじめに 開発の背景:RAGとグラスの必要性 MiRZA(ミルザ)とは RAG/Google File APIとは 本…

Android XR取り組み紹介(画像認識アプリ編)

※ 本記事は 2026/3/31 以前にNTTコノキューにて記載した記事になります 0.はじめに 1.開発環境 2.実装手順 2.1 画面の作成 2.2 Geminiのモデルのインスタンス作成 2.3 Geminiへ画像データを送信する 2.5 URIからBitmapに変換する 2.6 画像が選択された時のラ…

NTTドコモのGitHub Copilot Businessの運用について

NTTドコモのGitHub Copilot導入事例。開発生産性を最大化しつつ、セキュリティとコストのガバナンスをどう両立させたのか?大企業ならではの具体的な運用戦略をご紹介します。

Android XR取り組み紹介(デモアプリ Geminiチャットbot編)

※ 本記事は 2026/3/31 以前にNTTコノキューにて記載した記事になります 0.はじめに 1.開発環境 2.実装手順 2.1 画面の作成 2.2 パーミッションの実装 2.2.1 マニフェストファイルの実装 2.2.2 パーミッションが許可されているか変数として保存 2.2.3 パーミ…

Android XR開発にAIを導入してみた所感

※ 本記事は 2026/3/31 以前にNTTコノキューにて記載した記事になります 0.はじめに 1.使用したもの 2.実際に活用した所感 2.1 チャットでの対話 2.2 コードの自動保管機能 2.3 レビュー機能 3.おわりに 0.はじめに この記事はNTTコノキュー アドベントカレン…

Android XR取り組み紹介 Geminiを使ってデモアプリのローカライゼーション対応をやってみる

※ 本記事は 2026/3/31 以前にNTTコノキューにて記載した記事になります 0.はじめに 1.言語設定用のUIの実装 2.翻訳する 2.1 言語情報を取得する 2.2 実際に翻訳する 2.2.1 Geminiのインスタンス生成 2.2.2 Geminiに翻訳してもらう 3.おわりに 0.はじめに こ…

言語処理学会(NLP2025)ワークショップ「大規模言語モデルのファインチューニング技術と評価」の上位解法の紹介

TL;DR 言語処理学会(NLP2025)併設ワークショップである「大規模言語モデルのファインチューニング技術と評価」(コンペ)が開催されました。 「大規模言語モデルのファインチューニング技術と評価」コンペの上位1~3位までの解法を紹介します。 はじめに NTT…

RAG精度向上を目指したCRAGコンペ上位解法の紹介

TL;DR RAGの精度を競うCRAG Comprehensive RAG Benchmark Challenge(CRAGコンペ)がKDDCUP 2024にて開催されました。 CRAGコンペの上位1-3位チームの解法を紹介します。 はじめに NTTドコモ クロステック開発部 鈴木明作です! 大規模言語モデル(Large Langua…

2024年のC2PA(コンテンツの来歴証明技術)の進化を追う ~C2PA 2.0&2.1の更新サマリ解説~

2025年のアドベントカレンダーで、C2PAにおける最新動向およびSpecificationのバージョンアップ(v2.2)に伴う内容を紹介しています。最新の記事はこちらを参照ください はじめに こんにちは。ドコモ・テクノロジ 携帯事業部の樋口、NTTドコモ モバイルイノベ…

Document Intelligenceを活用したPDFのRAGスターターセット

TL;DR Document Intelligenceを使ってPDFをテキストと画像に分離した。 テキストと画像を別々のデータとして扱わず、画像のリンクをテキストに組み込んでPDFの文脈を維持するようにした。 テキストと画像を用いた簡単なRAGを作成した。 自己紹介 NTTドコモ …

テーブルデータの取り扱い方 (LLM編)

LLMを活用したテーブルデータの理解技術を探求する、企業の業務改善に役立つ手法を紹介する内容です。プロンプトデザインやRAG手法の詳細を学べます。

Recraft AI × Unreal Pythonでテクスチャ・マテリアル自動生成を試みる

本記事で達成すること 今回やること 準備編 Recraft AIとは? WebからRecraft AIを使ってみた Recraft AIのAPIを準備する Unreal PythonとUnreal Editorの準備をする 実装編 Editor Utility WidgetでUIを作る Editor Utility Widgetのイベントグラフを書く R…

LLM を内部から操るアクティベーションエンジニアリングの世界

LLM の出力を制御する手法であるアクティベーションエンジニアリングを紹介いたします。この手法は、LLM の中間出力にベクトルを加減算し LLM の出力を誘導するユニークなものです。プロンプトエンジニアリングの代替としても利用できます。

📖 vLLMのコードを読んでみよう

LLMの推論およびモデルサービングに利用されるOSSであるvLLMの動きについて、コードを追いながら理解を深めようと試みる。

LLMで爆速改善!たった3人で始めるマスターデータマネジメント

1. 概要:LLMを使ったマスターデータマネジメント 2. ジャンルメタデータの課題と対策 3. ジャンル集約プロセスの詳細 3.1. 実行プロンプト 3.2. 工夫した点:2階層構造の採用とジャンルの粒度調整 3.3. はまった点:LLMが苦手とする領域での工夫 4. 実施結果 5…

画像生成AIを活用した社内イベントを開催しました(全社編)

はじめに 本記事をご覧いただきありがとうございます。 NTTドコモ クロステック開発部の画像⽣成AIチーム(福島、井⼿、⼩原、中村圭佑)です。 近年話題の⽣成AIについて、先⽇の記事や昨日の記事でご紹介した通り、Slackアプリの形で画像⽣成AI&VLM(Visi…

画像生成AIを活用した社内イベントを開催しました(部内編)

はじめに NTTドコモ クロステック開発部の画像生成AIチーム(福島、井手、小原、中村圭佑)です。近年話題の生成AIについて、先日の記事の通り、Slackアプリの形で画像生成AI&VLM(Vision Language Model)の2種類の生成AIが利用可能なシステムを社内向けに…