NTTドコモR&Dの技術ブログです。

生成AI

2024年のC2PA(コンテンツの来歴証明技術)の進化を追う ~C2PA 2.0&2.1の更新サマリ解説~

はじめに こんにちは。ドコモ・テクノロジ 携帯事業部の樋口、NTTドコモ モバイルイノベーションテック部の坂井、森下です。 昨年に引き続きC2PAについての記事となります。本記事では昨年からの更新点について紹介していきます。 まず世の中の動向ですが、…

Document Intelligenceを活用したPDFのRAGスターターセット

TL;DR Document Intelligenceを使ってPDFをテキストと画像に分離した。 テキストと画像を別々のデータとして扱わず、画像のリンクをテキストに組み込んでPDFの文脈を維持するようにした。 テキストと画像を用いた簡単なRAGを作成した。 自己紹介 NTTドコモ …

テーブルデータの取り扱い方 (LLM編)

LLMを活用したテーブルデータの理解技術を探求する、企業の業務改善に役立つ手法を紹介する内容です。プロンプトデザインやRAG手法の詳細を学べます。

Recraft AI × Unreal Pythonでテクスチャ・マテリアル自動生成を試みる

本記事で達成すること 今回やること 準備編 Recraft AIとは? WebからRecraft AIを使ってみた Recraft AIのAPIを準備する Unreal PythonとUnreal Editorの準備をする 実装編 Editor Utility WidgetでUIを作る Editor Utility Widgetのイベントグラフを書く R…

LLM を内部から操るアクティベーションエンジニアリングの世界

LLM の出力を制御する手法であるアクティベーションエンジニアリングを紹介いたします。この手法は、LLM の中間出力にベクトルを加減算し LLM の出力を誘導するユニークなものです。プロンプトエンジニアリングの代替としても利用できます。

📖 vLLMのコードを読んでみよう

LLMの推論およびモデルサービングに利用されるOSSであるvLLMの動きについて、コードを追いながら理解を深めようと試みる。

LLMで爆速改善!たった3人で始めるマスターデータマネジメント

1. 概要:LLMを使ったマスターデータマネジメント 2. ジャンルメタデータの課題と対策 3. ジャンル集約プロセスの詳細 3.1. 実行プロンプト 3.2. 工夫した点:2階層構造の採用とジャンルの粒度調整 3.3. はまった点:LLMが苦手とする領域での工夫 4. 実施結果 5…

画像生成AIを活用した社内イベントを開催しました(全社編)

はじめに 本記事をご覧いただきありがとうございます。 NTTドコモ クロステック開発部の画像⽣成AIチーム(福島、井⼿、⼩原、中村圭佑)です。 近年話題の⽣成AIについて、先⽇の記事や昨日の記事でご紹介した通り、Slackアプリの形で画像⽣成AI&VLM(Visi…

画像生成AIを活用した社内イベントを開催しました(部内編)

はじめに NTTドコモ クロステック開発部の画像生成AIチーム(福島、井手、小原、中村圭佑)です。近年話題の生成AIについて、先日の記事の通り、Slackアプリの形で画像生成AI&VLM(Vision Language Model)の2種類の生成AIが利用可能なシステムを社内向けに…