生成AI
はじめに こんにちは。ドコモ・テクノロジ 携帯事業部の樋口、NTTドコモ モバイルイノベーションテック部の坂井、森下です。 昨年に引き続きC2PAについての記事となります。本記事では昨年からの更新点について紹介していきます。 まず世の中の動向ですが、…
TL;DR Document Intelligenceを使ってPDFをテキストと画像に分離した。 テキストと画像を別々のデータとして扱わず、画像のリンクをテキストに組み込んでPDFの文脈を維持するようにした。 テキストと画像を用いた簡単なRAGを作成した。 自己紹介 NTTドコモ …
LLMを活用したテーブルデータの理解技術を探求する、企業の業務改善に役立つ手法を紹介する内容です。プロンプトデザインやRAG手法の詳細を学べます。
本記事で達成すること 今回やること 準備編 Recraft AIとは? WebからRecraft AIを使ってみた Recraft AIのAPIを準備する Unreal PythonとUnreal Editorの準備をする 実装編 Editor Utility WidgetでUIを作る Editor Utility Widgetのイベントグラフを書く R…
LLM の出力を制御する手法であるアクティベーションエンジニアリングを紹介いたします。この手法は、LLM の中間出力にベクトルを加減算し LLM の出力を誘導するユニークなものです。プロンプトエンジニアリングの代替としても利用できます。
LLMの推論およびモデルサービングに利用されるOSSであるvLLMの動きについて、コードを追いながら理解を深めようと試みる。
1. 概要:LLMを使ったマスターデータマネジメント 2. ジャンルメタデータの課題と対策 3. ジャンル集約プロセスの詳細 3.1. 実行プロンプト 3.2. 工夫した点:2階層構造の採用とジャンルの粒度調整 3.3. はまった点:LLMが苦手とする領域での工夫 4. 実施結果 5…
はじめに 本記事をご覧いただきありがとうございます。 NTTドコモ クロステック開発部の画像⽣成AIチーム(福島、井⼿、⼩原、中村圭佑)です。 近年話題の⽣成AIについて、先⽇の記事や昨日の記事でご紹介した通り、Slackアプリの形で画像⽣成AI&VLM(Visi…
はじめに NTTドコモ クロステック開発部の画像生成AIチーム(福島、井手、小原、中村圭佑)です。近年話題の生成AIについて、先日の記事の通り、Slackアプリの形で画像生成AI&VLM(Vision Language Model)の2種類の生成AIが利用可能なシステムを社内向けに…