NTTドコモR&Dの技術ブログです。

画像処理

AI未経験エンジニアのG検定合格体験記

非エンジニアが語るG検定合格までの実体験。AI基礎知識を学ぶための効果的な勉強法と合格後の変化を共有します。

試すのは簡単、仕上げるのは難しい。AIエージェント×Playwright MCPを使ったE2Eテストアプリの開発と苦労

自己紹介 NTTドコモ データプラットフォーム部(以下DP部)矢野です。 我々が提供している社内データ活用プラットフォームPochiでは、特定の部署に閉じない様々な部門のメンバが日々アプリを開発しています。 このPochiでのアプリ開発者を支援する取り組みと…

MIRU2025 展示紹介 〜スマート農業、映像コンテンツ解析、自動運転バス遠隔監視システムの研究開発と社会実装〜

はじめに こんにちは、クロステック開発部の水野、春山です。 株式会社NTTドコモは2025年7月29日〜8月1日に開催される「画像の認識・理解シンポジウム MIRU2025@国立京都国際会館」のスポンサーとして企業展示に出展いたします。 ブースは企業展示会場のG12…

インターン体験記 in 画像認識チーム

こんにちは!NTTドコモ クロステック開発部の画像認識チームです。 NTTドコモでは、8/26 ~ 9/6に現場受け入れ型インターンシップを実施しました。本インターンシップはリモートと現地のハイブリッドの実施となり、参加者はチームに配属された後、2週間の業務…

イベントカメラで作る高速マーカーシステム「Bicode」:国際会議ICRA2024で発表した手法を紹介

NTTドコモ R&D Advent Calendar 2024 の22日目の記事です。 はじめに みなさまこんにちは,NTTドコモ クロステック開発部の北出です. 12月恒例の イベント NTTドコモ R&D Advent Calendarをお楽しみいただけておりますでしょうか. 今回は,光の変化という …

CAN’t communicate?! - CAN のススメとトラブル解決への道-

本記事では組み込み(ハード寄り)を触り始めた方を対象とし、業務の 1 つである NVIDIA Jetson を使 った農業ロボットの紹介と、最近発生したトラブル事例をご紹介します。

画像生成AIを活用した社内イベントを開催しました(全社編)

はじめに 本記事をご覧いただきありがとうございます。 NTTドコモ クロステック開発部の画像⽣成AIチーム(福島、井⼿、⼩原、中村圭佑)です。 近年話題の⽣成AIについて、先⽇の記事や昨日の記事でご紹介した通り、Slackアプリの形で画像⽣成AI&VLM(Visi…

画像生成AIを活用した社内イベントを開催しました(部内編)

はじめに NTTドコモ クロステック開発部の画像生成AIチーム(福島、井手、小原、中村圭佑)です。近年話題の生成AIについて、先日の記事の通り、Slackアプリの形で画像生成AI&VLM(Vision Language Model)の2種類の生成AIが利用可能なシステムを社内向けに…

タッチ操作できないディスプレイをタッチ操作できるようにした

1. はじめに 2. つくったものについて 3. 実装 3.1. システム概要 3.2. ディスプレイの準備 3.3. クライアント(Android)側の実装 3.4. ホスト(Windows)側の実装 3.4.1. 座標変換 3.4.2. マウス操作 4. デモ 5. おわりに 1. はじめに 本記事はNTTドコモR&…

新規ビジネスアイデア創出のため、社内でVLMと画像生成が気軽に使えるSlackベースのシステムを作ってみた

はじめに NTTドコモ クロステック開発部の福島&井手&小原&中村圭佑です。普段の業務では画像認識や生成AIに関する研究開発を行っています。今回は社内でVLMと画像生成が気軽に使えるシステムを作ってみたので紹介したいと思います。Slackをインターフェース…

筋トレをサポートするAIトレーナーを作ってみた

はじめに こんにちは。 @dcm_haruyama です。 この記事は、NTTドコモ R&D Advent Calendar 2023 24日目の記事です。 良いクリスマスイブをお過ごしでしょうか。 今日のテーマは筋トレということで、年末年始の運動不足解消にピッタリですね! 私のアドベント…

3D Gaussian Splattingの動かし方(データセットの作成から学習結果のレンダリングまで)

本記事はNTTドコモ Advent Calendar 2023の21日目の記事です。 TL;DR はじめに 三次元再構成とは 3D Gaussian Splattingとは Blenderによるデータセットの作成 Blenderのインストール Blenderファイルのダウンロード Blenderでのレンダリング 3D Gaussian Sp…

トンカツの3Dを生成してみた ~テキストや単体画像からの3D生成の紹介~

はじめに NTTドコモ サービスイノベーション部の小原です。生成AI関連の業務する一方で、3D処理関係の手法に関して個人的興味を持っているため、最近はこの二つの要素を合わせた3D表現の生成(本記事では3D生成と呼ぶ)に関して調査しております。 その一環と…

Amazon BedrockのAPIとGradioで簡単なUIを作って画像生成してみた

はじめに こんにちは。NTTドコモ サービスイノベーション部の中村圭佑です。普段の業務では画像認識に関する研究開発を行っています。具体的には画像生成AI、農業AI等の研究開発に取り組んでいます。今回はAWSの生成系AIサービスである「Amazon Bedrock」と…

拡散モデルに至るまでの画像生成AIについて解説をしてみた

はじめに NTTドコモ サービスイノベーション部の中村圭佑です。普段の業務では画像認識に関する研究開発を行っています。今回は話題となっている画像生成について、社内勉強会にて発表を行いましたので、発表スライドとともにご紹介できればと思います。詳し…

インターンシップ体験記:街中の文字を認識してみた!~大阪の道頓堀と横浜の中華街は似てる?~

NTTドコモでは2/6~2/17の2週間で現場受け入れ型インターンシップを実施しました! 現場受け入れ型インターンシップとはドコモが手掛ける数多くの事業の中から厳選したポストにて、実務を体験していただけるイベントとなっています。 今回、サービスイノベー…

DeepStream SDKによる動画像認識事始め2022

はじめに こんにちは。 @dcm_yamaya です。 この記事は、NTTドコモ R&D Advent Calendar 2022 23日目の記事です。 ことしはカレンダーがドコモ開発者ブログ上に展開されています! 筆者は普段の業務では、画像認識やエッジコンピューティングの技術領域を担…

画像認識AIで作る!サッカー⚽️リフティングカウンター

サッカーのリフティングを自動カウントする画像認識AIを作りました。興味がある方はぜひご覧ください。

Text-to-3D手法でいらすとや風の3Dモデルを作ってみる

この記事は,ドコモアドベントカレンダー17日目の記事になります。 こんにちは。ドコモの下山と言います。業務ではバーチャル空間における3Dコンテンツ生成に取り組んでいます。 この記事では,Stable Diffusionに代表されるText-to-Imageの技術と,Novel Vi…

【Python】新潟県に一番似ている国は○○?各都道府県に似た形の国を調べてみた

はじめに この記事はNTTドコモアドベントカレンダーの4日目の記事です。 こんにちは、NTTドコモサービスイノベーション部の福島です。 こちらの日本地図、おかしなところがあります。気づきますでしょうか。正解は少し下にあります。 話は変わりますが、以前…

Stable Diffusion を使って社内でAIお絵描きクイズをしたら,大喜利大会になってしまった話

今年もこんにちは。ドコモの澤山です。 本記事は,ドコモアドベントカレンダー2日目の記事になります。 本記事では,テキストからの画像生成を用い,画像を当てるクイズとその採点をおこないます。 ※記事は 2022/11 時点の内容です。 テキストからの画像生成…

【Python】写真を絵文字に変換する

はじめに NTTドコモサービスイノベーション部の福島です。 画像を表示したいけどビューアーが無い... コンソール上でどうしても画像を確認したい... そんな事態にも対処するため、メモ帳からでも見られるようにUnicode絵文字で画像を表現するプログラムを作…