NTTドコモR&Dの技術ブログです。

自然言語処理

生成AI と Wikipedia記事 で 子供向けお仕事提案bot を作ってみよう(Azure OpenAI + RAG)

NTT コノキューに出向中の澤山です。 今年の7月にドコモから、コノキューにやってきました。 この記事は、NTTドコモ アドベントカレンダー2023 21日目の記事です。 この記事では、Wikipedia記事 と Azure OpenAI API、既存のモデルの3つを用い、RAG(Retrieva…

LLMのテキスト埋め込みはどのように扱うべきか、レコメンド視点で考えてみた

本記事は、ドコモアドベントカレンダー2023の18日目の記事になります。 こんにちは。NTTドコモサービスイノベーション部1年目社員の髙橋克です。 入社してから、主にレコメンデーションシステムの技術開発に携わらせていただいてます。 本記事では、OpenAI、…

インターンシップ体験記:自然言語処理モデルの改善

こんにちは!NTTドコモ サービスイノベーション部の川原田です。 普段は、語学教育に関する研究開発業務に従事しています。 NTTドコモでは、2023年2月に現場受け入れ型インターンシップを実施しました。今回のインターンシップは、初日と最終日以外はリモー…

インターンシップ体験記:街中の文字を認識してみた!~大阪の道頓堀と横浜の中華街は似てる?~

NTTドコモでは2/6~2/17の2週間で現場受け入れ型インターンシップを実施しました! 現場受け入れ型インターンシップとはドコモが手掛ける数多くの事業の中から厳選したポストにて、実務を体験していただけるイベントとなっています。 今回、サービスイノベー…

一年目社員が自担当のサービスに新機能リリースしてみた

はじめに NTTドコモサービスイノベーション部の上田です。 先日、私が所属するチームで提供しているサービスSUNABAでは、LINE連携という新機能をリリースしました。 この記事では、お客様のご要望に基づく仕様の策定から新機能のリリースまでの大変さや面白…

マルチラベル分類モデル/多クラス分類モデルの閾値を最適な値に調整してみよう

こんにちは、ドコモの何と言います。 業務では自然言語処理に関する研究に取り組んでいます。 本記事は、ドコモアドベントカレンダー8日目の記事になります。 本記事では、BERTを使ったマルチラベル分類の閾値の調整に関する技術について紹介します。 マルチ…

Stable Diffusion を使って社内でAIお絵描きクイズをしたら,大喜利大会になってしまった話

今年もこんにちは。ドコモの澤山です。 本記事は,ドコモアドベントカレンダー2日目の記事になります。 本記事では,テキストからの画像生成を用い,画像を当てるクイズとその採点をおこないます。 ※記事は 2022/11 時点の内容です。 テキストからの画像生成…

自然言語処理の国際会議を見てみよう(後編)

論文紹介 サービスイノベーション部翻訳チーム所属の川原田です。 今回はACL2022で採択された論文の中からいくつかピックアップしてご紹介します。 前回ご紹介したように、近年のACLでは言語モデルを使った研究、特に、Promptingと多言語が大きなテーマとな…

自然言語処理の国際会議を見てみよう(前編)

はじめに はじめまして、サービスイノベーション部翻訳チーム所属の川原田と申します。 普段は語学学習サービスや機械翻訳に関する研究開発に従事しています。 今回は、今年の5月に開催されたACL2022で発表された論文について、全体の傾向を眺めながらご紹介…

逆翻訳を使って日本語テキストの学習データを拡張(水増し)してみた

はじめに こんにちは、NTTドコモ サービスイノベーション部の稲子です。 普段の業務ではチャットボットの開発・運用に携わっています。 今回は、逆翻訳によるテキストデータの拡張方法の紹介と文書分類タスクでの実験をしていきたいと思います。 逆翻訳とは …