NTTドコモR&Dの技術ブログです。

自然言語処理

マルチラベル分類モデル/多クラス分類モデルの閾値を最適な値に調整してみよう

こんにちは、ドコモの何と言います。 業務では自然言語処理に関する研究に取り組んでいます。 本記事は、ドコモアドベントカレンダー8日目の記事になります。 本記事では、BERTを使ったマルチラベル分類の閾値の調整に関する技術について紹介します。 マルチ…

Stable Diffusion を使って社内でAIお絵描きクイズをしたら,大喜利大会になってしまった話

今年もこんにちは。ドコモの澤山です。 本記事は,ドコモアドベントカレンダー2日目の記事になります。 本記事では,テキストからの画像生成を用い,画像を当てるクイズとその採点をおこないます。 ※記事は 2022/11 時点の内容です。 テキストからの画像生成…

自然言語処理の国際会議を見てみよう(後編)

論文紹介 サービスイノベーション部翻訳チーム所属の川原田です。 今回はACL2022で採択された論文の中からいくつかピックアップしてご紹介します。 前回ご紹介したように、近年のACLでは言語モデルを使った研究、特に、Promptingと多言語が大きなテーマとな…

自然言語処理の国際会議を見てみよう(前編)

はじめに はじめまして、サービスイノベーション部翻訳チーム所属の川原田と申します。 普段は語学学習サービスや機械翻訳に関する研究開発に従事しています。 今回は、今年の5月に開催されたACL2022で発表された論文について、全体の傾向を眺めながらご紹介…

逆翻訳を使って日本語テキストの学習データを拡張(水増し)してみた

はじめに こんにちは、NTTドコモ サービスイノベーション部の稲子です。 普段の業務ではチャットボットの開発・運用に携わっています。 今回は、逆翻訳によるテキストデータの拡張方法の紹介と文書分類タスクでの実験をしていきたいと思います。 逆翻訳とは …