研究内容

マルチタスク学習を用いたテキスト感情分析手法

近年,テキストから感情を機械的に識別する感情分析と呼ばれる技術の研究が盛んに行われているが, その中でも,特に,喜・怒・哀・楽といった多クラスの感情分析を高精度に行うのは困難である. その理由として,利用可能な既存のデータセットが非常に少ないことが挙げられる. これに対して,絵文字を用いることで上記の問題を緩和し,多クラスの感情分析を実現している手法が存在する. しかしながら,絵文字はあくまで疑似ラベルとして作用するためノイズが含まれてしまうといった問題点が存在する. そこで,この問題を解決するため,本研究では,絵文字を用いて自動生成したコーパスにマルチタスク学習を適用する. マルチタスク学習とは,関連する複数のタスクを共同で学習することで知識を共有し,特定,あるいは複数タスクの精度を向上させることを目的とした学習法である. このようにモデルに内在する重みの一部をタスク間で共有させることで,絵文字予測から得られる知識を伝達させ,主タスクである感情分析の精度を向上させることを目指している.

異常状態に対するキャプション自動生成手法

近年,深層学習を用いた動画におけるキャプション生成技術が向上しており,人間の動作を日本語で説明することが可能になってきている. 人間の日常的な動作を捉えて活用する事例として,監視カメラや見守りカメラが考えられる. 見守りカメラなどを用いて,日常的な動作を記録した動画から異常を検知する研究が行われているが,検知した異常をキャプションとして出力・活用するといったことはあまり行われていない. そこで,本研究では,深層学習を用いてキャプション生成モデルを構築し,見守りカメラにおいて検知されうる異常動作をキャプションとして生成することを目指している.

OCR を利用した崩れた表記の自動修正手法

ソーシャル・ネットワーキング・サービス (SNS) は多くのユーザが積極的に情報を発信する場となっており,多種多様なユーザが膨大なデータを発信している. それらのデータを利用する動きも活発になっているが,特に SNS 上のメッセージには「ぉはよう」,「キょぅ」のような特有の表現や「ネ申」,「イ為」のような文字の構成要素を組み合わせた表現などの崩れた表記の単語が含まれるため, データを活用しにくい問題がある. そこで,本研究では,このようなデータを活用するため,崩れた表記の単語を正しい単語に修正することを目的としている.

学校教員向け発問自動生成手法

学校教育における授業の中で,教員は生徒の学習内容の理解と思考の促進を図るために「発問」という問いかけを行う. 実際の授業で発問を行う際は,使用する用語や文法,学習内容の定着度など様々な観点で生徒に適した発問を考える必要がある. そこで,我々は単語の特徴を活用して,授業を行う学校教員に質の良い発問を使用させることを目的とした,任意の単語,用語を用いて発問を自動で生成する手法を提案している. まず,発問生成に必要な単語の導出を行うための学習モデルを作成し,そこから入力単語に類似する単語を複数提示する. これらの単語を利用することにより,質の良い発問を生成することを目指している.

状況に即した返信文候補提示手法

携帯端末において SNS を利用し,ユーザ同士でコミュニケーションをとる機会は多い. SNS において返信文を作成する際には,返信文を推敲し,文字入力を行う必要があり,ユーザにとって負担となっている. そこで,ユーザの負担を軽減させるために,返信文候補を状況ごとに複数提示する手法を提案している. 提示する返信文候補は受信文の内容に即しながら,それぞれ違う状況に対応することで,ユーザにとって様々な場面に適応可能である.

word2vecを用いた顔文字感情分析手法

近年,スマートフォンやインターネットの普及に伴い Twitter,LINE などの SNS によるテキストを用いたメッセージ交換が盛んになっている. SNS は相手の表情や仕草が見えないことから,相手の感情や文に込められた意味など全ての情報を文字列のみから読み取る必要があり, 自身の感情をより豊かに表現する手段として顔文字が頻繁に使用されている. よって,,この顔文字の感情を分析することで文に込められた感情をより正確に推定することができるものと考えられる. しかし,SNS の普及に伴い顔文字の種類は豊富になり,現在では約 10 万種類以上が確認されており,その種類は日々増え続けている. そのため,現在確認されている顔文字の全てをリスト化し,把握することは困難である. そこで,本研究では,SNS での顔文字を含むテキストを word2vec で学習しクラスタリングを行うことで,未知の顔文字に対して感情分析を行うことを目的としている.

情報検索における Conditional VAE を用いた要約文生成手法

Webにある膨大な情報の中から目的とする情報を探すためには,ふつう,検索エンジンが利用される. 従来の検索エンジンにおいては,ユーザによって入力された検索クエリをコンテンツに含むWebページが単純にリスト形式で表示されている. そのため,入力された検索クエリが状況によって意味が変化する単語であった場合などでは,目的とする情報に到達することが困難となる. そこで,検索クエリがもつトピックごとにWeb検索結果をクラスタリングし,その結果に基づいてスニペットの自動生成を行う手法を提案している. 検索クエリがもつトピックごとにスニペットを付与することにより,入力した検索クエリが複数の意味をもつ場合においても情報検索を容易なものにすることが可能となる.

個人に合わせた書籍における重要箇所抽出手法

人が今までに読んだ書籍の内容をすべて記憶しておくことは困難である. 読了後に書籍の内容を記録することで,ある程度,管理することが可能ではあるが,日常的に多数の書籍を読んでいる場合,すべての書籍を記録するには多大な労力を要する. また,労力軽減のために他者の書いたあらましやレビュー等を利用することも考えられるが,書籍の内容に対する着眼点が異なっており,違和感を覚える場合も多い. そこで,本研究では,読了後にユーザが書籍の内容を記録する処理の負担を軽減させるため,書籍の重要箇所を適切に抽出し,これを提示することを目的としている. ユーザによって書籍における重要箇所が異なっていることが予想されるため,個人への適応を行い,個人に合わせて重要箇所を特定することを目指している.

[Back]