マルチタスク学習を用いたテキスト感情分析手法
近年,テキストから感情を機械的に識別する感情分析と呼ばれる技術の研究が盛んに行われているが,
その中でも,特に,喜・怒・哀・楽といった多クラスの感情分析を高精度に行うのは困難である.
その理由として,利用可能な既存のデータセットが非常に少ないことが挙げられる.
これに対して,絵文字を用いることで上記の問題を緩和し,多クラスの感情分析を実現している手法が存在する.
しかしながら,絵文字はあくまで疑似ラベルとして作用するためノイズが含まれてしまうといった問題点が存在する.
そこで,この問題を解決するため,本研究では,絵文字を用いて自動生成したコーパスにマルチタスク学習を適用する.
マルチタスク学習とは,関連する複数のタスクを共同で学習することで知識を共有し,特定,あるいは複数タスクの精度を向上させることを目的とした学習法である.
このようにモデルに内在する重みの一部をタスク間で共有させることで,絵文字予測から得られる知識を伝達させ,主タスクである感情分析の精度を向上させることを目指している.
異常状態に対するキャプション自動生成手法
近年,深層学習を用いた動画におけるキャプション生成技術が向上しており,人間の動作を日本語で説明することが可能になってきている.
人間の日常的な動作を捉えて活用する事例として,監視カメラや見守りカメラが考えられる.
見守りカメラなどを用いて,日常的な動作を記録した動画から異常を検知する研究が行われているが,検知した異常をキャプションとして出力・活用するといったことはあまり行われていない.
そこで,本研究では,深層学習を用いてキャプション生成モデルを構築し,見守りカメラにおいて検知されうる異常動作をキャプションとして生成することを目指している.
OCR を利用した崩れた表記の自動修正手法
ソーシャル・ネットワーキング・サービス (SNS) は多くのユーザが積極的に情報を発信する場となっており,多種多様なユーザが膨大なデータを発信している.
それらのデータを利用する動きも活発になっているが,特に SNS 上のメッセージには「ぉはよう」,「キょぅ」のような特有の表現や「ネ申」,「イ為」のような文字の構成要素を組み合わせた表現などの崩れた表記の単語が含まれるため,
データを活用しにくい問題がある.
そこで,本研究では,このようなデータを活用するため,崩れた表記の単語を正しい単語に修正することを目的としている.
学校教員向け発問自動生成手法
学校教育における授業の中で,教員は生徒の学習内容の理解と思考の促進を図るために「発問」という問いかけを行う.
実際の授業で発問を行う際は,使用する用語や文法,学習内容の定着度など様々な観点で生徒に適した発問を考える必要がある.
そこで,我々は単語の特徴を活用して,授業を行う学校教員に質の良い発問を使用させることを目的とした,任意の単語,用語を用いて発問を自動で生成する手法を提案している.
まず,発問生成に必要な単語の導出を行うための学習モデルを作成し,そこから入力単語に類似する単語を複数提示する.
これらの単語を利用することにより,質の良い発問を生成することを目指している.
[その他の研究内容]