※2025年4月から,このページは以下に移動しました.
https://matsuhara-lab.com/

岩手県立大学 ソフトウェア情報学部 松原研究室 へようこそ!

主に「自然言語処理」を取り扱っている研究室です. 自然言語処理とは,日本語や英語など,人間が日常的に用いている言葉をコンピュータに理解させることを目的とした研究分野です. これを実現すべく,本研究室においては,人工知能分野の知見を生かした様々な手法を提案しています.

メンバー(2024年4月現在)

教員

准教授・松原 雅文 (MATSUHARA Masafumi) [個人Webページ]

大学院生

M1・竹本 光希 (TAKEMOTO Kouki)

学部生

B4・宇野 瑞樹 (UNO Mizuki)
B4・太田 梨那 (OTA Rina)
B4・尾関 拓斗 (OZEKI Takuto)
B4・小野間 櫻 (ONOMA Sakura)

[過去のメンバー]

最近の研究内容

判読性の高い文章を表示するシステム

情報化社会の発展に伴い,デバイス上から知識や情報を得ることは,生活するうえでとても身近な行為となっている. デバイス上の文字を従来よりも読みやすく表示することで,読字中の時間帯効果の向上に寄与できると考えられる. 一般的な文章表示方法をベタ組み文章と呼ぶが,この表示方法は人間の理想的な読み速度を阻害していると考えられている. 人間は読字中に文章を,いくつかの要素に分割して認識している.その要素中に改行が発生すると,1つの要素が 2つの行に分断され,読み効率が低下する. 特に文節は,人間が文章を読む際の要素の基準として,最も強いものだと考えられているが, 各基準の強さの関係や,改行挿入に伴って発生する空白の多い行については,あまり検討されていない. そこで本研究では,日本語文章の改行挿入の基準となる情報を決定し,それぞれの基準の強さの比較やその評価方法についての考察を行い, これらの結果に基づいた文章表示システムを構築し,判読性の高い文章の表示を目指している.

日英機械翻訳での一般化による前処理

機械翻訳は,訓練データと実際に翻訳を行うデータの間にギャップがあると,翻訳精度に悪影響を及ぼすことが知られている. 例として,日本語テキストの多くは書き言葉であるため,機械翻訳の学習も必然的に書き言葉を用いて行われる. そのような機械翻訳で話し言葉を翻訳しようとすると,精度が低下してしまう. そこで本研究では,入力文を日英機械翻訳の訓練データ内で頻出する単語,文法などの表現に変換するという前処理を行う手法を提案する. これにより,機械翻訳の精度向上をはかる.

マルチタスク学習を用いたテキスト感情分析手法

近年,テキストから感情を機械的に識別する感情分析と呼ばれる技術の研究が盛んに行われているが, その中でも,特に,喜・怒・哀・楽といった多クラスの感情分析を高精度に行うのは困難である. その理由として,利用可能な既存のデータセットが非常に少ないことが挙げられる. これに対して,絵文字を用いることで上記の問題を緩和し,多クラスの感情分析を実現している手法が存在する. しかしながら,絵文字はあくまで疑似ラベルとして作用するためノイズが含まれてしまうといった問題点が存在する. そこで,この問題を解決するため,本研究では,絵文字を用いて自動生成したコーパスにマルチタスク学習を適用する. マルチタスク学習とは,関連する複数のタスクを共同で学習することで知識を共有し,特定,あるいは複数タスクの精度を向上させることを目的とした学習法である. このようにモデルに内在する重みの一部をタスク間で共有させることで,絵文字予測から得られる知識を伝達させ,主タスクである感情分析の精度を向上させることを目指している.

[その他の研究内容]

最近の研究業績

  1. 竹本 光希、松原 雅文: ”判読性の高い文章を表示するための改行箇所の選定について”, 2024年度電気関係学会東北支部連合大会,1D08-15-02,秋田県立大学 本荘キャンパス,August 2024.
  2. Masafumi Matsuhara and Jin Tsushima: ”Effectiveness of Automatic Caption Generation Method for Video in Japanese”, 1st International Conference on Optimization Techniques for Learning (ICOTL 2023), Paper ID 111, Hybrid Mode, Angallu, India, December 2023.
  3. 常見歩夢、松原雅文: ”日英機械翻訳における日本語前処理での一般化指標に関する一考察”, 2023年度電気関係学会東北支部連合大会,2B12,岩手県立大学,August 2023.
  4. Haruki Asano, Masafumi Matsuhara: ”Multi-task Learning Method using Emoji Prediction as Auxiliary Task for Sentiment Analysis”, 8th International Congress on Information and Communication Technology (ICICT 2023), Virtual Room 2D-4, London, United Kingdom, February 2023.
  5. 対馬陣,松原雅文: ”異常状態を捉えた動画におけるキャプション自動生成手法の有効性について”, 令和4年度 第3回情報処理学会東北支部研究会(岩手大学,オンライン), 2022-3-4, December 2022.
  6. 浅野晴暉,松原雅文: ”マルチタスク学習を用いたドメインが異なるテキストにおける感情分析”, 令和4年度 第3回情報処理学会東北支部研究会(岩手大学,オンライン), 2022-3-3, December 2022.(情報処理学会東北支部奨励賞受賞)
  7. 秋山大五郎,松原雅文: ”OCRを用いた崩れた表記における自動修正手法の有効性について”, 令和4年度 第3回情報処理学会東北支部研究会(岩手大学,オンライン), 2022-3-2, December 2022.
  8. 浅野 晴暉,松原 雅文: ”絵文字予測を感情分析の補助タスクとしたマルチタスク学習手法”, 第24回音声言語シンポジウム ・第9回自然言語処理シンポジウム(第254回 自然言語処理・第144回音声言語情報処理 合同研究発表会),Vol.2022-NL-254 No.2, Nov. 2022.
  9. 浅野 晴暉・松原 雅文: ”テキスト感情分析における絵文字疑似ラベル適用方法についての検討”, 第21回情報科学技術フォーラム(FIT2022), E-002, 慶應義塾大学 矢上キャンパス ハイブリッド開催, September 2022.(FIT奨励賞受賞)
  10. 秋山 大五郎・松原 雅文: ”OCRを利用した崩れた表記の自動修正手法の性能評価”, 第21回情報科学技術フォーラム(FIT2022), E-036, 慶應義塾大学 矢上キャンパス ハイブリッド開催, September 2022.
  11. 対馬 陣・松原 雅文: ”キャプション自動生成におけるBERTScoreの有効性について”, 第21回情報科学技術フォーラム(FIT2022), E-044, 慶應義塾大学 矢上キャンパス ハイブリッド開催, September 2022.
  12. 浅野晴暉,松原雅文: ”テキスト感情分析におけるマルチタスク学習の有効性”, 情報処理学会 第84回全国大会,1V-06,愛媛大学城北キャンパス,ハイブリッド開催,March 2022.(大会奨励賞,学生奨励賞受賞)
  13. 対馬 陣,松原雅文: ”見守りカメラを用いた異常状態に対するキャプション自動生成手法の提案”, 情報処理学会 第84回全国大会,4W-08,愛媛大学城北キャンパス,ハイブリッド開催,March 2022.(学生奨励賞受賞)
  14. 秋山大五郎,松原雅文: ”OCRを利用した崩れた表記の自動修正手法の提案”, 情報処理学会 第84回全国大会,5V-07,愛媛大学城北キャンパス,ハイブリッド開催,March 2022.

[その他の研究業績]

アクセス