学際大規模情報基盤共同利用・共同研究拠点

採択課題 【詳細】

jh241008 単語間に区切りのない書写言語における係り受け解析エンジンの開発
課題代表者 安岡孝一(京都大学・人文科学研究所附属人文情報学創新センター)
Koichi Yasuoka (Institute for Research in Humanities, Kyoto University)
概要

大規模言語モデルによる日本語の文法解析において、国語研長単位における係り受け解析が最適となるようなトークン長とトークナイザを探り、これに基づいた言語モデルの開発をおこなう。

関連Webページ
報告書等 研究紹介ポスター / 最終報告書
業績一覧 (1) 学術論文 (査読あり)
[] 安岡孝一: GPT系言語モデルによる国語研長単位係り受け解析, 人文科学とコンピュータシンポジウム「じんもんこん2024」論文集 (2024年12月), pp.83-90.
(2) 国際会議プロシーディングス (査読あり)
該当なし
(3) 国際会議発表(査読なし)
該当なし
(4) 国内会議発表(査読なし)
[] 安岡孝一: GPT系モデルの系列ラベリングによる品詞付与, 東洋学へのコンピュータ利用, 第38回研究セミナー (2024年7月26日), pp.3-10.
[] 安岡孝一: 青空文庫ModernBERTモデルによる国語研長単位係り受け解析, 情報処理学会研究報告, Vol.2025-CH-137『人文科学とコンピュータ』, No.10 (2025年2月8日), pp.1-7.
(5) 公開したライブラリなど
該当なし
(6) その他(特許,プレスリリース,著書等)
該当なし
無断転載禁止