学際大規模情報基盤共同利用・共同研究拠点

採択課題 【詳細】

jh251007 単語間に区切りのない書写言語における係り受け解析エンジンの開発
課題代表者 安岡孝一(京都大学・人文科学研究所附属人文情報学創新センター)
Koichi Yasuoka (Institute for Research in Humanities, Kyoto University)
概要 日本語・中国語・タイ語など、単語の間に区切りのない書写言語に対し、形態素解析(単語切りと品詞付与)および係り受け解析をおこなうシステムを開発する。具体的には、言語モデルによる系列ラベリングにおいて、各言語で係り受け解析が最適となるようなトークン長とトークナイザを探り、これに基づいた言語モデルの開発をおこなう。
関連Webページ
報告書等 研究紹介ポスター / 最終報告書
業績一覧 (1) 学術論文 (査読あり)
該当なし
(2) 国際会議プロシーディングス (査読あり)
該当なし
(3) 国際会議発表(査読なし)
[] 安岡孝一: 古典中国語の係り受け解析, デジタル技術を活用した漢文研究 (2025年6月21日).
(4) 国内会議発表(査読なし)
[] 安岡孝一: 古典中国語(漢文)ModernBERTの開発, 東洋学へのコンピュータ利用, 第39回研究セミナー (2025年7月25日), pp.3-10.
(5) 公開したライブラリなど
該当なし
(6) その他(特許,プレスリリース,著書等)
該当なし
無断転載禁止