学際大規模情報基盤共同利用・共同研究拠点

採択課題 【詳細】

jh251007 単語間に区切りのない書写言語における係り受け解析エンジンの開発
課題代表者 安岡孝一(京都大学・人文科学研究所附属人文情報学創新センター)
Koichi Yasuoka (Institute for Research in Humanities, Kyoto University)
概要 日本語・中国語・タイ語など、単語の間に区切りのない書写言語に対し、形態素解析(単語切りと品詞付与)および係り受け解析をおこなうシステムを開発する。具体的には、言語モデルによる系列ラベリングにおいて、各言語で係り受け解析が最適となるようなトークン長とトークナイザを探り、これに基づいた言語モデルの開発をおこなう。
報告書等 研究紹介ポスター / 最終報告書
関連Webページ
無断転載禁止