採択課題【詳細】

jh261019	オープンソース大規模言語モデルと検索拡張生成を活用した古代言語における引用・引喩の自動探知システムの開発
課題代表者	宮川創(筑波大学・人文社会系) So Miyagawa (The University of Tsukuba, Institute of Humanities and Social Sciences)
概要	本研究は、既開発の引用検出システムICoMA（https://github.com/somiyagawa/quotationChecker）に、オープンソース大規模言語モデル（ByT5-large、mBERT、XLM-RoBERTa）と検索拡張生成（RAG）技術を統合し、古代言語における引用・引喩の高精度自動探知を実現する。コプト語・ヴェーダ語各300万語コーパスでLLMをファインチューニングし、従来手法（F1: 0.65）を上回る性能（F1>0.82）を達成する。mdx IIの大容量GPUメモリ（80GB+）とLustre並列ファイルシステム（18TB）により、LLM訓練、RAGベクトルDB構築（25万エントリー）、大規模推論を実施する。
関連Webページ
報告書等	研究紹介ポスター／最終報告書

無断転載禁止

2026年度共同研究日程

2025年11月17日(月)	募集要項及び申込書１の公開
2025年11月27日(木)13:00～	公募説明会（オンライン）
2025年12月11日(木)	課題応募受付開始申込書２の公開
2026年1月6日(火)10:00	課題応募受付締切
2026年3月中旬	採否結果通知
2026年4月1日(水)	共同研究開始
2025年7月	JHPCN第18回シンポジウム共同研究内容紹介
2027年3月31日(水)	共同研究期間終了
2027年7月	JHPCN第19回シンポジウム共同研究成果報告

» 過去・来年の共同研究日程