書誌事項
- タイトル別名
-
- Construction of an Alignment Table between 'Word List by Semantic Principles' and UniDic
- 「 ブンルイゴイヒョウ バンゴウ-UniDicゴイソ バンゴウ タイオウヒョウ 」 ノ コウチク
この論文をさがす
説明
日本語の大規模コーパスへの網羅的・体系的な語義情報付与を目的として,語義の体系的な分類を示す大規模な現代日本語のシソーラス『分類語彙表増補改訂版データベース』の見出しと,各種大規模コーパスの構築に利用されている電子化辞書UniDicの見出し(語彙素)との同語関係による対応を表す表形式データの構築を行った。同語判別の作業は分類語彙表・UniDic両者の見出しの表記・読み・類の対応に基づいて人手により行い,その結果,『分類語彙表』の64,759見出しとUniDicの50,795語彙素との同語関係による多対多の対応を表す「分類語彙表番号-UniDic語彙素番号対応表」を構築した。本対応表を活用して大規模コーパスへの網羅的な語義情報付与作業が始まっており,また,形態素解析結果に分類語彙表番号を付与する機能を実装した形態素解析ツールも開発された。一方で,本格的な大規模コーパスへの語義情報の網羅的付与に向けて,対応表の拡張や多義語の語義選択といった課題への対処も必要である。
収録刊行物
-
- 国立国語研究所論集
-
国立国語研究所論集 (18), 77-91, 2020-01
国立国語研究所
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1390009224768406400
-
- NII論文ID
- 120006777752
-
- NII書誌ID
- AA12536262
-
- ISSN
- 21861358
- 2186134X
-
- NDL書誌ID
- 030219325
-
- 本文言語コード
- ja
-
- 資料種別
- departmental bulletin paper
-
- データソース種別
-
- JaLC
- IRDB
- NDLサーチ
- CiNii Articles
-
- 抄録ライセンスフラグ
- 使用可