複数の形態の入力に対応した選言的素性構造による辞書記述法

Bibliographic Information

Other Title
  • フクスウ ノ ケイタイ ノ ニュウリョク ニ タイオウ シタ センゲンテキ ソ
  • Lexical Descriptions with Disjunctive Feature Structures for Dealing with Various Forms of Input
  • 自然言語処理

Search this article

Abstract

本論文では,単一化文法による構文解析用の辞書で,ローマ字列,漢字かな混り列,音素列,音声認識や形態素解析システムの出力などの様々な形態の入力に対応したものを記述する方法を提案する.複数の形態の入力に対応した辞書の,最も単純な構築法として,各入力形態の終端記号の組を作り,それに辞書記述を割り当てる方法が考えられる.しかし,各入力形態の終端記号どうしは1対1対応しない.そのため,ある入力形態のある終端記号の辞書項目が1つの選言的素性構造でコンパクトに記述できる場合でも,他の入力形態では複数の異なる終端記号が用いられるときには,複数の語彙項目を作らなくてはならない.これは,記述の冗長性のみならず,解析時の効率の低下を招く.この問題を解決するため,選言的素性構造の中に素性値として各入力形態の終端記号を記述することにより,1つの辞書記述で複数の入力形態に対応する方法を提案する.終端記号を記述する素性の値は選言でもよいので,終端記号が1対1に対応しなくても,1つの選言的素性構造の中で記述することができる.構文解析の際には,入力された終端記号に対し,単一化操作により辞書記述から適切な語彙素性構造を生成する.

This paper presents a feature-based lexical description method for dealing with various forms of input such as sequences of Roman letters,sepuences of kana-kanji characters,sequences of phonemes,and outputs of speech recognizers and morphological analyzers.A simple method is to describe pairs of a lexical feature structure and a set of terminal symbols in each input form.However,there can be no one-to-one correspondence between terminal symbols in two different input forms.Therefore,even if one lexical entry with a disjunctive feature structure is sufficient for one terminal symbol in one input form,multiple lexical entries are required if multiple terminal symbols are used in another inputform.This causes not only reduncancy in the lexical descriptions but also inefficiency in the parsing process.This paper proposes describing terminal symbols as feature values in the disjunctive feature structures.Since those terminal symbols can be disjunctive values,even if there is no one-to-one correspondence between terminal symbols,they can be described in one disjunctive feature structure.The lexical featue structure for an input word is obtained by unification.

Journal

Citations (2)*help

See more

References(20)*help

See more

Keywords

Details 詳細情報について

Report a problem

Back to top