An Improvement of Syntactic Reachability by Adding Conditions

Bibliographic Information

Other Title
  • 条件の付加による到達可能性の改良について
  • ジョウケン ノ フカ ニ ヨル トウタツ カノウセイ ノ カイリョウ ニ ツイテ
  • 人工知能

Search this article

Description

統語解析においては,不要な部分解析木の発生を抑制するために,到達可能性が使用されることが多い.これは,ある文法範疇から別の文法範疇への成長を予測するものである.しかしながら,到達可能性の効果は万能とはいえず,場合によっては到達可能性がほとんど機能しないことも少なくない.そこで,我々は到達可能性の予測精度を上げるために,先読み情報を用いることにした.すなわち,到達可能性によって文法範疇 $A$ から文法範疇 $B$ が予測されても,範疇 $A$ の後方に特定の語彙範疇が出現しない限り,この予測を無効とするのである.ここで予測を制限するために使用されている語彙範疇は,我々が範疇核と呼んでいるものを通じて求めることができる.範疇核は,言語理論HPSGの主要部に類似した概念である.ある文法範疇が与えられたとき,これを文脈自由文法の書換え規則によって語彙範疇のみを含む列にする.このとき,規則の適用方法とは無関係に,その列に必ず出現するような語彙範疇があれば,これを範疇核と呼ぶのである.範疇核は,書換え規則から連立集合方程式を作成し,これを解くことによって求められる.この連立集合方程式の解法としては,組合せ的なものも利用できるが時間がかかるので,ここでは逐次近似法による解法を紹介している.

In syntax analysis, reachability is often used for restraining the generation ofuseless partial parse trees.It predicts the growth of one grammatical category to another.Nevertheless reachability is not almighty but it sometimes hardly functions.We have been studying a method that uses lookahead information to improvethe prediction accuracy of reachability.In our method,even if reachability predicts category $B$ from category $A$,the prediction is forced to be invalid in case special lexical categoriesdo not appear after category $A$.The special lexical categories used here are obtained from symbols thatwe call ``categorical kernels''.Categorical kernels are found by making simultaneous set equationsfrom rewriting rules of CFG and solving them.In case of solving this equations,we use successive iteration because combinatorial method is much more time-consuming.

Journal

Citations (2)*help

See more

References(8)*help

See more

Keywords

Details 詳細情報について

Report a problem

Back to top