Appropriateness of Log-r for calculating strength of association : Comparison with MI, LLR using Japanese and English bigram data

Bibliographic Information

Other Title
  • 結合の強度を測る指標としてのLog-rの有用性 : 日・英語のバイグラムデータに基づくMI,LLRなどとの比較

Description

会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター

2語からなるコロケーションは一般に共起頻度と2語の結合力によって特徴づけられる。本研究は,結合力の指標としてFujimura & Aoki (2016)において提案したLog-r を,同じ目的の指標として言及されることの多いMI,LLR,t-score,Dice,Jaccard と比較し,簡素な指標であるLog-r の有用性を主張する。データは『現代日本語書き言葉均衡コーパス』と英語の大規模新聞コーパスから網羅的に採取した多量のバイグラムを用いる。横軸にバイグラムの共起頻度をとり,縦軸に各指標値をとった散布図を作成して各指標の特徴を視覚的に描き,散布図間の比較によって指標間の差異を明示する。

source:http://pj.ninjal.ac.jp/corpus_center/lrw2016.html

identifier:名古屋大学

identifier:群馬大学

Journal

References(1)*help

See more

Related Projects

See more

Details 詳細情報について

Report a problem

Back to top