Appropriateness of Log-r for calculating strength of association : Comparison with MI, LLR using Japanese and English bigram data
Bibliographic Information
- Other Title
-
- 結合の強度を測る指標としてのLog-rの有用性 : 日・英語のバイグラムデータに基づくMI,LLRなどとの比較
Description
会議名: 言語資源活用ワークショップ2016, 開催地: 国立国語研究所, 会期: 2017年3月7日-8日, 主催: 国立国語研究所 コーパス開発センター
2語からなるコロケーションは一般に共起頻度と2語の結合力によって特徴づけられる。本研究は,結合力の指標としてFujimura & Aoki (2016)において提案したLog-r を,同じ目的の指標として言及されることの多いMI,LLR,t-score,Dice,Jaccard と比較し,簡素な指標であるLog-r の有用性を主張する。データは『現代日本語書き言葉均衡コーパス』と英語の大規模新聞コーパスから網羅的に採取した多量のバイグラムを用いる。横軸にバイグラムの共起頻度をとり,縦軸に各指標値をとった散布図を作成して各指標の特徴を視覚的に描き,散布図間の比較によって指標間の差異を明示する。
source:http://pj.ninjal.ac.jp/corpus_center/lrw2016.html
identifier:名古屋大学
identifier:群馬大学
Journal
-
- 言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop
-
言語資源活用ワークショップ発表論文集 = Proceedings of Language Resources Workshop 1 365-376, 2017
国立国語研究所
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1390009224768302080
-
- NII Article ID
- 120006668392
-
- Web Site
- http://id.nii.ac.jp/1328/00001492/
-
- Text Lang
- ja
-
- Article Type
- conference paper
-
- Data Source
-
- JaLC
- IRDB
- CiNii Articles
- KAKEN
- NINJAL