書誌事項
- タイトル別名
-
- Constructing a Collocation Database for the CEFR-J Wordlist
説明
Tokyo University of Foreign Studies
Tokyo University of Foreign Studies
会議名: 言語資源ワークショップ2022, 開催地: オンライン, 会期: 2022年8月30日-31日, 主催: 国立国語研究所 言語資源開発センター
外国語学習において、語彙を運用する力を学習者が身につけるためには語彙リストで単語を個別に記憶するだけでなく、使用頻度の高いフレーズで提示するのが重要である。近年、コーパス準拠英語語彙・フレーズリストが発表されているが、対象学習者レベル、受容・産出語彙の区別は明確ではない。本研究では、CEFR準拠英語学習語彙表CEFR-J Wordlistの活用度を上げ、学習に資するコロケーション選択をするための資料となるコロケーション・データセットを整備する。1億語のイギリス英語均衡コーパスであるBritish National CorpusからUniversal Dependenciesに基づいた構文解析を行い、共起フレーム別(例:動詞+名詞、形容詞+名詞)に共起語セットを抽出した。教育的に有用なコロケーションを教師や学習者が選定するための情報源として、単純共起頻度以外に検索語-共起語ペアについて、各語のCEFR-J Wordlistに基づいたCEFRレベル情報、共起統計(MI, MI2, MI3, t-score, z-score ,logDice, log-likelihood, chi-squared)と散布度指標(DP)の情報を付与した。
source:https://clrd.ninjal.ac.jp/lrw2022.html
identifier:東京外国語大学
identifier:東京外国語大学
収録刊行物
-
- 言語資源ワークショップ発表論文集 = Proceedings of Language Resources Workshop
-
言語資源ワークショップ発表論文集 = Proceedings of Language Resources Workshop 1 133-146, 2023
国立国語研究所
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390014093900470016
-
- Web Site
- http://id.nii.ac.jp/1328/00003733/
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- JaLC
- IRDB
- KAKEN