「話題別コーパス」から「話題別単語帳」を作る

DOI HANDLE Web Site オープンアクセス

書誌事項

タイトル別名
  • Making a Vocabulary Builder from Japanese Topic-Oriented Conversation Corpus
  • ワダイ ベツ コーパス カラ ワダイ ベツ タンゴチョウ ヲ ツクル
  • 「 ワダイ ベツ コーパス 」 カラ 「 ワダイ ベツ タンゴチョウ 」 オ ツクル

この論文をさがす

抄録

研究ノート

筆者らは、話題別言語資源から話題別特徴語の一覧表を作り、それを基に話題別単語帳を作成・出版した。本稿では、その方法論について述べる。まず既存の教材から2,000 を超える単語をリスト化した。次に、『名大会話コーパス』ならびに『日本語話題別会話コーパス:J-TOCC』から作成した特徴度をLLR で示した語彙表を用い、Excelの関数を利用して全ての語に対して特徴度が最も高い話題を自動付与した。自動付与された語の割合はN3語彙で80%程度、N1語彙で40%程度であり、さらに人手による修正も不可欠であることから本稿の方法論は「半自動付与」と言うべき水準のものである。しかしながら、教材作成時の労力削減という観点からは十分な効果を発揮したと評価できる。また、単語を組み合わせて例文を作る際に作成者が注意しなければならない点として、「有り得るシチュエーションでなければならない」「文脈から文体を考える」「ジェンダーロールの固定化に加担しない」「当たり前のことを言われても面白くない」「データを調べればわかるようなことを空想で述べない」の5 点を指摘した。

収録刊行物

関連プロジェクト

もっと見る

詳細情報 詳細情報について

問題の指摘

ページトップへ