この論文をさがす
抄録
本研究では,文の長さが長くにつれて文構造にどのような変化が見られるのかを概観するため,現代ドイツ語の新聞コーパスをデータとして,計量的観点から実態調査を試みた。調査では,品詞の出現頻度に着目し,ランダムフォレストを用いて長さが異なる文の判別と,判別に関わる品詞の特定を試みた。その結果,(1)最終的に 84%の高い精度で長さの異なる文の判別が可能であること,(2)文の判別には,コンマ,接続詞,関係代名詞,前置詞,動詞,話法助動詞,助動詞,名詞,副詞などの品詞が有効であること,(3)とくに,コンマ,接続詞,関係代名詞,前置詞,名詞は長文に,動詞,話法助動詞,助動詞,副詞は短文に特徴的であることなどが明らかになった。また,(4)これらの品詞が文の判別に有効な要因として,読みやすさへの配慮や 20 世紀以降に拡大したとされる名詞中心の文体の影響が考えられることが示唆された。
収録刊行物
-
- 統計数理研究所共同研究リポート
-
統計数理研究所共同研究リポート 444 57-72, 2021-03-15
統計数理研究所
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1390573242613653120
-
- NII論文ID
- 120006975765
-
- NII書誌ID
- BN02360534
-
- HANDLE
- 20.500.14094/81012574
-
- 本文言語コード
- ja
-
- データソース種別
-
- JaLC
- IRDB
- CiNii Articles
-
- 抄録ライセンスフラグ
- 使用可