明治前期雑誌の異体漢字と文字コード -『明六雑誌』を事例として-
書誌事項
- タイトル別名
-
- Kanji variants and their character codes of the early part of the Meiji period
説明
言語研究資料としての電子化テキストを作成するという立場から,明治前期雑誌の異体漢字処理の在り方を検討した.現行の国内規格であるJIS X 0213 の文字集合および包摂規準が,近代の活字の電子化に対してはどの程度有効かを,明治初期の雑誌『明六雑誌』の異体漢字を例に検証した.JIS X 0213 文字集合によって『明六雑誌』の漢字の98%以上が表現できるが,言語資料として電子化テキストを使う場合には,2%近くが外字処理に回るのは望ましくない.そこで外字処理をさらに減らす方法として,包摂規準の拡張や別字での代用を提案し,それらを用いて処理した場合の効果も検証した.
Sorting out the variants of kanji is an essential task upon digitizing texts of the early Meiji period. The current domestic standard for kanji character codes, JIS X 0213, is aimed mainly at contemporary Japanese. Consequently, not a few kanji in publications of the Meiji period are classified as external codes under JIS X 0213, which is quite inconvenient for researchers who are not interested in characters. As solutions, we propose a modification plan of JIS X 0213, which involves extension of the subsumption standard and substitution of characters. We also examine its capability in the paper.
収録刊行物
-
- じんもんこん2011論文集
-
じんもんこん2011論文集 2011 (8), 381-388, 2011-12-03
- Tweet
キーワード
詳細情報 詳細情報について
-
- CRID
- 1050574047079599232
-
- NII論文ID
- 170000068433
-
- Web Site
- http://id.nii.ac.jp/1001/00079435/
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB
- CiNii Articles