プログラミング言語 Ruby のための Unicode 正規化ライブラリの実装と評価
この論文をさがす
抄録
国際的な文字コードとして幅広く利用されている Unicode には,様々な合成済み文字や結合文字が収録されている.例えば,アクセント付き文字や仮名の濁音,半濁音を表すには数通りの表現が存在する.このように意味的には等価な文字列でも,異なる表現が混在すると,テキストを処理する際に不都合が生じる.本研究では,これらの問題を解消するために Unicode で定められている正規化形式に準拠した Ruby ライブラリを実装する.ライブラリは基本機能として,文字列の四つの正規化の有無を判別,及び各正規化形式への変換を行う機能を提供する.さらに既存の正規化ライブラリにはない機能として,互換形式を指定した文字列の正規化を図り,W3C で推奨されている正規化形式 NFC による変換の高速化を実現する.
収録刊行物
-
- 第73回全国大会講演論文集
-
第73回全国大会講演論文集 2011 (1), 353-354, 2011-03-02
- Tweet
キーワード
詳細情報
-
- CRID
- 1050574047078633344
-
- NII論文ID
- 170000088345
-
- NII書誌ID
- AN00349328
-
- Web Site
- http://id.nii.ac.jp/1001/00107777/
-
- 本文言語コード
- ja
-
- 資料種別
- conference paper
-
- データソース種別
-
- IRDB
- CiNii Articles