プログラミング言語 Ruby のための Unicode 正規化ライブラリの実装と評価
Search this article
Abstract
国際的な文字コードとして幅広く利用されている Unicode には,様々な合成済み文字や結合文字が収録されている.例えば,アクセント付き文字や仮名の濁音,半濁音を表すには数通りの表現が存在する.このように意味的には等価な文字列でも,異なる表現が混在すると,テキストを処理する際に不都合が生じる.本研究では,これらの問題を解消するために Unicode で定められている正規化形式に準拠した Ruby ライブラリを実装する.ライブラリは基本機能として,文字列の四つの正規化の有無を判別,及び各正規化形式への変換を行う機能を提供する.さらに既存の正規化ライブラリにはない機能として,互換形式を指定した文字列の正規化を図り,W3C で推奨されている正規化形式 NFC による変換の高速化を実現する.
Journal
-
- 第73回全国大会講演論文集
-
第73回全国大会講演論文集 2011 (1), 353-354, 2011-03-02
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1050574047078633344
-
- NII Article ID
- 170000088345
-
- NII Book ID
- AN00349328
-
- Web Site
- http://id.nii.ac.jp/1001/00107777/
-
- Text Lang
- ja
-
- Article Type
- conference paper
-
- Data Source
-
- IRDB
- CiNii Articles