[Updated on Apr. 18] Integration of CiNii Articles into CiNii Research

プログラミング言語 Ruby のための Unicode 正規化ライブラリの実装と評価

Search this article

Abstract

国際的な文字コードとして幅広く利用されている Unicode には,様々な合成済み文字や結合文字が収録されている.例えば,アクセント付き文字や仮名の濁音,半濁音を表すには数通りの表現が存在する.このように意味的には等価な文字列でも,異なる表現が混在すると,テキストを処理する際に不都合が生じる.本研究では,これらの問題を解消するために Unicode で定められている正規化形式に準拠した Ruby ライブラリを実装する.ライブラリは基本機能として,文字列の四つの正規化の有無を判別,及び各正規化形式への変換を行う機能を提供する.さらに既存の正規化ライブラリにはない機能として,互換形式を指定した文字列の正規化を図り,W3C で推奨されている正規化形式 NFC による変換の高速化を実現する.

Journal

Citations (0)*help

See more

References(0)*help

See more

Related Articles

See more

Related Data

See more

Related Books

See more

Related Dissertations

See more

Related Projects

See more

Related Products

See more

Details

Report a problem

Back to top