書誌情報データベースにおける非ローマンアルファベット系言語の原綴り・翻字相互変換システム

書誌事項

タイトル別名
  • ショシ ジョウホウ データベース ニ オケル ヒローマンアルファベットケイ ゲンゴ ノ ゲン ツヅリ ホンジ ソウゴ ヘンカン システム
  • Automatic Transliteration and Back-transliteration System for Languages That Use Non-Roman Alphabets in Bibliographic Citation Database

この論文をさがす

抄録

日本語,韓国語,中国語の各語を除く非ローマンアルファベット系言語で書かれた図書・資料を扱う大学図書館では,書誌情報をALA-LC 方式の翻字規則によりローマンアルファベットに翻字したうえで登録する必要がある.この翻字作業には,知識と経験が必要であり人材が限られる,原綴りの入力に比べて時間がかかるという問題がある.また,検索時も翻字が必要であり,検索結果も翻字で表示されるなど,図書館の一般利用者にとっても利便性に問題がある.本研究ではこうした問題に対処する機能を提供する,原綴り・翻字相互変換の自動化について述べる.ALA-LC 翻字規則は,人手での作業を前提に,異なる言語ごとに定義されたものであり,広範囲な言語に対する自動化はこれまであまり検討されていない.我々は,翻字を必要とする主要な言語について,自動化の観点から難易度と実現の可能性を検討した.その結果から本論文では,最初の実装として,ロシア語とヒンディー語を選択しシステムを構築した.実際の書誌情報データを用いた評価実験を行い,実用的な精度で変換が行えることを確認した.

University libraries will be required to use the ALA-LC romanization tables as transliteration schemes when they register the bibliographic citation for books written in non-roman alphabets except for Japanese, Korean and Chinese. There are some difficulties for transliteration; registrars who have basic knowledge about the target language and experience of transliteration are limited, much time for registration is required compared with the input of original scripts and to retrieve a book catalog with transliteration and to back-transliterate the results of retrieval are inconvenient for all users. In this paper, we describe an automatic tranliteration and back-transliteration system for languages that use non-roman alphabets in bibliographic citation database. We will discuss the difficulties and possibilities of automatic transliteration and back-transliteration for each non-roman alphabet language preceding to construct the system, and we will adopt Russian and Hindi for our first implementation. The effectiveness of the system is also evaluated by experiments that use actual bibliographic citation data.

収録刊行物

参考文献 (12)*注記

もっと見る

キーワード

詳細情報 詳細情報について

問題の指摘

ページトップへ