活字データの分類を用いた進化計算による近代書籍からのルビ除去
書誌事項
- タイトル別名
-
- Ruby Removal Filters by Genetic Programming using the classification of printing type data for Early-Modern Japanese Printed Books
この論文をさがす
説明
国立国会図書館では,所蔵する明治から昭和前期の近代書籍を近代デジタルライブラリとして Web 上でページごとの画像データとして公開しているが,文書内容での検索を行うことができない.そのため,自動でのテキストデータ化が望まれている.その際,問題となっているのがヒストグラムでは除去できないルビであり,我々はすでに近代書籍に特化したルビ除去手法を提案している.しかしながら,提案した手法は書籍に付加された外部情報を元にしており,実現可能性は低い.そこで本論文では,書籍画像から直接得られるデータを元に,進化計算によってルビ除去式を生成し,近代書籍から自動でルビを除去する手法を提案する.
収録刊行物
-
- 情報処理学会研究報告. MPS, 数理モデル化と問題解決研究報告
-
情報処理学会研究報告. MPS, 数理モデル化と問題解決研究報告 2014 (20), 1-6, 2014-06-18
一般社団法人情報処理学会
- Tweet
詳細情報 詳細情報について
-
- CRID
- 1570572702972833024
-
- NII論文ID
- 110009795498
-
- NII書誌ID
- AN10505667
-
- ISSN
- 09196072
-
- 本文言語コード
- ja
-
- データソース種別
-
- CiNii Articles