- 【Updated on May 12, 2025】 Integration of CiNii Dissertations and CiNii Books into CiNii Research
- Trial version of CiNii Research Knowledge Graph Search feature is available on CiNii Labs
- Suspension and deletion of data provided by Nikkei BP
- Regarding the recording of “Research Data” and “Evidence Data”
日本語学術論文PDFファイルの自動判定
Bibliographic Information
- Other Title
-
- ニホンゴ ガクジュツ ロンブン PDF ファイル ノ ジドウ ハンテイ
- nihongo gakujutsu ronbun PDF fairu no jido hantei
- Automatic identification of academic articles in Japanese PDF files
Search this article
Description
type:text
As open-access policies gain acceptance, an increasing number of researchers are contributing their papers to publicly accessible web sites (i.e. self-archiving). Theoretically, these papers are accessible from standard search engines, but they tend to be obscured by other contents on the web. The purpose of this research is to develop a system that can automatically detect academic articles and/or quasi-academic articles on the web. This paper describes experiments that were conducted on the performance of various classifiers and the results are compared in terms of precision, recall, and F-measure. The classifiers use attributes such as terms in PDF files and empirical rules. The results suggest the effciency of a ranked output system which has several phases to identify academic articles. オープンアクセス環境が進展するにつれ、セルフアーカイビングの形式で自らの研究成果を公開する研究者が増加している。そのような成果は、従来のすべてのウェブを対象とする検索エンジンからもアクセスが可能ではあるが、検索結果中の他のものに埋没してしまうことが多い。そこで、本研究ではウェブコンテンツ中からの学術論文、あるいは論文に準ずるコンテンツを判定するシステム構築を目指し、SVM など、多くの手法を用いて自動判定実験を行った。自動判定の手がかりとなる属性群としてはファイル中に出現する語と経験的なルール群を用いた。実験結果からは、段階的な論文判定を行うことで、学術情報専門の検索システム構築が実現可能であることが示唆された。
原著論文
Journal
-
- Library and information science
-
Library and information science 56 43-63, 2006
三田図書館・情報学会
- Tweet
Details 詳細情報について
-
- CRID
- 1050001337400444032
-
- NII Article ID
- 120001256788
-
- NII Book ID
- AN00003152
-
- ISSN
- 03734447
-
- NDL BIB ID
- 8609770
-
- Text Lang
- ja
-
- Article Type
- journal article
-
- Data Source
-
- IRDB
- NDL Search
- CiNii Articles
- KAKEN