Cassandraを用いた並列分散処理機構の開発とHadoop Cassandraとの比較
Search this article
Description
近年,大量のデータを高速に処理することが必要な場面が増え,分散KVS が注目され始めた.分散KVSを用いると,RDBMSでは管理が困難な大容量データを分散環境で管理することができる.分散KVSで管理されている大容量データを高速に処理するには,データを複数の計算機で並列に処理する必要がある.しかしながら,分散KVSから対象データを取り出した後,再度データを分散させて並列処理を行うと,データの転送遅延により処理効率が悪くなってしまう.我々は,大容量データを扱う分散KVSであるApache Cassandraに着目し,大容量データをより高速に処理するために,データアフィニティを考慮した並列分散処理を提案し,実装している.本稿では,本実装の特性を明確にするため、提案手法とApache Cassandraの Hadoop連携機能との性能比較を行う.
Journal
-
- 第76回全国大会講演論文集
-
第76回全国大会講演論文集 2014 (1), 421-422, 2014-03-11
情報処理学会
- Tweet
Keywords
Details 詳細情報について
-
- CRID
- 1050292572101981952
-
- NII Article ID
- 170000086785
-
- NII Book ID
- AN00349328
-
- Text Lang
- ja
-
- Article Type
- conference paper
-
- Data Source
-
- IRDB
- CiNii Articles