MapReduceは、データやリソースが分散している環境において、従来の単一クラスタによるアーキテクチャを採用しても、パフォーマンスが出ない可能性があるとミネソタ大学が発表しました。ミネソタ大学では、3つのアーキテクチャをPlanetLabやAmazon EC2によって性能チェックを行い評価しています。
パフォーマンスを決める重要なパラメータとしては、下記の5つを挙げています。
- workloads
- aggregation levels
- network topology
- data transfer costs
- data partitioning
source:Exploring MapReduce Efficiency with Highly-Distributed Data
オライリージャパン
売り上げランキング: 75939
Post Footer automatically generated by Add Post Footer Plugin for wordpress.
















