Descrição:
Conjunto de dados artificiais gerados e utilizados no artigo Scalable MapReduce Approach for Clustering Distributed Data Stream Batches with k Estimation. Consiste em um conjunto de pontos distribuídos respeitando distribuição Gaussiana, utilizados em fluxo para geração de micro-batches em Spark. Para mais dados, consultar o artigo original.