sparkSpark is a cluster computing system. It is faster as compared to other cluster computing systems (such as Hadoop). It provides hh-level APIs in Python, Scala, and Java. Parallel jobs are easy to write in Spark.Apache Spark adalah sistem pemrosesan terdistribusi sumber terbuka yang dunakan untuk beban kerja b data. Sistem ini memanfaatkan caching dalam memori