El tutorial d'Apache Spark proporciona conceptes bàsics i avançats de Spark. El nostre tutorial Spark està dissenyat per a principiants i professionals.
Spark és un motor d'anàlisi unificat per al processament de dades a gran escala que inclou mòduls integrats per a SQL, streaming, aprenentatge automàtic i processament de gràfics.
El nostre tutorial de Spark inclou tots els temes d'Apache Spark amb introducció a Spark, instal·lació de Spark, Arquitectura de Spark, components de Spark, RDD, exemples en temps real de Spark, etc.
Què és Spark?
Apache Spark és un marc informàtic de clúster de codi obert. El seu objectiu principal és gestionar les dades generades en temps real.
Spark es va construir a la part superior de Hadoop MapReduce. Es va optimitzar per funcionar a la memòria, mentre que enfocaments alternatius com MapReduce d'Hadoop escriuen dades a i des dels discs durs de l'ordinador. Per tant, Spark processa les dades molt més ràpidament que altres alternatives.
Història d'Apache Spark
El Spark va ser iniciat per Matei Zaharia a l'AMPLab de la UC Berkeley el 2009. Va ser de codi obert el 2010 amb una llicència BSD.
El 2013, el projecte va ser adquirit per Apache Software Foundation. El 2014, Spark va sorgir com un projecte Apache de primer nivell.
Característiques d'Apache Spark
Ús de Spark
Requisit previ
Abans d'aprendre Spark, has de tenir uns coneixements bàsics d'Hadoop.
Públic
El nostre tutorial Spark està dissenyat per ajudar a principiants i professionals.
Problemes
Us assegurem que no trobareu cap problema amb aquest tutorial de Spark. Tanmateix, si hi ha algun error, si us plau, publiqueu el problema al formulari de contacte.