Wiki > Tecnologie Back-end > Apache Spark

Logo di Apache Spark

Apache Spark

Sito web di Apache Spark

Apache Spark è anche conosciuto con il nome di Spark

Condividi su

Apache Spark

Cos'è Apache Spark

Apache Spark è un motore di elaborazione dati distribuito open source scritto in Scala. È progettato per eseguire su set di dati di grandi dimensioni diverse attività, come l'elaborazione dei dati, l'apprendimento automatico e l'elaborazione dei grafici.

Una delle caratteristiche principali di Spark è la sua capacità di eseguire l'elaborazione in memoria, piuttosto che leggere e scrivere dati su disco. Ciò rende Spark molto più veloce dei tradizionali sistemi di elaborazione dei big data che si basano sull'archiviazione basata su disco come Hadoop.

Spark fornisce supporto per vari linguaggi di programmazione come Java, Python e R, oltre ad avere librerie integrate per la gestione di diversi tipi di dati, (SQL e DataFrame per dati strutturati, RDD per dati non strutturati), o altre come MLLIB, per l'apprendimento automatico, e GraphX ​​per l'elaborazione dei grafici.

Apache Spark è una tecnologia chiave per la carriera di Data Engineer. Scoprile tutte!

Machine LearningScalaData frame

Geekandwiki
la scrivi
anche tu

Condividi le tue competenze

Registrati per scrivere o modificare le wiki.

La GeekandWiki nasce come strumento di condivisione della conoscenza all'interno di GeekandJob. Abbiamo deciso di trasformarlo in un progetto aperto e collaborativo, perché crediamo che il modo migliore di valorizzare le competenze sia condividerle.

Unisciti ad altri professionisti del settore tech e digital, e dai il tuo contributo alla GeekandWiki.

Registrati