Sto facendo scintilla in modalità cluster e leggendo i dati da RDBMS tramite JDBC.
Come da Spark doc , questi parametri di partizionamento descrivono come partizionare la tabella quando si legge in parallelo da più worker:
partitionColumn, lowerBound, upperBound, numPartitions
Questi sono parametri opzionali.
Cosa accadrebbe se non specificassi questi: