Partizionamento in scintilla durante la lettura da RDBMS tramite JDBC

Sto facendo scintilla in modalità cluster e leggendo i dati da RDBMS tramite JDBC.

Come da Spark doc , questi parametri di partizionamento descrivono come partizionare la tabella quando si legge in parallelo da più worker:

partitionColumn, lowerBound, upperBound, numPartitions 

Questi sono parametri opzionali.

Cosa accadrebbe se non specificassi questi:

  • Solo 1 lavoratore ha letto l’intero dato?
  • Se legge ancora parallelamente, come si partiziona i dati?