Hadoop DistributedCache è obsoleto – qual è l’API preferita?

Le mie attività sulla mappa necessitano di alcuni dati di configurazione, che vorrei distribuire tramite la cache distribuita.

L’ Esercitazione Hadoop MapReduce mostra l’ uso della class DistributedCache, approssimativamente come segue:

// In the driver JobConf conf = new JobConf(getConf(), WordCount.class); ... DistributedCache.addCacheFile(new Path(filename).toUri(), conf); // In the mapper Path[] myCacheFiles = DistributedCache.getLocalCacheFiles(job); ... 

Tuttavia, DistributedCache è contrassegnato come deprecato in Hadoop 2.2.0.

Qual è il nuovo modo preferito per raggiungere questo objective? C’è un esempio o un’esercitazione aggiornati che copre questa API?