Come scrivere trycatch in R

Voglio scrivere codice trycatch per gestire l’errore nel download dal web.

 url <- c( "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html", "http://en.wikipedia.org/wiki/Xz") y <- mapply(readLines, con=url) 

Queste due istruzioni funzionano correttamente. Sotto, creo un indirizzo web inesistente:

 url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz") 

url[1] non esiste. Come si scrive un loop trycatch (funzione) in modo che:

  1. Quando l’URL è errato, l’output sarà: “URL Web sbagliato, imansible ottenere”.
  2. Quando l’URL è sbagliato, il codice non si ferma, ma continua a essere scaricato fino alla fine dell’elenco di URL?

Bene allora: benvenuto nel mondo R 😉

Ecco qui

Impostazione del codice

 urls <- c( "http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html", "http://en.wikipedia.org/wiki/Xz", "xxxxx" ) readUrl <- function(url) { out <- tryCatch( { # Just to highlight: if you want to use more than one # R expression in the "try" part then you'll have to # use curly brackets. # 'tryCatch()' will return the last evaluated expression # in case the "try" part was completed successfully message("This is the 'try' part") readLines(con=url, warn=FALSE) # The return value of `readLines()` is the actual value # that will be returned in case there is no condition # (eg warning or error). # You don't need to state the return value via `return()` as code # in the "try" part is not wrapped insided a function (unlike that # for the condition handlers for warnings and error below) }, error=function(cond) { message(paste("URL does not seem to exist:", url)) message("Here's the original error message:") message(cond) # Choose a return value in case of error return(NA) }, warning=function(cond) { message(paste("URL caused a warning:", url)) message("Here's the original warning message:") message(cond) # Choose a return value in case of warning return(NULL) }, finally={ # NOTE: # Here goes everything that should be executed at the end, # regardless of success or error. # If you want more than one expression to be executed, then you # need to wrap them in curly brackets ({...}); otherwise you could # just have written 'finally=' message(paste("Processed URL:", url)) message("Some other message at the end") } ) return(out) } 

Applicare il codice

 > y <- lapply(urls, readUrl) Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html Some other message at the end Processed URL: http://en.wikipedia.org/wiki/Xz Some other message at the end URL does not seem to exist: xxxxx Here's the original error message: cannot open the connection Processed URL: xxxxx Some other message at the end Warning message: In file(con, "r") : cannot open file 'xxxxx': No such file or directory 

Indagare l'output

 > head(y[[1]]) [1] "" [2] "R: Functions to Manipulate Connections" [3] "" [4] "" [5] "" [6] "" > length(y) [1] 3 > y[[3]] [1] NA 

Osservazioni aggiuntive

prova a prendere

tryCatch restituisce il valore associato all'esecuzione di expr meno che non ci sia un errore o un avvertimento. In questo caso, è ansible specificare specifici valori di ritorno (vedere return(NA) sopra) fornendo una rispettiva funzione di gestore (vedere argomenti error e warning in ?tryCatch ). Queste possono essere funzioni già esistenti, ma puoi anche definirle all'interno di tryCatch() (come ho fatto sopra).

Le implicazioni della scelta di specifici valori di ritorno delle funzioni del gestore

Come abbiamo specificato che NA dovrebbe essere restituito in caso di errore, il terzo elemento in y è NA . Se avessimo scelto NULL come valore di ritorno, la lunghezza di y sarebbe stata 2 invece di 3 quanto lapply() semplicemente "ignora" i valori di ritorno che sono NULL . Si noti inoltre che se non si specifica un valore di ritorno esplicito tramite return() , le funzioni del gestore restituiranno NULL (cioè in caso di errore o condizione di avvertenza).

Messaggio di avviso "indesiderato"

Come warn=FALSE non sembra avere alcun effetto, un modo alternativo per sopprimere l'avviso (che in questo caso non è realmente di interesse) è usare

 suppressWarnings(readLines(con=url)) 

invece di

 readLines(con=url, warn=FALSE) 

Espressioni multiple

Si noti che è anche ansible inserire più espressioni nella "parte delle espressioni effettive" (argomento expr di tryCatch() ) se le si avvolge tra parentesi graffe (proprio come ho illustrato nella parte finale).

R usa le funzioni per implementare il blocco try-catch:

La syntax assomiglia a questa:

 result = tryCatch({ expr }, warning = function(warning_condition) { warning-handler-code }, error = function(error_condition) { error-handler-code }, finally={ cleanup-code }) 

In tryCatch () ci sono due “condizioni” che possono essere gestite: “avvertenze” e “errori”. La cosa importante da capire quando si scrive ogni blocco di codice è lo stato di esecuzione e l’ambito. @fonte

Ecco un esempio semplice :

 # Do something, or tell me why it failed my_update_function <- function(x){ tryCatch( # This is what I want to do: y = x * 2 return(y) , # ... but if an error occurs, tell me what happened: error=function(error_message) { message("My message is here!") message("And below is the error message from R:") message(error_message) return(NA) } ) } 

Se vuoi anche catturare un "avvertimento", aggiungi l' warning= simile error= parte.

Da quando ho perso due giorni della mia vita cercando di risolvere tryCatch per una funzione irr, ho pensato che dovrei condividere la mia saggezza (e cosa manca). FYI – irr è una funzione reale di FinCal in questo caso in cui ha ottenuto errori in alcuni casi su un set di dati di grandi dimensioni.

  1. Imposta tryCatch come parte di una funzione. Per esempio:

     irr2 <- function (x) { out <- tryCatch(irr(x), error = function(e) NULL) return(out) } 
  2. Affinché l'errore (o l'avviso) funzioni, è necessario creare una funzione. Originariamente per la parte errore ho appena scritto error = return(NULL) e TUTTI i valori sono tornati null.

  3. Ricorda di creare un sotto-output (come il mio "out") e di return(out) .