Articles of r

Perché “vapply” è più sicuro di “sapply”?

La documentazione dice vapply è simile a sapply , ma ha un tipo di valore di ritorno pre-specificato, quindi può essere più sicuro […] da usare. Potresti per favore spiegare perché è generalmente più sicuro, magari fornendo esempi? PS: Conosco la risposta e già tendo ad evitare sapply . Spero solo che ci sia stata […]

Trova la somiglianza del coseno tra due array

Mi chiedo se esiste una funzione incorporata in R che può trovare la similarità del coseno (o la distanza del coseno) tra due array? Attualmente, ho implementato la mia funzione, ma non posso fare a meno di pensare che R dovrebbe già venire con uno.

Sottoinsieme di dati per contenere solo colonne i cui nomi corrispondono a una condizione

C’è un modo per me di suddividere i dati in base ai nomi delle colonne che iniziano con una stringa particolare? Ho alcune colonne che sono come ABC_1 ABC_2 ABC_3 e alcune come XYZ_1, XYZ_2,XYZ_3 , diciamo. Come posso impostare il mio df base solo alle colonne contenenti le parti di testo sopra indicate (diciamo, […]

Creare un sistema di richiesta / risposta per inserire dati in R

Ho creato un codice R per l’utilizzo da parte di persone che non sanno nulla di R (anche se sono abbastanza verde io stesso). Ho fatto in modo che la gente incolli i dati iniziali nella console R (con risultati misti) e speravo di impostare un modo più facile per le persone di inserire i […]

filtro per casi completi in data.frame usando dplyr (cancellazione caso-saggio)

È ansible filtrare un data.frame per casi completi usando dplyr? complete.cases con un elenco di tutte le variabili funziona, ovviamente. Ma questo è a) prolisso quando ci sono molte variabili e b) imansible quando i nomi delle variabili non sono noti (ad esempio in una funzione che elabora qualsiasi data.frame). library(dplyr) df = data.frame( x1 […]

Passa argomenti alle funzioni dplyr

Voglio parametrizzare il seguente calcolo usando dplyr che trova quali valori di Sepal.Length sono associati a più di un valore di Sepal.Width : library(dplyr) iris %>% group_by(Sepal.Length) %>% summarise(n.uniq=n_distinct(Sepal.Width)) %>% filter(n.uniq > 1) Normalmente vorrei scrivere qualcosa del genere: not.uniq.per.group % group_by(group.var) %>% summarise(n.uniq=n_distinct(uniq.var)) %>% filter(n.uniq > 1) } Tuttavia, questo approccio genera errori poiché […]

Come sostituire NA con media per sottoinsieme in R (imputare con plyr?)

Ho un dataframe con le lunghezze e le larghezze di vari artropodi dalle viscere delle salamandre. Poiché alcune viscere avevano migliaia di determinati oggetti di preda, ho misurato solo un sottoinsieme di ciascun tipo di preda. Ora voglio sostituire ogni individuo non misurato con la lunghezza media e la larghezza per quella preda. Voglio mantenere […]

convertire il formato della colonna data.frame da carattere a fattore

Sto programmando in linguaggio R. Vorrei cambiare il formato (class) di alcune colonne del mio object mydf ( mydf ) da charactor a factor . Non voglio farlo quando sto leggendo il file di testo con la funzione read.table() . Qualsiasi aiuto sarebbe apprezzato.

Posizione del sole data ora del giorno, latitudine e longitudine

Questa domanda è stata posta prima di poco più di tre anni fa. C’è stata una risposta data, tuttavia ho trovato un problema tecnico nella soluzione. Il codice riportato di seguito è in R. Ho effettuato il porting in un’altra lingua, tuttavia ho verificato il codice originale direttamente in R per garantire che il problema […]

Ritardo di base nel vettore R / dataframe

Molto probabilmente esporrò che sono nuovo a R, ma in SPSS, eseguire i ritardi è molto semplice. Ovviamente questo è un errore dell’utente, ma cosa mi manca? x <- sample(c(1:9), 10, replace = T) y <- lag(x, 1) ds <- cbind(x, y) ds Risultati in: xy [1,] 4 4 [2,] 6 6 [3,] 3 3 […]