Articles of dataframe

Calcola le proporzioni per riga

Ho un frame di dati: x <- data.frame(id = letters[1:3], val0 = 1:3, val1 = 4:6, val2 = 7:9) # id val0 val1 val2 # 1 a 1 4 7 # 2 b 2 5 8 # 3 c 3 6 9 All’interno di ogni riga, voglio calcolare le proporzioni corrispondenti (rapporto) per ogni valore. […]

Eliminazione di colonne da un data.frame in cui NA rappresenta più del 15% della lunghezza della colonna

Ho un data.frame di 10 colonne diverse (la lunghezza di ogni colonna è la stessa). Voglio eliminare qualsiasi colonna che ha ‘ NA ‘ maggiore del 15% della lunghezza della colonna. Devo prima fare una funzione per calcolare la percentuale di NA per ogni colonna e quindi creare un altro data.frame dove applico la funzione? […]

Inserire in modo casuale le NA in proporzione

Ho un dataframe completo. Voglio che il 20% dei valori nel dataframe venga sostituito da NA per simulare dati mancanti casuali. A <- c(1:10) B <- c(11:20) C <- c(21:30) df<- data.frame(A,B,C) Qualcuno può suggerire un modo rapido per farlo?

Dividi il dataframe in più file di output

Ho un grande dataset (ma il seguente è piccolo per esempio). Posso dividere il dataframe e quindi voglio produrre su più file di testo corrispondenti a lavel usato per dividere. mydata <- data.frame (var1 = rep(c("k", "l", "c"), each = 5), var2 = rnorm(5), var3 = rnorm(5)) mydata var1 var2 var3 1 k 0.5406022 0.3654706 […]

Convertire l’elenco nidificato in dataframe

L’objective è convertire un elenco annidato che a volte contiene record mancanti in un frame di dati. Un esempio della struttura quando mancano record è: str(mylist) List of 3 $ :List of 7 ..$ Hit : chr “True” ..$ Project: chr “Blue” ..$ Year : chr “2011” ..$ Rating : chr “4” ..$ Launch : […]

Aggiungi una nuova colonna tra altre colonne del dataframe

Voglio aggiungere una nuova colonna con “NA” nel mio dataframe: AB 1 14379 32094 2 151884 174367 3 438422 449382 Ma ho bisogno che si trovi tra col. A e B, come questo: ACB 1 14379 NA 32094 2 151884 NA 174367 3 438422 NA 449382 So come aggiungere col. C dopo col. B, ma […]

Genera bin da un frame di dati

Utilizzando python ho creato il seguente frame di dati che contiene valori di similarità: cosinFcolor cosinEdge cosinTexture histoFcolor histoEdge histoTexture jaccard 1 0.770 0.489 0.388 0.57500000 0.5845137 0.3920000 0.00000000 2 0.067 0.496 0.912 0.13865546 0.6147309 0.6984127 0.00000000 3 0.514 0.426 0.692 0.36440678 0.4787535 0.5198413 0.05882353 4 0.102 0.430 0.739 0.11297071 0.5288008 0.5436508 0.00000000 5 0.560 […]

Unisci i dati non uguali e sostituisci le righe mancanti con 0

Ho due data.frames, uno con solo caratteri e l’altro con caratteri e valori. df1 = data.frame(x=c(‘a’, ‘b’, ‘c’, ‘d’, ‘e’)) df2 = data.frame(x=c(‘a’, ‘b’, ‘c’),y = c(0,1,0)) merge(df1, df2) xy 1 a 0 2 b 1 3 c 0 Voglio unire df1 e df2. I caratteri a, b e c si sono fusi bene e […]

Sostituzione condizionale dei valori in un data.frame

Sto cercando di capire come sostituire i valori condizionali in un dataframe senza utilizzare un ciclo. Il mio data frame è strutturato come segue: > df ab est 1 11.77000 2 0 2 10.90000 3 0 3 10.32000 2 0 4 10.96000 0 0 5 9.90600 0 0 6 10.70000 0 0 7 11.43000 1 […]

Aggiungi una nuova riga al dataframe, ad uno specifico indice di riga, non aggiunto?

Il seguente codice combina un vettore con un dataframe: newrow = c(1:4) existingDF = rbind(existingDF,newrow) Tuttavia questo codice inserisce sempre la nuova riga alla fine del dataframe. Come posso inserire la riga in un punto specificato all’interno del dataframe? Ad esempio, diciamo che il dataframe ha 20 righe, come posso inserire la nuova riga tra […]