Articles of dataframe

Sostituzione dei valori dei caratteri con NA in un frame di dati

Ho un frame di dati contenente (in posizioni casuali) un valore di carattere (dire “foo” ) che voglio sostituire con un NA . Qual è il modo migliore per farlo attraverso l’intero frame dei dati?

Crescere un data.frame in modo efficiente dalla memoria

In base alla creazione di un frame di dati R riga per riga , non è ideale aggiungere a un data.frame utilizzando rbind , poiché ogni volta crea una copia dell’intero data.frame. Come accumulo i dati in R risultando in un data.frame senza incorrere in questa penalità? Il formato intermedio non ha bisogno di essere […]

mutate_each / summarise_each in dplyr: come selezionare determinate colonne e dare nuovi nomi alle colonne mutate?

Sono un po ‘confuso riguardo al dplyr verb mutate_each. È piuttosto semplice utilizzare il mutate base per trasformare una colonna di dati in, ad esempio, z-score e creare una nuova colonna nel data.frame (qui con il nome z_score_data ): newDF % select(one_column) %>% mutate(z_score_data = one_column – (mean(one_column) / sd(one_column)) Tuttavia, poiché ho molte colonne […]

Rimuovi la colonna del frame di dati preservando le informazioni dall’altra colonna

Ho un frame di dati che consiste di due colonne: un vettore di carattere col1 e una colonna di list , col2 . myVector <- c("A","B","C","D") myList <- list() myList[[1]] <- c(1, 4, 6, 7) myList[[2]] <- c(2, 7, 3) myList[[3]] <- c(5, 5, 3, 9, 6) myList[[4]] <- c(7, 9) myDataFrame <- data.frame(row = […]

Come trasformare i dati XML in un data.frame?

Sto cercando di imparare il pacchetto XML di R. Sto provando a creare un data.frame dal file di dati xml di esempio books.xml. Ecco cosa ottengo: library(XML) books <- "http://www.w3schools.com/XQuery/books.xml" doc <- xmlTreeParse(books, useInternalNodes = TRUE) doc xpathApply(doc, "//book", function(x) do.call(paste, as.list(xmlValue(x)))) xpathSApply(doc, "//book", function(x) strsplit(xmlValue(x), " ")) xpathSApply(doc, "//book/child::*", xmlValue) Ognuno di questi xpathSApply […]

Trasporre un frame di dati

Ho bisogno di trasporre un grande frame di dati e quindi ho usato: df.aree <- t(df.aree) df.aree <- as.data.frame(df.aree) Questo è ciò che ottengo: df.aree[c(1:5),c(1:5)] 10428 10760 12148 11865 name M231T3 M961T5 M960T6 M231T19 GS04.A 5.847557e+03 0.000000e+00 3.165891e+04 2.119232e+04 GS16.A 5.248690e+04 4.047780e+03 3.763850e+04 1.187454e+04 GS20.A 5.370910e+03 9.518396e+03 3.552036e+04 1.497956e+04 GS40.A 3.640794e+03 1.084391e+04 4.651735e+04 4.120606e+04 Il […]

L’aggiornamento della cornice dati tramite la funzione non funziona

Ho incontrato un piccolo problema usando R … Nel seguente frame di dati test <- data.frame(v1=c(rep(1,3),rep(2,3)),v2=0) Voglio cambiare i valori per v2 nelle righe in cui v1 è 1. test[test$v1==1,”v2″] <- 10 funziona bene test v1 v2 1 1 10 2 1 10 3 1 10 4 2 0 5 2 0 6 2 0 […]

Come calcolare il numero di occorrenza di un dato carattere in ogni riga di una colonna di stringhe?

Ho un data.frame in cui determinate variabili contengono una stringa di testo. Desidero contare il numero di occorrenze di un dato carattere in ogni singola stringa. Esempio: q.data<-data.frame(number=1:3, string=c("greatgreat", "magic", "not")) Vorrei creare una nuova colonna per q.data con il numero di occorrenza di “a” nella stringa (ad esempio c (2,1,0)). L’unico approccio convoluto che […]

Risagoma più valori contemporaneamente

Ho un lungo set di dati che vorrei allargare e sono curioso di sapere se c’è un modo per fare tutto questo in un unico passaggio usando i pacchetti reshape2 o tidyr in R. Il frame dati df aspetto: id type transactions amount 20 income 20 100 20 expense 25 95 30 income 50 300 […]

Converti i nomi delle righe nella prima colonna

Ho una cornice dati come questa: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at “957.729231881542” “P” “0.00486279317241156” 1053_at “320.632701283368” “P” “0.0313356324173416” 117_at “429.842323161046” “P” “0.0170004527476119” 121_at “2395.7364289242” “P” “0.0114473584876183” 1255_g_at “116.493632746934” “A” “0.39799368200131” 1294_at “739.927122116896” “A” “0.0668649772942343” Voglio convertire i nomi delle righe nella prima colonna. Attualmente uso qualcosa del genere per creare nomi di riga come […]