Articles of dplyr

Individuazione delle sovrapposizioni tra gli intervalli / Connessioni di sovrapposizione efficienti

Panoramica: Devo unirmi a due tabelle: ref contiene gli intervalli di tempo (da t1 a t2 ) insieme a un id per ogni intervallo e uno space cui si verifica questo intervallo. map contiene intervalli di tempo (da t1 a t2 ) ciascuno con un risultato res e il suo space corrispondente. Desidero ottenere / […]

mutate_each / summarise_each in dplyr: come selezionare determinate colonne e dare nuovi nomi alle colonne mutate?

Sono un po ‘confuso riguardo al dplyr verb mutate_each. È piuttosto semplice utilizzare il mutate base per trasformare una colonna di dati in, ad esempio, z-score e creare una nuova colonna nel data.frame (qui con il nome z_score_data ): newDF % select(one_column) %>% mutate(z_score_data = one_column – (mean(one_column) / sd(one_column)) Tuttavia, poiché ho molte colonne […]

dplyr left_join di meno di, maggiore della condizione

Questa domanda è in qualche modo correlata ai problemi Combinando in modo efficiente due frame di dati su un criterio non banale e verificando che la data sia tra due date in r . E quello che ho postato qui richiedendo se la funzione esiste: problema GitHub Sto cercando di unire due dataframes usando dplyr::left_join() […]

dplyr: Come usare group_by all’interno di una funzione?

Voglio usare la funzione dplyr::group_by all’interno di un’altra funzione, ma non so come passare gli argomenti a questa funzione. Qualcuno può fornire un esempio funzionante? library(dplyr) data(iris) iris %.% group_by(Species) %.% summarise(n = n()) # ## Source: local data frame [3 x 2] ## Species n ## 1 virginica 50 ## 2 versicolor 50 ## […]

Come eseguire lo smistamento di un numero diverso di stringhe in determinate colonne mediante la funzione do

Ho un problema con il valore della colonna divisa quando l’elemento della colonna ha un numero diverso di stringhe. Posso farlo in plyr ad esempio: library(plyr) column <- c("jake", "jane jane","john john john") df <- data.frame(1:3, name = column) df$name <- as.character(df$name) df2 <- ldply(strsplit(df$name, " "), rbind) View(df2) Di conseguenza, abbiamo una cornice dati […]

dplyr muta calcoli rowSum o funzioni personalizzate

Sto provando a mutare una nuova variabile dal tipo di calcolo delle righe, diciamo rowSums come di seguito iris %>% mutate_(sumVar = iris %>% select(Sepal.Length:Petal.Width) %>% rowSums) il risultato è che “sumVar” viene troncato al suo primo valore (10.2): Source: local data frame [150 x 6] Groups: Sepal.Length Sepal.Width Petal.Length Petal.Width Species sumVar 1 5.1 […]

Applicando una funzione a ogni riga di una tabella usando dplyr?

Lavorando con plyr ho trovato spesso utile usare adply per le funzioni scalari che devo applicare a ogni singola riga. per esempio data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 3 4.7 3.2 […]

Ordine di barra in ordine inverso

Sto creando un grafico a barre in pila usando ggplot come questo: plot_df <- df[!is.na(df$levels), ] ggplot(plot_df, aes(group)) + geom_bar(aes(fill = levels), position = "fill") Il che mi dà qualcosa del genere: Come faccio a invertire l’ordine delle barre impilate, in modo che il livello 1 si trovi in ​​fondo e il livello 5 sia […]

Media mobile (media mobile) per gruppo / id con dplyr

Ho un follow-up longitudinale delle registrazioni della pressione arteriosa. Il valore a un certo punto è meno predittivo rispetto alla media mobile (media mobile), motivo per cui mi piacerebbe calcolarlo. I dati sono simili test <- read.table(header=TRUE, text = " ID AGE YEAR_VISIT BLOOD_PRESSURE TREATMENT 1 20 2000 NA 3 1 21 2001 129 2 […]

Valutazione non standard (NSE) nel filtro di dplyr_ e estrazione dei dati da MySQL

Mi piacerebbe tirare alcuni dati da un server SQL con un filtro dinamico. Sto usando il fantastico pacchetto R dplyr nel modo seguente: #Create the filter filter_criteria = ~ column1 %in% some_vector #Connect to the database connection <- src_mysql(dbname <- "mydbname", user <- "myusername", password <- "mypwd", host <- "myhost") #Get data data % tbl(“mytable”) […]