Articles of plyr

Trova il numero di righe usando dplyr / group_by

Sto usando il set di dati mtcars . Voglio trovare il numero di record per una particolare combinazione di dati. Qualcosa di molto simile al count(*) raggruppa per clausola in SQL. ddply() di plyr sta lavorando per me library(plyr) ddply(mtcars, .(cyl,gear),nrow) ha prodotto cyl gear V1 1 4 3 1 2 4 4 8 3 […]

Perché il film è così lento?

Penso che sto usando plyr in modo errato. Qualcuno potrebbe dirmi se questo è un codice plyr ‘efficiente’? require(plyr) plyr <- function(dd) ddply(dd, .(price), summarise, ss=sum(volume)) Un piccolo contesto: ho alcuni grossi problemi di aggregazione e ho notato che ognuno di loro impiegava un po ‘di tempo. Nel tentativo di risolvere i problemi, mi sono […]

R: accelerando le operazioni “group by”

Ho una simulazione che ha un enorme aggregato e unire il passo proprio nel mezzo. Ho prototipato questo processo usando la funzione ddply () di plyr che funziona alla grande per un’enorme percentuale dei miei bisogni. Ma ho bisogno che questa fase di aggregazione sia più veloce poiché devo eseguire simulazioni 10K. Sto già ridimensionando […]

Come sostituire NA con media per sottoinsieme in R (imputare con plyr?)

Ho un dataframe con le lunghezze e le larghezze di vari artropodi dalle viscere delle salamandre. Poiché alcune viscere avevano migliaia di determinati oggetti di preda, ho misurato solo un sottoinsieme di ciascun tipo di preda. Ora voglio sostituire ogni individuo non misurato con la lunghezza media e la larghezza per quella preda. Voglio mantenere […]

significato di errore ddply: l’attributo ‘names’ deve essere della stessa lunghezza del vettore

Sto passando per Machine Learning per hacker, e sono bloccato su questa linea: from.weight <- ddply(priority.train, .(From.EMail), summarise, Freq = length(Subject)) Che genera il seguente errore: Error in attributes(out) <- attributes(col) : 'names' attribute [9] must be the same length as the vector [1] Questo è un traceback (): > traceback() 11: FUN(1:5[[1L]], …) 10: […]

Esiste una funzione R che applica una funzione a ciascuna coppia di colonne?

Spesso ho bisogno di applicare una funzione a ciascuna coppia di colonne in un dataframe / matrice e restituire i risultati in una matrice. Ora scrivo sempre un ciclo per farlo. Ad esempio, per creare una matrice contenente i p-value delle correlazioni che scrivo: df <- data.frame(x=rnorm(100),y=rnorm(100),z=rnorm(100)) n <- ncol(df) foo <- matrix(0,n,n) for ( […]

Come eseguire lo smistamento di un numero diverso di stringhe in determinate colonne mediante la funzione do

Ho un problema con il valore della colonna divisa quando l’elemento della colonna ha un numero diverso di stringhe. Posso farlo in plyr ad esempio: library(plyr) column <- c("jake", "jane jane","john john john") df <- data.frame(1:3, name = column) df$name <- as.character(df$name) df2 <- ldply(strsplit(df$name, " "), rbind) View(df2) Di conseguenza, abbiamo una cornice dati […]

Aggrega un frame di dati basato su coppie di colonne non ordinate

Ho un set di dati che assomiglia a questo: id1 id2 size 1 5400 5505 7 2 5033 5458 1 3 5452 2873 24 4 5452 5213 2 5 5452 4242 26 6 4823 4823 4 7 5505 5400 11 Dove id1 e id2 sono nodes univoci in un grafico e la size è un […]

Applicando una funzione a ogni riga di una tabella usando dplyr?

Lavorando con plyr ho trovato spesso utile usare adply per le funzioni scalari che devo applicare a ogni singola riga. per esempio data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 3 4.7 3.2 […]

dplyr: “Errore in n (): la funzione non dovrebbe essere chiamata direttamente”

Sto tentando di riprodurre uno degli esempi nel pacchetto dplyr ma questo messaggio di errore. Mi aspetto di vedere una nuova colonna n prodotta con la frequenza di ciascuna combinazione. Qualcuno può dirmi cosa mi manca? Ho controllato tre volte che il pacchetto è stato caricato. Grazie per l’aiuto, come sempre. library(dplyr) # summarise peels […]