Articles of plyr

Esiste una funzione R che applica una funzione a ciascuna coppia di colonne?

Spesso ho bisogno di applicare una funzione a ciascuna coppia di colonne in un dataframe / matrice e restituire i risultati in una matrice. Ora scrivo sempre un ciclo per farlo. Ad esempio, per creare una matrice contenente i p-value delle correlazioni che scrivo: df <- data.frame(x=rnorm(100),y=rnorm(100),z=rnorm(100)) n <- ncol(df) foo <- matrix(0,n,n) for ( […]

Come eseguire lo smistamento di un numero diverso di stringhe in determinate colonne mediante la funzione do

Ho un problema con il valore della colonna divisa quando l’elemento della colonna ha un numero diverso di stringhe. Posso farlo in plyr ad esempio: library(plyr) column <- c("jake", "jane jane","john john john") df <- data.frame(1:3, name = column) df$name <- as.character(df$name) df2 <- ldply(strsplit(df$name, " "), rbind) View(df2) Di conseguenza, abbiamo una cornice dati […]

Aggrega un frame di dati basato su coppie di colonne non ordinate

Ho un set di dati che assomiglia a questo: id1 id2 size 1 5400 5505 7 2 5033 5458 1 3 5452 2873 24 4 5452 5213 2 5 5452 4242 26 6 4823 4823 4 7 5505 5400 11 Dove id1 e id2 sono nodes univoci in un grafico e la size è un […]

Applicando una funzione a ogni riga di una tabella usando dplyr?

Lavorando con plyr ho trovato spesso utile usare adply per le funzioni scalari che devo applicare a ogni singola riga. per esempio data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 setosa 4.9 3 4.7 3.2 […]

dplyr: “Errore in n (): la funzione non dovrebbe essere chiamata direttamente”

Sto tentando di riprodurre uno degli esempi nel pacchetto dplyr ma questo messaggio di errore. Mi aspetto di vedere una nuova colonna n prodotta con la frequenza di ciascuna combinazione. Qualcuno può dirmi cosa mi manca? Ho controllato tre volte che il pacchetto è stato caricato. Grazie per l’aiuto, come sempre. library(dplyr) # summarise peels […]

dplyr riepilogare: Equivalente di “.drop = FALSE” per mantenere i gruppi con lunghezza zero in output

Quando si utilizza il summarise con la funzione ddply , le categorie vuote vengono eliminate per impostazione predefinita. Puoi cambiare questo comportamento aggiungendo .drop = FALSE . Tuttavia, questo non funziona quando si usa il summarise con dplyr . C’è un altro modo per mantenere le categorie vuote nel risultato? Ecco un esempio con dati […]

Aggrega un dataframe su una determinata colonna e visualizza un’altra colonna

Ho un dataframe in R del seguente modulo: > head(data) Group Score Info 1 1 1 a 2 1 2 b 3 1 3 c 4 2 4 d 5 2 3 e 6 2 1 f Vorrei aggregarlo seguendo la colonna Score utilizzando la funzione max > aggregate(data$Score, list(data$Group), max) Group.1 x 1 1 […]

Raggruppa per colonne multiple e sum altre colonne multiple

Ho un frame di dati con circa 200 colonne, di cui voglio raggruppare la tabella per primi 10 o giù di lì che sono fattori e sumno il resto delle colonne. Ho una lista di tutti i nomi delle colonne che voglio raggruppare e l’elenco di tutti i colle che voglio aggregare. Il formato di […]

Il modo più veloce per aggiungere righe per i valori mancanti in un data.frame?

Ho una colonna nei miei set di dati in cui i periodi di tempo ( Time ) sono interi che vanno da ab. A volte potrebbero mancare periodi di tempo per un determinato gruppo. Mi piacerebbe riempire quelle file con NA . Di seguito sono riportati i dati di esempio per 1 (di diversi 1000) […]

Righe univoche, considerando due colonne, in R, senza ordine

A differenza delle domande che ho trovato, voglio ottenere l’unicità di due colonne senza ordine. Ho un df: df df [,1] [,2] [1,] “a” “b” [2,] “b” “d” [3,] “c” “e” [4,] “b” “a” In questo caso, la riga 1 e la riga 4 sono “duplicati” nel senso che ba è uguale a ba. So […]