Conta occorrenze parola in R

Esiste una funzione per il conteggio del numero di volte in cui una determinata parola chiave è contenuta in un set di dati?

Ad esempio, se il dataset <- c("corn", "cornmeal", "corn on the cob", "meal") il conteggio sarebbe 3.

Per ora supponiamo di volere il numero di elementi contenenti “mais”:

 length(grep("corn", dataset)) [1] 3 

Dopo aver ottenuto le basi di R verso il basso, potresti voler esaminare il pacchetto “tm”.

EDIT: mi rendo conto che questa volta hai desiderato qualsiasi “mais” ma in futuro potresti voler dire “mais”. Oltre a r-aiuto, Bill Dunlap ha sottolineato uno schema di grep più compatto per la raccolta di parole intere:

 grep("\\", dataset) 

Un altro modo abbastanza comodo e intuitivo per farlo è usare la funzione stringr pacchetto stringr :

 library(stringr) dataset <- c("corn", "cornmeal", "corn on the cob", "meal") # for mere occurences of the pattern: str_count(dataset, "corn") # [1] 1 1 1 0 # for occurences of the word alone: str_count(dataset, "\\bcorn\\b") # [1] 1 0 1 0 # summing it up sum(str_count(dataset, "corn")) # [1] 3 

Puoi anche fare qualcosa di simile al seguente:

 length(dataset[which(dataset=="corn")])