Articles of nlp

Generazione di N grammi da una frase

Come generare un n-grammo di una stringa come: String Input=”This is my car.” Voglio generare n-gram con questo input: Input Ngram size = 3 L’output dovrebbe essere: This is my car This is is my my car This is my is my car Dare qualche idea in Java, come implementarlo o se è disponibile una […]

Lemmatizzazione java

Sto cercando un’implementazione di lemmatisation per l’inglese in Java. Ne ho già trovati alcuni, ma ho bisogno di qualcosa che non abbia bisogno di molta memoria per funzionare (1 GB in alto). Grazie. Non ho bisogno di uno stelo.

Come rilevare la lingua del testo inserito dall’utente?

Mi sto occupando di un’applicazione che accetta l’input dell’utente in diverse lingue (attualmente 3 lingue fisse). Il requisito è che gli utenti possano inserire il testo e non preoccuparsi di selezionare la lingua tramite una casella di controllo fornita nell’interfaccia utente. Esiste una libreria Java esistente per rilevare la lingua di un testo? Voglio qualcosa […]

Alla ricerca di una libreria di correttore ortografico Java

Sto cercando una libreria di controllo ortografico Java open source che abbia dizionari per almeno le seguenti lingue: francese, tedesco, spagnolo e ceco. Qualche suggerimento?

Come faccio a fare parola Stemming o Lemmatization?

Ho provato PorterStemmer e Snowball ma entrambi non funzionano su tutte le parole, mancano alcune molto comuni. Le mie parole di prova sono: “I gatti che corrono hanno percorso cactus cactus comunità comunità cactus “, ed entrambi ottengono meno della metà destra. Guarda anche: Algoritmo che genera parole reali Stemming – esempi di codice o […]

Come implementate un “Volete dire”?

Possibile duplicato: Come funziona Google Algorithm “Volete dire?” Supponiamo che tu abbia già un sistema di ricerca nel tuo sito web. In che modo puoi implementare “Vuoi dire: ” come fa Google in alcune query di ricerca ?

Libreria di ricerca stringa sfocata in Java

Sto cercando una libreria Java ad alte prestazioni per la ricerca di stringhe fuzzy. Esistono numerosi algoritmi per trovare stringhe simili, distanza Levenshtein, Daitch-Mokotoff Soundex, n-grammi, ecc. Quali implementazioni Java esistono? Pro e contro per loro? Sono a conoscenza di Lucene, di qualsiasi altra soluzione o Lucene è la migliore? Ho trovato questi, qualcuno ha […]

Stemmer vs Lemmatizzatori

Natural Language Processing (NLP), specialmente per l’inglese, si è evoluto nel palcoscenico in cui la derivazione sarebbe diventata una tecnologia arcaica se esistessero lemmatizzatori “perfetti”. È perché gli stemmer cambiano la forma superficiale di una parola / token in alcuni steli privi di significato. Quindi, ancora una volta la definizione del lemmatizzatore “perfetto” è discutibile […]

Come posso dividere più parole unite?

Ho una matrice di circa 1000 voci, con esempi di seguito: wickedweather liquidweather driveourtrucks gocompact slimprojector Vorrei poterli dividere nelle loro rispettive parole, come: wicked weather liquid weather drive our trucks go compact slim projector Speravo in un’espressione regolare, il mio è il trucco. Ma, dato che non ci sono limiti su cui fermarsi, né […]

Code Golf: Number to Words

Le serie di golf del codice sembrano essere abbastanza popolari. Ho trovato un codice che converte un numero nella sua rappresentazione di parole. Alcuni esempi potrebbero essere (poteri di 2 per programmare divertimento): 2 -> Due 1024 -> Mille e ventiquattro 1048576 -> Un milione e quarantottomila cinquecento e settantasei L’algoritmo con cui lavorava il […]