Articles of nlp

Come posso dividere un testo in frasi usando il parser di Stanford?

Come posso dividere un testo o un paragrafo in frasi usando il parser di Stanford ? Esiste un metodo in grado di estrarre frasi, come getSentencesFromString() come viene fornito per Ruby ?

Come leggere i valori dai numeri scritti come parole?

Come tutti sappiamo, i numeri possono essere scritti in numeri o chiamati con il loro nome. Mentre ci sono molti esempi da trovare che convertono 123 in centoventitre, non sono riuscito a trovare buoni esempi di come convertirlo al contrario. Alcuni dei caveat: cardinale / nominale o ordinale: “uno” e “primo” errori di ortografia comuni: […]

Esiste un algoritmo che indica la somiglianza semantica di due frasi

input: frase 1, frase 2 output: valore di similarità semantica (tra 0 e 1), o la probabilità che queste due frasi parlino della stessa cosa

Generazione di N grammi da una frase

Come generare un n-grammo di una stringa come: String Input=”This is my car.” Voglio generare n-gram con questo input: Input Ngram size = 3 L’output dovrebbe essere: This is my car This is is my my car This is my is my car Dare qualche idea in Java, come implementarlo o se è disponibile una […]

Lemmatizzazione java

Sto cercando un’implementazione di lemmatisation per l’inglese in Java. Ne ho già trovati alcuni, ma ho bisogno di qualcosa che non abbia bisogno di molta memoria per funzionare (1 GB in alto). Grazie. Non ho bisogno di uno stelo.

Come rilevare la lingua del testo inserito dall’utente?

Mi sto occupando di un’applicazione che accetta l’input dell’utente in diverse lingue (attualmente 3 lingue fisse). Il requisito è che gli utenti possano inserire il testo e non preoccuparsi di selezionare la lingua tramite una casella di controllo fornita nell’interfaccia utente. Esiste una libreria Java esistente per rilevare la lingua di un testo? Voglio qualcosa […]

Alla ricerca di una libreria di correttore ortografico Java

Sto cercando una libreria di controllo ortografico Java open source che abbia dizionari per almeno le seguenti lingue: francese, tedesco, spagnolo e ceco. Qualche suggerimento?

Come faccio a fare parola Stemming o Lemmatization?

Ho provato PorterStemmer e Snowball ma entrambi non funzionano su tutte le parole, mancano alcune molto comuni. Le mie parole di prova sono: “I gatti che corrono hanno percorso cactus cactus comunità comunità cactus “, ed entrambi ottengono meno della metà destra. Guarda anche: Algoritmo che genera parole reali Stemming – esempi di codice o […]

Come implementate un “Volete dire”?

Possibile duplicato: Come funziona Google Algorithm “Volete dire?” Supponiamo che tu abbia già un sistema di ricerca nel tuo sito web. In che modo puoi implementare “Vuoi dire: ” come fa Google in alcune query di ricerca ?

Libreria di ricerca stringa sfocata in Java

Sto cercando una libreria Java ad alte prestazioni per la ricerca di stringhe fuzzy. Esistono numerosi algoritmi per trovare stringhe simili, distanza Levenshtein, Daitch-Mokotoff Soundex, n-grammi, ecc. Quali implementazioni Java esistono? Pro e contro per loro? Sono a conoscenza di Lucene, di qualsiasi altra soluzione o Lucene è la migliore? Ho trovato questi, qualcuno ha […]