API Text-to-speech (generazione vocale) e speech-to-text (riconoscimento vocale)?

Esiste un elenco completo di API conosciute per ambienti desktop o browser?

Riesaminerò e aggiornerò una risposta dal riconoscimento vocale in C o Java o PHP? . Questo non è affatto esaustivo, ma potrebbe essere un inizio per te


Dalla visione di queste domande per alcuni mesi, ho visto la maggior parte delle scelte degli sviluppatori analizzate in questo modo:

Utenti di Windows: utilizza le funzionalità System.Speech di .Net o Microsoft.Speech e installa i riconoscitori gratuiti forniti da Microsoft. Windows 7 include un motore vocale completo. Altri sono scaricabili gratuitamente. Esiste un’API C ++ per gli stessi motori noti come SAPI. Vedere http://msdn.microsoft.com/en-us/magazine/cc163663.aspx . o http://msdn.microsoft.com/en-us/library/ms723627(v=vs.85).aspx . Ulteriori informazioni sui motori Microsoft per Windows Qual è la differenza tra System.Speech.Recognition e Microsoft.Speech.Recognition?

Gente Linux – La Sfinge sembra avere un buon seguito. Vedi http://cmusphinx.sourceforge.net/ e http://cmusphinx.sourceforge.net/wiki/

Prodotti commerciali – Nuance , Loquendo , AT & T , IBM , altri. Ciascuno fornisce i propri SDK e librerie per varie lingue.

Servizio online – Nuance , Yapme , ispeech.org , vlingo , altri. Nuance ha migliorato il suo programma di sviluppo e ora ti darà libero accesso ai loro servizi per lo sviluppo. Yap (credo) è stato recentemente acquistato da Amazon , quindi potremmo vedere alcuni cambiamenti lì.

Naturalmente questo può anche essere utile – http://en.wikipedia.org/wiki/List_of_speech_recognition_software

C’è un’API vocale Java. Vedere javax.speech.recognition nell’API Java Speech http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide/Recognition.html . Credo che tu debba ancora trovare un motore vocale che supporti questa API. Non credo che Sphinx lo supporti pienamente – http://cmusphinx.sourceforge.net/sphinx4/doc/Sphinx4-faq.html#support_jsapi

Ci sono molti altri quesitons SO: Hai bisogno di strumenti di riconoscimento vocale e di riconoscimento vocale per Linux e pyspeech (python)? Trascrivi i file mp3? che parla di http://code.google.com/p/pyspeech/ . Potresti anche voler dare un’occhiata a http://code.google.com/p/dragonfly/

I principali fornitori di API di sintesi vocale (generazione vocale) sono YAKiToMe! e iSpeech. YAKiToMe! è quello che uso perché mi piace la loro qualità vocale migliore e sono i meno costosi (per lo più gratuiti). Supportano altoparlanti maschili e femminili in più lingue. Alcuni venditori di voci, come Acapella, Nuance, Loquendo e iVona hanno voci decenti, ma tendono ad essere costosi da usare.

Ecco come puoi farlo: Nota: è un’API di Google, quindi funziona solo con il browser Chrome.

(Guarda la demo dal vivo e scarica il codice sorgente completo qui http://purpledesign.in/blog/?p=33 )

definire un pulsante

 

e definisci cosa vuoi fare in una funzione nel tuo file javascript

Come questo

  function processspeech() { var speechtext=$("#speech").val(); var elem = document.getElementById("test"); elem.value = speechtext; var notification="\""+ speechtext + "\" 
*Is this what you said???"; notify(notification); }

Qui

  

Il discorso è scritto nella textarea