L'assistente vocale di SoundHound vuole fare le scarpe a Siri, Cortana e Google Now (video e download apk) (Aggiornato)

Giuseppe Tripodi
Giuseppe Tripodi Tech Master
L'assistente vocale di SoundHound vuole fare le scarpe a Siri, Cortana e Google Now (video e download apk) (Aggiornato)

Più o meno tutti conoscono SoundHound, l'applicazione in stile Shazam che ci permette di identificare le canzoni (anche se canticchiate), ma quanti sapevano che questa era solo una piccola parte di Hound, progetto ben più complesso iniziato quasi dieci anni fa?

All'epoca, Keyvan Mohajer, attuale CEO di SoundHound, propose ad un gruppo di investitori l'idea di un sistema che permettesse alle persone di parlare con un computer, senza utilizzare strutture particolari, ma formulando la frase come se stessero interagendo con un altro essere umano. L'idea era ottima, ma era noto che ci sarebbe voluto circa una decade per realizzarla. Così, per avere qualcosa di pronto, tre anni dopo Mohajer lanciò Midomi, che nel 2009 divenne SoundHound.

Tuttavia, oggi Keyvan ha potuto svelare al mondo il suo progetto originale, mostrando a diverse testate statunitensi Hound, di cui una prima versione per Android è anche stata pubblicata sul Play Store (ma è solo su invito e non disponibile in Italia, ed anche se potrete sempre scaricarla manualmente, è comunque necessario un invito per avviarla).

Le particolarità di questo assistente vocale sono la sua rapidità e la capacità di comprendere un linguaggio davvero umano: questo è possibile grazie ad un nuovo motore che unifica i processi di riconoscimento vocale e analisi semantica. Vale a dire che Hound, a differenza dei concorrenti, non divide in due fasi il processo di comprensione del testo e la sua elaborazione, ma riesce ad estrapolare le parole chiave e la richiesta dell'utente nel momento stesso in cui ascolta. Come ha spiegato lo stesso Mohajer, questa è la differenza che passa tra i motori speech to text al suo speech to meaning, sviluppato negli ultimi 9 anni e mezzo.

Inoltre, grazie a diverse partnership (circa 50 domini di ricerca, contro i 22 di Siri), Hound può elaborare richieste davvero molto complesse: ad esempio, grazie ai dati di Expedia, nei test di Re/Code è stato in grado di trovare un hotel per venerdì notte a Seattle, che costasse meno di 300$, che avesse 3 o 4 stelle, che fosse pet frienedly, che avesse palestra e piscina e che fosse nel raggio di 4,5 miglia dallo Space Needle.

Il tutto, ponendo anche le richieste in momenti diversi e facendo restringere il campo volta per volta.

Hound, insomma, ha diverse frecce al suo arco (tra cui anche il Black Jack!), ma quando non riesce a trovare qualcosa si affida alle ricerche di Bing. Nonostante le ottime premesse, però, c'è da ricordare che non essendo integrato in alcun sistema operativo, potrebbe comunque avere delle limitazioni rispetto ai suoi concorrenti: riuscirà Hound a spiccare, facendosi strada tra il recente annuncio di Now on Tap e il Proactive di Apple, che dovrebbe essere presentato durante il WWDC di lunedì? Date un'occhiata al video di seguito e fateci sapere la vostra.

Aggiornamento: Sul canale ufficiale di Hound è apparso un nuovo video di una prova interna, che mostra come si comporta l'assistente vocale con una serie di domande decisamente complesse. Guardate il filmato in fondo e stupitevi pure.

Via: The Verge