Guida l’aspirapolvere con la voce

L’interfaccia vocale, il sistema di riconoscimento vocale, è uno degli argomenti più caldi del momento, tanto che ci sono anche divertenti video di ascensori con assurdi controlli vocali. Ma non si tratta di un gioco. I colossi della tecnologia Amazon, Google, Apple, Microsoft, stanno investendo grandi energie in questa tecnologia, sviluppando prodotti come Amazon Echo, […]

L’interfaccia vocale, il sistema di riconoscimento vocale, è uno degli argomenti più caldi del momento, tanto che ci sono anche divertenti video di ascensori con assurdi controlli vocali.

Ma non si tratta di un gioco. I colossi della tecnologia Amazon, Google, Apple, Microsoft, stanno investendo grandi energie in questa tecnologia, sviluppando prodotti come Amazon Echo, Siri, Google Home.

Enormi capacità di calcolo e quantità di dati (i cosiddetti BIG DATA), hanno consentito lo sviluppo di Intelligenze Artificiali capaci di un livello di interazione e comprensione mai raggiunto prima. Questo ti consente di chiedere informazioni a Siri, l’assistente vocale sugli iPhone, usando la voce invece che la tastiera. La cosa sbalorditiva è che puoi dettare le richieste usando il linguaggio naturale. Ad esempio: “Siri, domani mi serve l’ombrello?”

Non è più necessario comunicare con le macchine usando un linguaggio fatto di parole chiave. Possiamo digitare su Google “meteo Roma” oppure “che tempo fa domani?” ed avere risultati pressoché identici (se siamo a Roma!), perché il cervellone di Google ha compreso l’intento della nostra richiesta.

Perché fare una ricerca su web con la voce invece che con la tastiera?

Se hai mai usato WhatsApp per dettare messaggi sai già la risposta: dettare è molto più veloce che scrivere. Infatti possiamo dettare circa 150 parole al minuto e digitarne solo 40 al minuto. Figuriamoci la velocità nel digitare nelle piccole tastiere touchscreen sugli smartphone, magari mentre si guida.

Oltre alla velocità, i vantaggi di utilizzare la voce invece della tastiera sono tanti:

  • è possibile usare le mani per fare altre attività, ad esempio cucinare;
  • è possibile usare gli occhi per guardare la strada se si sta guidando o camminando;
  • lo smartphone (e il suo assistente vocale) è sempre con sé.

I dati infatti confermano una grande crescita nell’uso dei comandi vocali:

  • il 20% di tutte le ricerche da mobile su Google sono fatte con la voce;
  • Google, durante il Google I/O.

I problemi dei comandi vocali: Siri & Ok Google

L’assistente vocale di Apple si chiama Siri, ed utilizzando un’iPhone ci si parla spesso. Come in tutte le buone relazioni, con Siri ci sono anche motivi di attrito:

  1. la comprensione di parole e intento;
  2. temi sensibili e privacy;
  3. disponibilità di traffico dati.

Incomprensioni

Il tasso di errore di riconoscimento delle parole ad oggi è di circa 8 parole su 100, e migliora giorno per giorno. I problemi diventano acuti quando Siri cerca di capire parole in lingua straniera o espressioni dialettali, accenti, e dalla mia esperienza, Google le capisce molto meglio.

Il dialogo crolla su frasi più complesse, dove Siri non riesce a capire l’intento della richiesta, ad esempio: “Siri, è partita la vendita per Vasco Rossi?

Temi delicati

“Siri, come si curano le verruche nei piedi?”

Ci sono domande che non vengono mai poste ad alta voce, perché sono imbarazzanti o riguardano temi sensibili. Quindi è improbabile che i comandi vocali vengano utilizzati per argomenti come la salute, il sesso, le relazioni personali. Anche per questo motivo, l’ambiente in cui vengono usati più spesso i controlli vocali è l’automobile.

Il piano dati

I comandi vocali vengono registrati come file audio sul dispositivo e poi inviati istantaneamente ai server che si occupano della voice recognition, per interpretare parole e intento della richiesta e trasformarle in un testo. Se abbiamo poca banda, tutto il processo diventa lento e perde il suo valore di immediatezza.

A chi serve l’interfaccia vocale?

La voce può essere usata per richiedere ai dispositivi, ma anche per ricevere informazioni in formato audio.

“Nel 2020, il 30% delle sessioni di navigazione web sarà fatto senza uno schermo”

(Gartner, ottobre 2016)

Chi ha problemi di vista o di accesso ai dispositivi, ha un enorme vantaggio da questa interfaccia.

Vincenzo, ipovedente, durante il Web Marketing Festival a Rimini ha mostrato quanto è complicato usare uno smartphone con touch screen per le persone come lui. Quanto è difficile accedere alle informazioni su web e sui social, comprare un prodotto su internet.

L’accesso vocale alle informazioni serve a tutti coloro che non possono guardare o leggere, quindi ipovedenti, anziani, bambini. E ancora a chi guida, in moto, in bici. Serve anche a tutto coloro che non possono usare le mani per problemi fisici, o perché hanno le mani sporche, come un meccanico, un cuoco. La forza di questo cambiamento è ancora più evidente se pensiamo allo stravolgimento portato da un’interfaccia 10 anni fa: il touch screen sugli iPhone.

https://youtu.be/-3gw1XddJuc?t=37m26s

 

Compra con la voce: Amazon Echo

I dispositivi che già oggi puoi controllare con la voce sono i più svariati e incredibili:

  • smartphone e tablet;
  • smartwatch e fitness bands;
  • smart;
  • smart TV e telecomandi;
  • automobili;
  • casco per moto;
  • lampadine;
  • termostato;
  • aspirapolvere!

Ma soprattutto un nuova classe di dispositivi, gli assistenti domestici. Il più noto è Amazon Echo, ma ci sono anche Google Home e il recente Apple HomePod.

Amazon Echo è già entrato nelle case di oltre 6 milioni di americani, e grazie alla integrazione con lo shop, consente di fare acquisti con la voce. Si tratta di un dispositivo con microfono e altoparlante, senza schermo. È possibile dettare ad Alexa (questo il nome dato all’assistente) la lista della spesa e fare gli acquisti. Non solo di libri o tecnologia, ma è possibile addirittura ordinare la pizza di Dominos.

 

Come sfruttare le ricerche vocali su progetti web

Ci sono alcuni ambiti in particolare che possono avvantaggiarsi da questo cambiamento. Negozi, ristoranti, alberghi, etc… Possono ottenere una visibilità mai raggiunta prima nella propria località.

Moltissime persone utilizzano lo smartphone per fare ricerche localizzate e molte sono fatte con la voce:

“Siri, c’è un buon un ristorante di pesce vicino a me?”

L’assistente vocale attiva il servizio di mappe incluso in ogni dispositivo iOS, e inizia a proporre, leggendoli uno per uno, i ristoranti che soddisfano la ricerca.

Il tuo ristorante è presente sulle mappe di Apple? Ci sono delle recensioni?

Se non si è presente, si stanno perdendo molte opportunità. È possibile rimediare subito, aggiungendo la propria attività sulle mappe Apple e le mappe Google.

Conclusioni

L’interfaccia vocale nei dispositivi:

  • una nuova interfaccia di accesso alle informazioni (inclusi i prodotti, i servizi…);
  • è molto efficace in contesti come la guida, la cucina;
  • è utile per persone con problemi di accessibilità, vista o digitazione;
  • è in crescita su mobile, per ricerche veloci e localizzate.

Dimmi cosa ne pensi! Scrivi nei commenti se il tuo ambito di lavoro potrebbe avvantaggiarsi di questa tecnologia.

CONDIVIDI

Leggi anche

[VIDEO] Per fare il digitale non basta la tecnologia

Da due anni a San Giovanni a Teduccio, nella prima periferia napoletana è sorta quella che tutti i giornali chiamano l’Academy di Apple, che rappresenta di fatto la collaborazione fra l’Università di Ingegneria ed Apple. Abbiamo intervistato Giorgio Ventre, docente di sistemi dell’elaborazione delle informazioni e direttore della Developer Academy Apple (questo il nome completo […]