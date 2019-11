Cada generación ha tenido una tecnología de la comunicación que ha supuesto una auténtica revolución en la manera en la que las personas se interconectaban. Desde el telégrafo hasta las redes sociales, pasando por el teléfono, internet, los smartphones o las aplicaciones de mensajería y comunicación online. Todo esto ha contribuido a crear una sociedad más conectada, pero ahora nos preguntamos ¿qué será lo próximo? Hoy traemos cuatro tecnologías de voz que pueden cambiar la forma en la que nos comunicamos con los demás.

Y es que la manera que tenemos de interactuar con la tecnología, no solo con otras personas, también ha cambiado mucho en los últimos años. Antes, el teclado físico era imprescindible para manejar casi cualquier dispositivo y ahora, no entendemos que la tecnología no se use con pantallas táctiles o con controles por voz, todo lo demás parece haberse quedado muy anticuado

Según la consultora Research and Markets, el mercado relacionado con el reconocimiento de voz va a crecer a un ritmo de un 17,2% anual desde 2019 y alcanzará los 26,79 mil millones de euros para 2025. El futuro está en la voz y estas son algunas de las tecnologías que lo harán posible.

Reconocimiento automático del habla (ASR)

Cuando llamamos, por ejemplo, a nuestra compañía telefónica o al banco y nos pide algún dato, el ASR es el responsable de entender y transcribir los datos que le dictamos. Cuando el interlocutor dicta un número de DNI o de teléfono a la operadora virtual estamos haciendo uso de esta tecnología.

Esto nos permite evitar la marcación vía teclado y crear una interacción más sencilla para el usuario. Hoy en día, gracias a programas más avanzados, los sistemas son capaces de reconocer el lenguaje natural y se utiliza para transcribir llamadas o conversaciones completas y para subtitular o traducir una voz automáticamente.

Análisis del habla

De un modo similar a como funciona el reconocimiento de voz, la tecnología del análisis del habla es la última frontera para poder comunicarnos de manera más eficiente con máquinas y ordenadores de una forma más eficiente.

Esta tecnología es capaz de analizar las llamadas de voz en tiempo real y es capaz de detectar la emoción, el tono e incluso el estrés en la voz. Estos datos de audio se analizan y también sirven para identificar si un usuario está molesto o frustrado, para así gestionar mejor la petición o necesidad del usuario y considerar cuál es la mejor manera de abordar un problema.

Voice Engine Optimization (VEO)

Según cifras de la consultora OC&C, en 2022 más de la mitad de los hogares españoles tendrá uno o varios altavoces inteligentes con asistente de voz. Un dispositivo que ya se ha convertido en un elemento más en muchas casas y que ayudan día a día a muchos usuarios.

Y es que se calcula que para el próximo año, el 50% de las búsquedas en internet se realicen por voz, según ComScore. Esto supone un nuevo desafío para crear preguntas y respuestas que respondan de forma similar al lenguaje humano. Y esa tecnología para optimizar las búsquedas por voz es lo que se llama Voice Engine Optimization o VEO.

Biometría de voz

Terminamos con esta tecnología se encuentra todavía en fases iniciales de desarrollo, pero cuya llegada supondrá un gran avance en seguridad y privacidad de datos personales.

Una de sus aplicaciones será el desbloqueo, autentificación o firma digital por voz. Del mismo modo al que se usa la huella dactilar o los rasgos faciales, este es un sistema que crea una huella vocal, única, segura e intransferible.

Una innovación que, según la empresa de telecomunicaciones masvoz, tendrá múltiples aplicaciones en diversos ámbitos. Por ejemplo, con la biometría de voz será posible votar por teléfono en unas elecciones, autorizar transacciones bancarias, obtener una contraseña olvidada o autentificarse.