Aplicaciones de voz y la experiencia de usuario

Tigo Panamá | 18 de septiembre, 2020

Aplicaciones de voz y la experiencia de usuario

Comparte

¿Por qué deberíamos prestarle mayor atención a las interfaces de voz? La razón es que existe una relación directa entre las aplicaciones de voz y la experiencia de usuario.

En torno a la voz se establecen nuevos productos y servicios que se están masificando, igual como sucedió con el uso de teléfonos móviles.

Para el año 2025 el mercado global de la voz generará más de 49 billones de dólares según pronostica el sitio CB insigths dedicado a la investigación de tendencias tecnológicas. 

La voz llegó para quedarse

Las aplicaciones de voz que buscan mejorar la experiencia de usuario están presentes en la vida diaria en actividades tan comunes como solicitar el encendido de un electrodoméstico en el hogar.

En muchos hogares un asistente digital inteligente enciende el televisor, las luces, indica la temperatura y busca la música preferida de sus dueños.

Se dice que 1 de cada 6 norteamericanos tiene una bocina inteligente en su casa estadística que denota un crecimiento importante.

La voz y la inteligencia artificial se juntan

Con la inteligencia artificial las interfaces de voz van tomando su espacio propio en forma vertiginosa. Por ello, se recurre a otras disciplinas como la lingüística para abordar con propiedad la experiencia de usuario (UX).

Un dato interesante es que en el mundo el 42% de los usuarios entre las edades de 16 a 24 años envían notas de voz. Son usuarios actuales que irán creciendo con una preferencia de uso ya marcada por la voz.

Al recordar que estas personas conformarán el grueso de los consumidores de tecnología en los próximos años, diseñar productos que cubran sus expectativas en materia de voz es estratégico.

Ya sea que una máquina tome parte en la operación o facilite una actividad, el toque humano se hace necesario porque la tecnología, por si sola, no puede brindar una experiencia positiva.

Diseñando conversaciones

El diseño de conversaciones es una realidad en empresas como Microsoft y Google que se enfocan en desarrollar los mejores sistemas de interacción vocal. 

Diseñar conversaciones se considera una disciplina especializada y sigue evolucionando en torno a la inteligencia artificial y las interfaces vocales tan de moda actualmente.

Con el uso masivo de los dispositivos móviles las aplicaciones de voz y la experiencia de usuario toman mayor relevancia.

Dos nombres que es necesario recordar en el diseño de conversaciones para la experiencia de usuarios con inteligencia artificial son Holly Peck y Cathy Pearl.  Ambas mujeres son referentes mundiales y tienen currículos impresionantes en el desarrollo de tecnologías inteligentes  y voz. 

Holly Peck es una ingeniera en tecnología creativa y gerente de inteligencia artificial, fundadora, asesora y artista electrónica con experiencia en inteligencia artificial, robótica y servicios cognitivos. Actualmente, es directora de Servicios Creativos en Soul Machines, empresa de Inteligencia Artificial General (AGI) respaldada por Salesforce Ventures, Temasek y Mercedes-Benz Ventures.

La experta lidera un equipo global de ingenieros de PNL / NLU, diseñadores conversacionales y lingüistas que son pioneros en el futuro de la IA conversacional para agentes de máquinas incorporados.

Por su parte, Cathy Pearl es jefa de difusión de diseño de conversaciones en Google y autora del libro de “O’Reilly Designing Voice User Interfaces”, es conferencista internacional y ha presentado en Cannes Lion International Festival of Creativity, O’Reilly Bot Day, SXSW y TechCrunch Disrupt.Pear.

Pearl, ha diseñado y creado interfaces de usuario de voz (VUI) durante 20 años haciendo posibles las mejores experiencias de conversación.

Aplicaciones de voz y la experiencia de usuario

En este artículo hemos repetido el término conversación y habría que preguntarse ¿por qué es tan importante en el desarrollo de nuevas tecnologías? A continuación lo descubrimos.

Humanizar la comunicación de la marca con la audiencia a través de la conversación es la propuesta de los mercadólogos de empresas globales de tecnología e innovación.

«Conversar es algo natural entre humanos.»

A la conversación se le define como la acción y efecto de hablar una o más personas con otra u otras. Para que exista una conversación debe darse una comunicación a través de algún tipo de lenguaje, ya sea oral, gestual, escrito u otro.

Revisemos los 5 elementos clave de toda conversación:
  • Emisor, quien transmite la información.
  • Receptor, quien recibe la citada información.
  • Mensaje, lo que se transmite, la información.
  • Código, el idioma y/o lenguaje en el que se realiza la conversación.
  • Canal, el medio donde transcurre la información.
  • Contexto, donde ocurre el mensaje.
  • Tono de la conversación, es la intensidad o énfasis del diálogo.

Los elementos arriba mencionados son conocidos por lingüistas y requeridos para desarrollar conversaciones en el entorno físico y en el digital.

Tecnólogos y humanistas saben que se requiere un lenguaje formal para que se dé una conversación, ya sea entre humanos o entre agentes artificiales y humanos.

El lenguaje, materia prima de la conversación

Esta aseveración nos lleva a formular la pregunta ¿Cómo evolucionó el lenguaje? La respuesta se encuentra entre los grandes misterios sin resolver.

Algunos científicos dan crédito a la hipótesis que sostiene que el lenguaje “es un sistema adaptativo complejo que surge a través de interacciones adaptativas entre agentes y continúa evolucionando para permanecer adaptado a las necesidades y capacidades de los agentes.”

Al intentar formalizar el lenguaje natural y modelarlo, no hay nada más desafiante que la gran complejidad de cada elemento que lo compone.

Cuando se pretende que un agente artificial y un hablante adulto normal entablen un diálogo es importante recordar que en promedio ese individuo conoce 100,000 unidades de construcción del lenguaje (las ha aprendido durante toda su vida y sigue aprendiendo), las que manipula en diferentes condiciones de audibilidad, éxito y fracaso, con hablantes del idioma de un grupo de dialecto similar o muy diferente y que lo hace muy rápidamente. Son sus herramientas, con las que es capaz de comunicarse e innovar autónomamente en la forma en que se comunica.

Transmitiendo significado

En lingüística y en semiótica, el significado es el contenido mental que le es dado a un signo lingüístico, cuando se alude a la transmisión de significado los entendidos se refieren al concepto o idea que se asocia a la forma sensible o perceptible del signo y al objeto que representa en todo tipo de comunicación.

La complejidad y los múltiples parámetros que influyen en la transmisión de significado no son la única barrera para crear un modelo exitoso de comunicación máquina-humano.

El dinamismo, la fluidez del lenguaje, debe ser capturado en un modelo artificial exitoso y enfocado en la mejora sustancial de la experiencia del usuario.

Recordemos que los idiomas cambian se modifican, son entes dinámicos, con el tiempo surgen nuevos significados que se comparten, se extienden, se extinguen a veces muy rápidamente, en otras ocasiones los cambios en la estructura del lenguaje se dan a lo largo de muchos años.

¿Qué consideraciones toma en cuenta al diseñar aplicaciones de voz? ¿Se asesora con expertos en lingüística computacional? Aunque existen pocos en ejercicio en el país es posible recurrir a profesionales que poseen las competencias en Storytelling Digital y UX Writing.

Comparte

Comentarios