Software capta información escondida en la voz

Facultad de Ingeniería y Tecnologías

Software capta información escondida en la voz
Lunes, agosto 19, 2013



El sistema permite reconocer la identidad de una persona en unos pocos segundos de transcurrida la llamada

Quién es la persona, cuál es su género, cuál es su estado de ánimo y las palabras que utiliza en una conversación, son características personales que pueden conocerse de manera automática. Esta información permite mejorar la gestión de un call center, automatizar procesos e incluir seguridad, entre otras aplicaciones. Expand es un software de contact center multicanal, utilizado por clientes en nuestro país y en América Latina. Fue desarrollado en conjunto por la Facultad de Ingeniería y Tecnologías de la Universidad Católica del Uruguay y la empresa Netgate, con el objetivo de mejorar el servicio de atención al usuario de las empresas, permitiendo gestionar los diferentes canales de comunicación como telefonía, call center, chat, sms, skype y redes sociales, de forma unificada. 

Con el fin de incorporar prestaciones innovadoras, Netgate identificó la necesidad de un sistema informático para extraer información de una llamada telefónica, mientras la misma está en curso. Fue así que  Expand consultó al grupo de investigación de procesamiento de señales de la Facultad de Ingeniería y Tecnologías de la Universidad Católica del Uruguay, liderado por el Dr. Álvaro Pardo. En una primera etapa, Expand aportó los fondos necesarios para que los investigadores analizaran la viabilidad del proyecto. Con resultados preliminares auspiciosos, se gestionó ante la Agencia Nacional de Investigación e Innovación (ANII) el apoyo económico necesario para completar el desarrollo del prototipo. En esta fase del proyecto participaron ingenieros de la empresa y de la Facultad.

Actualmente, el sistema permite reconocer la identidad de una persona con altos índices de confiabilidad, incluso en unos pocos segundos de transcurrida la llamada. Así, por ejemplo, cualquier organización que trabaja con información secreta y sensible –como un banco– podrá utilizar el sistema para determinar si una persona es quien dice ser y aumentar la seguridad. A su vez, posibilita el reconocimiento del género de la persona que habla, así como sus emociones durante la llamada. El sistema logra identificar con alta confiabilidad diferentes estados de ánimo –como enojo, alegría y angustia– y así detectar automáticamente aquellas llamadas que no cumplen los parámetros esperables.

Mediante algoritmos de procesamiento de señales, a partir del audio de una llamada telefónica se obtienen características de la señal. Al extraer la huella fonética que identifica al hablante, el sistema puede reproducir lo que hacemos los humanos al reconocer a alguien cuando escuchamos su voz. Así como los humanos somos capaces de deducir estados de ánimo en llamadas telefónicas, el sistema busca hacer lo mismo de forma automática, procesando el audio de la llamada telefónica con algoritmos adecuados.

La primera versión del producto se lanzará al mercado en la segunda mitad del año 2013, con buenas oportunidades de comercialización, ya que los programas que podrían competir tienen elevados precios (de decenas de miles de dólares). Estará disponible para Expand y tendrá diversas aplicaciones para la actividad industrial, como las comunicaciones, los servicios, la publicidad y los sistemas de seguridad.

Como una de las múltiples experiencias de cooperación empresa – academia, con el apoyo de la ANII, este proyecto evidencia el éxito del trabajo en conjunto en proyectos de investigación e innovación. La Facultad de Ingeniería y Tecnologías de la Universidad Católica del Uruguay sigue trabajando con eXpand en esta línea y en otra sobre la optimización y el dimensionamiento de los call centers, así como con otras empresas en proyectos de investigación e innovación en telecomunicaciones (con Nuevo Siglo), energías renovables (con el Ministerio de Turismo y Deportes), electrónica aplicada e ingeniería biomédica (con el Hospital Británico), entre otros temas.

Los investigadores del proyecto son Álvaro Pardo, Mauricio van der Maesen, Tatiana Skorubsky, Adrian Marques, Walter Diaz, Rodrigo Gatti y Agustin Recine.

 

Bookmark and Share