Odyssey 2016: The Speaker and Language Recognition Workshop

13/06/2016

Expertos de todo el mundo en caracterización e identificación automática de hablantes y lenguas se reúnen en Bilbao durante 4 días para presentar los últimos avances de la tecnología y debatir sobre su desarrollo futuro

Del 21 al 24 de junio de 2016 se celebra en Bilbao el congreso internacional Odyssey 2016: The Speaker and Language Recognition Workshop, que reunirá en el paraninfo de la UPV/EHU en Abandoibarra (Bizkaia Aretoa) a más de 100 investigadores (matemáticos, físicos, ingenieros, informáticos, lingüistas, etc.) de todo el mundo, así como a representantes de la industria, especialistas en derecho forense y miembros de agencias de seguridad e inteligencia de varios países. En el Odyssey 2016 se presentarán más de 60 trabajos y demostraciones (sumando 242 autores de 31 países) con los últimos avances en la caracterización, modelado, identificación y segmentación de locutores y lenguas (también dialectos y acentos), a partir de señales de voz grabadas en condiciones muy diversas.

La producción y el almacenamiento de contenidos audiovisuales ha experimentado un crecimiento espectacular en los últimos años, como consecuencia del desarrollo de las redes de banda ancha, los servicios presentes en Internet y la disponibilidad de dispositivos de grabación. El procesamiento de dichos contenidos puede requerir de módulos que realicen la identificación de la lengua y de los hablantes. Estos módulos operan como elementos auxiliares de herramientas más generales de transcripción, segmentación, etiquetado e indexado. A ello hay que sumar el uso de la voz en los ámbitos forense y de vigilancia, y su uso como biometría, típicamente en combinación con otras técnicas (como la identificación por huella dactilar o por el iris), para el acceso a edificios o dispositivos electrónicos o para realizar transacciones bancarias de forma segura.

El desarrollo de tecnología que permita caracterizar lenguas y locutores, así como verificar su presencia de manera rápida, precisa, eficiente y robusta, resulta especialmente interesante para las agencias gubernamentales encargadas de la seguridad y la vigilancia (inteligencia civil y militar) así como para las instituciones de justicia, que tienen que procesar un número creciente de pruebas acústicas en las que la verificación de la identidad del hablante es un elemento fundamental. De hecho, en los últimos años, agencias gubernamentales de varios países han financiado la creación de recursos (bases de datos, métricas y protocolos de evaluación, etc.) y han puesto en marcha evaluaciones internacionales con objeto de automatizar procesos que hasta ahora resultaban muy costosos, dependían únicamente del criterio de expertos humanos y a menudo no alcanzaban los niveles deseados de precisión. Estas inversiones han tenido como consecuencia una notable mejora en el rendimiento de la tecnología disponible.

Fuera de los ámbitos de seguridad y forense, el desarrollo de métodos automáticos o semi-automáticos de segmentación e identificación de hablantes y lenguas puede interesar a instituciones públicas como parlamentos, juzgados, etc. o a empresas de comunicación (televisiones, radios) que necesiten transcribir y segmentar sus contenidos. Ello puede contribuir, además, a la producción más eficiente de recursos lingüísticos para lenguas minoritarias, a las que las grandes empresas no dedican recursos por no resultar rentables. En último lugar, el extraordinario grado de madurez alcanzado en los últimos años por las tecnologías del habla, gracias a la introducción de las redes neuronales profundas (DNN, Deep Neural Networks), está haciendo posible la interacción hablada con dispositivos de todo tipo. En este contexto, la verificación de la lengua y del hablante resultan imprescindibles tanto para la autenticación (acceso) como para la optimización del funcionamiento de muchas  aplicaciones (por ejemplo, mediante la adaptación al hablante en un sistema de transcripción voz-texto automático).

Odyssey 2016 es la décima edición del evento, después de tres ediciones en 1994, 1998 y 2001, y su asentamiento como congreso bianual a partir de 2004. El Speaker Odyssey (como se le conoce en la comunidad investigadora) está impulsado por el grupo de interés en caracterización del locutor y de la lengua (SIG-SpLC, Special Interest Group on Speaker and Language Characterization) de la Asociación Internacional de la Comunicación Hablada (ISCA, International Speech Communication Association). La ISCA, en la que se integra una buena parte de los investigadores que contribuyen en este campo, alberga en su web los artículos de pasadas ediciones del Odyssey, en un repositorio permanente conocido como ISCA Archive, además de conceder becas de asistencia a un cierto número de estudiantes en cada edición del evento.

La organización del Odyssey 2016 corre a cargo de dos grupos españoles que han participado activamente en este evento desde 2006: el Grupo de Trabajo en Tecnologías Software (GTTS) de la UPV/EHU y el grupo ViVoLab de la Universidad de Zaragoza, con Luis Javier Rodríguez Fuentes (GTTS) como principal responsable de organización y Eduardo Lleida (ViVoLab) como responsable del programa técnico. Cabe destacar, como curiosidad, la amplia representación española en este campo de investigación. De hecho, el Speaker Odyssey de 2004 fue organizado en Toledo por el grupo ATVS de la Universidad Autónoma de Madrid, grupo del que surgió (como spin-off) Agnitio, una de las empresas punteras del sector en la actualidad, con importantes contratos en todo el mundo y productos de la máxima calidad. Además de los ya mencionados, existen grupos trabajando en temas afines en la Universidad Politécnica de Cataluña, en la Universidad Politécnica de Madrid y en la Universidad de Vigo.

Tanto Agnitio como Cirrus Logic (que recientemente adquirió la división orientada a productos de consumo de Agnitio) y Dialoga Systems son empresas patrocinadoras del Odyssey 2016, que también cuenta con el apoyo importantísimo de la Universidad del País Vasco y del Departamento de Educación, Política Lingüística y Cultura del Gobierno Vasco, a través de sendas subvenciones. Completan el cuadro de apoyos la Universidad de Zaragoza, la Red Temática en Tecnologías del Habla (financiada por el Ministerio de Economía y Competitividad) y el Ayuntamiento de Bilbao, a través del Bilbao Turismo & Convention Bureau.

El grupo GTTS lleva 10 años haciendo contribuciones en campos afines al Odyssey, con el respaldo de varios proyectos de investigación financiados por la Universidad del País Vasco, el Gobierno Vasco y el MINECO, dos tesis doctorales presentadas en 2010 y en 2015 (centradas en el reconocimiento del locutor y en el reconocimiento de la lengua, repectivamente), la creación de recursos lingüísticos y la organización de varias evaluaciones internacionales. El grupo lo forman actualmente 4 profesores del Departamento de Electricidad y Electrónica de la UPV/EHU (ubicado en la Facultad de Ciencia y Tecnología de Leioa) y una investigadora postdoctoral. Los 4 profesores estudiaron Física en la Facultad de Ciencia y Tecnología de la UPV/EHU, aunque han desarrollado su actividad investigadora (sus propias tesis doctorales y la investigación posterior) en el área de las tecnologías del habla, con aportaciones relacionadas con el procesamiento de señal, las ciencias de la computación y el aprendizaje automático. La lista de publicaciones del grupo durante los últimos 10 años suma más de 60 contribuciones en revistas y congresos internacionales de máxima relevancia en el campo mencionado (véase http:// gtts.ehu.es/gtts/?m=1&p=publications). Los miembros del grupo forman parte asimismo de los comités científicos de varios congresos y revistas tanto nacionales como internacionales. La elección de GTTS y ViVoLab para la organización del Odyssey 2016 supone un reconocimiento a las contribuciones realizadas por estos grupos en los últimos años.

Bizkaia Aretoa, Bilbao, 21-24 de junio de 2016 - http://www.odyssey2016.org

Noticias relacionadas

LANGUNE mira hacia delante

28/02/2024

El 2023 ha sido un año de consolidación para LANGUNE: ha conseguido nuevos socios, ha firmado un convenio de colaboración y ha participado en diferentes jornadas y eventos.

El Congreso Languages Lanean reunió a más de 500 personas

28/02/2024

LANGUNE fue la encargada de gestionar la secretaría técnica del Congreso Languages Lanean organizado por el Gobierno Vasco.

Elhuyar presenta en el Parlamento Europeo su trabajo sobre tecnologías lingüísticas e inteligencia artificial

27/02/2024

En su comparecencia en la sede del Parlamento Europeo de Estrasburgo, la empresa socia de LANGUNE ha puesto a disposición de otras lenguas minorizadas de Europa su experiencia y trayectoria.