Sobre el dataset
El presente repositorio contiene un dataset de voz especializado en el acento lojano del español ecuatoriano, desarrollado para contribuir a estudios sobre voice spoofing, análisis lingüístico y reconocimiento de voz.
Características
- Participantes: 15 voluntarios de la Universidad Nacional de Loja (6 mujeres y 9 hombres).
- Recolección de datos: Existen alrededor de 1000 audios grabados.
- Generación de audios sintéticos: Utilización del modelo StarGAN para la creación de combinaciones de voz entre hablantes, generando un total de 1710 audios.
- Equipos de sonido utilizados: Se utilizó el micrófono Blue Snowball iCE - Logitech G y el filtro antipop Pantalla Filtro Antipop Para Micrófono - Ps01.
Estructura del dataset
El dataset se estructura de la siguiente manera:
- Transcripciones/: Contiene los textos de las grabaciones originales en formato .txt.
- Voces Reales 16kHz/: Audios originales grabados y convertidos a 16 kHz, en formato .wav.
- Voces Reales 48kHz/: Audios originales en su frecuencia de grabación 48 kHz, en formato .wav.
- Voces Convertidas StarGAN/: Audios sintéticos generados mediante la red neuronal StarGAN, en formato .wav.
Limitaciones del dataset
- Ambientes de grabación: Las grabaciones no se realizaron en estudios profesionales, lo que puede introducir variabilidad en la calidad del audio.
- Requerimientos computacionales: La generación de audios sintéticos con StarGAN fue muy demandante por lo que se utilizo la GPU T4 de paga en Google Colab.
Características de los Hablantes
Los participantes en este dataset fueron etiquetados como Speaker01 hasta Speaker15.
- Cantidad de hablantes: 15
- Formato de identificación: SpeakerXX (donde XX es un número del 01 al 15).
Género | Hablante | Archivos |
Masculino | 9 |
1005 |
Femenino | 6 |
705 |
La cantidad total de las carpetas es de 1710 con una distribución de los archivos de:
Speaker | Cantidad de archivos | Duración Promedio |
Speaker01 | 120 archivos | 11.37 minutos |
Speaker02 | 120 archivos | 10.33 minutos |
Speaker03 | 120 archivos | 7.78 minutos |
Speaker04 | 105 archivos | 6.67 minutos |
Speaker05 | 120 archivos | 9.10 minutos |
Speaker06 | 105 archivos | 8.51 minutos |
Speaker07 | 120 archivos | 9.35 minutos |
Speaker08 | 120 archivos | 10.51 minutos |
Speaker09 | 105 archivos | 8.96 minutos |
Speaker10 | 120 archivos | 11.75 minutos |
Speaker11 | 105 archivos | 8.36 minutos |
Speaker12 | 120 archivos | 12.37 minutos |
Speaker13 | 105 archivos | 8.11 minutos |
Speaker14 | 105 archivos | 8.54 minutos |
Speaker15 | 120 archivos | 8.68 minutos |
Repositorio del dataset
El dataset está disponible para su descarga, pero para acceder al archivo completo, es necesario solicitar acceso a:
Instrucciones para obtener el acceso:
- Enviar un correo a secretaria.cis@unl.edu.ec indicando su solicitud para acceder al dataset.
- En el correo, por favor incluya:
- Su nombre completo.
- La razón de la solicitud.
- En qué proyecto planea utilizar el dataset.
Para descargar el dataset, se puede descargar en el siguiente botón:
Video demostrativo sobre como descargar el dataset
Equipo de Investigación
La presente investigación fue desarrollada con la ayuda y apoyo de:
- Ing. Pablo Fernando Ordoñez Ordoñez: Director de la Carrera de la Computación de la Universidad Nacional de Loja y administrador del servidor donde se encuentra el dataset.
- Ing. Roberth Gustavo Figueroa Díaz: Director especialista del Trabajo de Integración Curricular y docente de Computación de la Universidad Nacional de Loja, encargado de validar la documentación y creación del dataset.
- Ing. Oscar Miguel Cumbicus Pineda: Director especialista del Proyecto de Integración Curricular y docente de Computación de la Universidad Nacional de Loja , encargado de monitorear el proceso de inicialización para crear el dataset.
- Tesista Josue Alejandro Sauca Pucha: Estudiante de la carrera de Computación de la Universidad Nacional de Loja, encargado de la realización del dataset y la redacción del proceso.
Contactos
Institución: Universidad Nacional de Loja, Ecuador
Correos: pfordonez@unl.edu.ec, roberth.figueroa@unl.edu.ec, oscar.cumbicus@unl.edu.ec, josue.sauca@unl.edu.ec