Dataset de Voice Spoofing

Sobre el dataset

El presente repositorio contiene un dataset de voz especializado en el acento lojano del español ecuatoriano, desarrollado para contribuir a estudios sobre voice spoofing, análisis lingüístico y reconocimiento de voz. 

Características

  • Participantes: 15 voluntarios de la Universidad Nacional de Loja (6 mujeres y 9 hombres).
  • Recolección de datos: Existen alrededor de 1000 audios grabados.
  • Generación de audios sintéticos: Utilización del modelo StarGAN para la creación de combinaciones de voz entre hablantes, generando un total de 1710 audios.
  • Equipos de sonido utilizados: Se utilizó el micrófono Blue Snowball iCE - Logitech G  y el filtro antipop Pantalla Filtro Antipop Para Micrófono - Ps01.

Estructura del dataset

El dataset se estructura de la siguiente manera: 

  • Transcripciones/: Contiene los textos de las grabaciones originales en formato .txt.
  • Voces Reales 16kHz/: Audios originales grabados y convertidos a 16 kHz, en formato .wav.
  • Voces Reales 48kHz/: Audios originales en su frecuencia de grabación 48 kHz, en formato .wav.
  • Voces Convertidas StarGAN/: Audios sintéticos generados mediante la red neuronal StarGAN, en formato .wav.


Limitaciones del dataset

  • Ambientes de grabación: Las grabaciones no se realizaron en estudios profesionales, lo que puede introducir variabilidad en la calidad del audio.
  • Requerimientos computacionales: La generación de audios sintéticos con StarGAN fue muy demandante por lo que se utilizo la GPU T4 de paga en Google Colab.


Características de los Hablantes

Los participantes en este dataset fueron etiquetados como Speaker01 hasta Speaker15.

  • Cantidad de hablantes: 15
  • Formato de identificación: SpeakerXX (donde XX es un número del 01 al 15).


Género

Hablante

Archivos

Masculino

9

1005 

Femenino

6

705

La cantidad total de las carpetas es de 1710 con una distribución de los archivos de:

Speaker

Cantidad de archivos

Duración Promedio

Speak​er01

120 archivos

11.37 minutos

Speaker02

120 archivos

10.33 minutos

Speaker03

120 archivos

7.78 minutos

Speaker04

105 archivos

6.67 minutos

Speaker05

120 archivos

9.10 minutos

Speaker06

105 archivos

8.51 minutos

Speaker07

120 archivos

9.35 minutos

Speaker08

120 archivos

10.51 minutos

Speaker09

105 archivos

8.96 minutos

Speaker10

120 archivos

11.75 minutos

Speaker11

105 archivos

8.36 minutos

Speaker12

120 archivos

12.37 minutos

Speaker13

105 archivos

8.11 minutos

Speaker14

105 archivos

8.54 minutos

Speaker15

120 archivos

8.68 minutos

Repositorio del dataset

El dataset está disponible para su descarga, pero para acceder al archivo completo, es necesario solicitar acceso a:


Instrucciones para obtener el acceso:

  1. Enviar un correo a secretaria.cis@unl.edu.ec indicando su solicitud para acceder al dataset.
  2. En el correo, por favor incluya:
    • Su nombre completo.
    • La razón de la solicitud.
    • En qué proyecto planea utilizar el dataset.

 Para descargar el dataset, se puede descargar en el siguiente botón:


Dataset Completo

Video demostrativo sobre como descargar el dataset

Equipo de Investigación

La presente investigación fue desarrollada con la ayuda y apoyo de:

  • Ing. Pablo Fernando Ordoñez Ordoñez:  Director de la Carrera de la Computación de la Universidad Nacional de Loja y administrador del servidor donde se encuentra el dataset.
  • Ing. Roberth Gustavo Figueroa Díaz: Director especialista del Trabajo de Integración Curricular y docente de Computación de la Universidad Nacional de Loja, encargado de validar la documentación y creación del dataset.
  • Ing. Oscar Miguel Cumbicus Pineda: Director especialista del Proyecto de Integración Curricular y docente de Computación de la Universidad Nacional de Loja , encargado de monitorear el proceso de inicialización para crear el dataset.
  • Tesista Josue Alejandro Sauca Pucha: Estudiante de la carrera de Computación de la Universidad Nacional de Loja, encargado de la realización del dataset y la redacción del proceso.

Contactos

Institución: Universidad Nacional de Loja, Ecuador

Correos: pfordonez@unl.edu.ec, roberth.figueroa@unl.edu.ec, oscar.cumbicus@unl.edu.ec, josue.sauca@unl.edu.ec