Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Temario del curso
Fundamentos de la clasificación de audio
- Tipos de eventos sonoros: ambientales, mecánicos, generados por humanos.
- Resumen de casos de uso: vigilancia, monitoreo, automatización.
- Clasificación de audio frente a detección y segmentación.
Datos de audio y extracción de características
- Tipos y formatos de archivos de audio.
- Tasa de muestreo, ventana y tamaño de fotograma.
- Extracción de MFCCs, características cromáticas y mel-espectrogramas.
Preparación de datos y anotación
- Bases de datos UrbanSound8K, ESC-50 y datasets personalizados.
- Etiquetado de eventos sonoros y límites temporales.
- Equilibrado de datasets y aumento de datos de audio.
Construcción de modelos de clasificación de audio
- Uso de redes neuronales convolucionales (CNN) para audio.
- Entrada del modelo: forma de onda cruda frente a características extraídas.
- Funciones de pérdida, métricas de evaluación y sobreajuste.
Detección de eventos y localización temporal
- Estrategias de detección basadas en fotogramas y segmentos.
- Posprocesamiento de detecciones utilizando umbrales y suavizado.
- Visualización de predicciones en líneas temporales de audio.
Temas avanzados y procesamiento en tiempo real
- Aprendizaje por transferencia para escenarios con pocos datos.
- Implementación de modelos con TensorFlow Lite o ONNX.
- Procesamiento de audio en streaming y consideraciones sobre latencia.
Desarrollo del proyecto y escenarios de aplicación
- Diseño de una tubería completa: desde la ingestión hasta la clasificación.
- Desarrollo de un prototipo funcional para vigilancia, control de calidad o monitoreo.
- Registro de eventos (logging), alertas e integración con paneles de control o APIs.
Resumen y próximos pasos
Requerimientos
- Comprensión de los conceptos básicos de aprendizaje automático y entrenamiento de modelos.
- Experiencia con programación en Python y preprocesamiento de datos.
- Conocimiento de los fundamentos del audio digital.
Audiencia objetivo
- Científicos de datos.
- Ingenieros de aprendizaje automático.
- Investigadores y desarrolladores en procesamiento de señales de audio.
21 Horas