Geintra

Departamento de electronica Universidad de Alcala

Research lines

Access information on the Geintra research activity structure. More information


Work with us

Access to our current offer of grants and contracts. More information


Contact

You can contact us using different means. More information

    Estudio, implementación y evaluación de un sistema de seguimiento de múltiples locutores usando fusión audiovisual

    TitleEstudio, implementación y evaluación de un sistema de seguimiento de múltiples locutores usando fusión audiovisual
    Publication TypeMaster Thesis
    Año de publicación2010
    Thesis Advisor(s)Marron, M, Macias-Guarasa, J
    AutoresSanabria-Macias, F
    Idioma de publicaciónSpanish
    Institution

    University of Alcala

    School

    Escuela Politecnica Superior

    Degree

    Máster Universitario en Sistemas Electrónicos Avanzados. Sistemas Inteligentes.

    Academic DepartmentDepartment of Electronics
    Number of volumes1 vol.
    Páginas98
    Fecha de publicación09/2010
    Palabras claveDetección de Actividad Acústica, Detección de Rostros, Filtrado de Partículas., fusión audiovisual, Seguimineto de Personas
    Lugar de publicaciónAlcala de Henares
    Resumen

    En este trabajo se ha diseñado, implementado y evaluado un sistema de seguimiento de locutor usando fusión audiovisual. La información de audio y vídeo es obtenida a partir de arrays de micrófonos y cámaras de vídeo situados en el entorno. El sistema está compuesto por dos bloques que extraen información de audio y vídeo y esta información es mezclada en un plano de ocupación, paralelo y a una altura ``h'' del suelo. Un filtro de partículas modela la dinámica de dicha mezcla, obteniendose finalmente la localización estimada del locutor en cada instante de tiempo. Como bloque de audio se implementa un algoritmo de detección de actividad acústica por sectores (volúmenes cónicos alrededor de cada array). Posteriormente, se busca en el interior de las intersecciones de los sectores activos de todos los arrays y el plano de ocupación, la región de máxima potencia acústica, usando el algoritmo Steered Response Power. El bloque de visión detecta rostros humanos en las imágenes de las cámaras de video, con una versión multi-pose del algoritmo Viola and Jones. Las proyecciones de dichas detecciones sobre el plano de ocupación, son combinadas con operadociones lógicas. El sistema fue evaluado usando la base de datos AV16.3.

    Tipo de trabajoMaster
    AttachmentSize
    20100927-TM-Final-FrankSanabria.pdf1.77 MB