ºÚÁÏ´«ËÍÃÅ

Projekt Neuroinformatik - Sprecheridentifikation

Künstliche neuronale Netze und andere maschinelle Lernverfahren sollen für die Sprechererkennung eingesetzt werden. Bei der Sprechererkennung unterscheidet man zwischen der textabhängigen Sprechererkennung, bei der das Vokabular für die Erkennung festgelegt wird, und der textunabhängigen Sprechererkennung, bei der die Erkennung auf Subwortebene stattfindet und somit keine Beschränkung auf ein festgewähltes Vokabular nötig ist. Ferner unterscheidet man zwischen der Sprecheridentifikation (die sprachliche Äusserung wird einem von N Sprechern zugeordnet) und der Sprecherverifikation (es wird geprüft, ob die sprachliche Äusserung von dem genannten Sprecher stammt). Im Rahmen dieses Praktikums wollen wir uns vor allem mit der textunabhängigen Sprecheridentifikation befassen. Hierzu müssen im ersten Verarbeitungsschritt Merkmale aus den Sprachsignalen extrahiert werden und dann im zweiten Schritt Modelle für die zu identifizierenden Sprecher aufgebaut werden. Hierfür sollen Sprachaufnahmen von den Praktikumsteilnehmer aufgenommen und zum Test des Systems verwendet werden.

Termine:
Vorbesprechung: Mi 25.04.2012, 14:15 Uhr, Raum 2201
Mi 14:00-16:00 Uhr, Raum 2201

Literatur

Bernd Eppinger und Eberhard Herter: Sprachverarbeitung, Carl Hanser Verlag, 1993

A Tutorial on Text-Independent Speaker Verfication, EURASIP 2004:4, 430-451

Speaker Recognition A Tutorial, Proceedings of the IEEE, Vol 85, No 9, September 1997

An overview of automatic speaker recognition technology, ICASSP 2002

Programmierung

Die Programmierumgebung für das Praktikum ist Java (installiert auf den Poolrechnern oder ±¹±ð°ù´Úü²µ²ú²¹°ù).
Ferner wird das Java Media Framework benötigt (ebenfalls im Pool installiert oder ±¹±ð°ù´Úü²µ²ú²¹°ù).
Tutorials hierzu finden Sie oder

zum Einlesen, Abspeichern, etc von Audiodateien für (LPC-)Merkmale.
Die CoNIRVA Bibliothek ist ±¹±ð°ù´Úü²µ²ú²¹°ù.

Folienkopien (LPV, VQ, ...)



Dozent

  • Friedhelm Schwenker
  • Universität Ulm
    Institut für Neuroinformatik
    89069 Ulm
    Germany
  • Raum O27 / 4305
  • tel.: (+49) 731 / 50 24159
  • fax.: (+49) 731 / 50 24156