Forensische Sprecher-Erkennung

Aktuelle Untersuchungsmöglichkeiten in der gutachterlichen Praxis

Von Dipl.-Sprechwiss. Cornelia Dubielzig und Dr. Christoph Meinerz,
Sachverständige für Sprecher-Erkennung am Landeskriminalamt Brandenburg

Täteridentifizierung durch Stimmenvergleich


Ende des Jahres 2011 werden im Leipziger Elsterflutbecken, zerstückelt und verpackt in Plastiksäcken, die Überreste eines 23jährigen Einheimischen gefunden.
Eine solche Fallkonstellation lässt zunächst nicht vermuten, dass entscheidende Ermittlungshinweise im Ergebnis einer Untersuchung zum Stimmenvergleich gewonnenen werden können. Im konkreten Fall wurde das Sachgebiet Sprecher-Erkennung des Landeskriminalamtes Brandenburg auch erst vier Monate später in die Sachbearbeitung einbezogen, als ein dringender Tatverdacht gegen einen ebenfalls 23jährigen Leipziger bestand und er festgenommen werden konnte.
Was war zwischenzeitlich geschehen? Der Tatverdächtige war seit der Tat auf der Flucht und zuletzt bei Bekannten im Bundesland Hessen untergeschlüpft. Durch Telefonüberwachungsmaßnahmen im Umfeld gelang es, ihn dort bei einem Freund ausfindig zu machen, da er im Verlauf eines TKÜ-Mitschnitts zwischen diesem und einem weiteren Bekannten ans Telefon geht. Einen Tag später erfolgte die Festnahme.

Im Besitz des nunmehr Beschuldigten fanden die Ermittler ein digitales Diktiergerät, dessen Aufzeichnungen zwar gelöscht, aber nicht erneut überschrieben waren. Die rekonstruierten insgesamt 14 Audio-Dateien enthielten Überraschendes, nämlich einen durch eine männliche Person aufgesprochenen Plan zur Tötung und Zerstückelung eines Menschen und zur anschließenden Flucht, der auffallende Übereinstimmungen zum Tathergang und den weiteren Ermittlungsergebnissen im vorliegenden Fall besaß.
Die Aufzeichnungen auf dem Diktiergerät kamen für Staatsanwaltschaft und Polizei einem Geständnis gleich und bildeten für die Sachverständigen für Sprecher-Erkennung des Landeskriminalamtes Brandenburg das fragliche Material (Audio-Spurenmaterial), da mit einer Untersuchung zum Stimmenvergleich zu klären war, ob der Beschuldigte mit dem Sprecher der relevanten Passagen auch identisch ist.

Audio-Spurenmaterialien


Eine Untersuchung, deren Materialgrundlage Mikrofonaufzeichnungen sind, stellt für die Sachgebiete Sprecher-Erkennung von Bund und Ländern (BKA, Bayerisches LKA, LKA Berlin, LKA Brandenburg, LKA Nordrhein-Westfalen) erfahrungsgemäß den weniger typischen Fall dar. Im Allgemeinen werden als Audio-Spurenmaterialien Telefonmitschnitte eingesandt, die im Zusammenhang mit Notrufen oder TKÜ-Maßnahmen aufgezeichnet wurden. Allerdings ist in den letzten Jahren die Vielfalt fraglicher Audio-Aufzeichnungen enorm gewachsen, insbesondere da praktisch jeder imstande ist, mittels seines Handys Audio- oder Videomitschnitte von Tathandlungen als Beweismaterialien zu erstellen. Insofern sind zumindest ähnliche Fallkonstellationen, wie die hier präsentierte, zukünftig in verstärktem Maße zu erwarten.

Materialkritik hinsichtlich der Aufzeichnungsqualität


Liegt die Telefonaufzeichnung eines fraglichen Sprechers zur Untersuchung vor, dann ergeben sich Verluste des ursprünglichen Sprachsignals, die allein Folge dieses Übertragungsweges sind. Die Sprachlaute werden in einem Frequenzbereich produziert, der bis etwa 20 kHz reicht. Der Telefonkanal überträgt jedoch nur Frequenzanteile bis ca. 3,4 kHz. Die hieraus resultierenden Informationsverluste wirken sich daher besonders auf solche Laute aus, deren Energieschwerpunkte im oberen Frequenzbereich des Sprachspektrums liegen; das sind vor allem Zischlaute. Ergebnis dessen ist, dass diese Konsonanten sowohl durch das phonetisch geschulte Gehör als auch durch eine Spektralanalyse nicht umfassend bewertet werden können. Beispielsweise ist eine Unterscheidung zwischen s- und f-Lauten in den Wörtern reißen-Reifen durch isoliertes Hören oder eine Spektralanalyse nicht immer zweifelsfrei möglich; sie klingen sehr ähnlich. Der Hörer erkennt jedoch meist das richtige Wort, da es sich aus dem sprachlichen Kontext ergibt.
Der Informationsverlust bei Telefonaufzeichnungen ist jedoch bei der Vielzahl bestimmbarer Merkmale so gering, dass eine gerichtsverwertbar hohe Identitätsaussage dennoch keine Seltenheit ist. Bestimmte Merkmale sind vom Informationsverlust durch Telefonübertragung überhaupt nicht betroffen, sonst wäre eine effektive Kommunikation mittels Telefon auch gar nicht möglich. Einschränkungen für die Untersuchung ergeben sich immer dann, wenn weitere Beeinträchtigungen der Aufzeichnung hinzutreten. Als besonders schädlich erweisen sich so genannte nichtlineare Verzerrungen, die vor allem Folge von Übersteuerungen bei einer Sprachaufzeichnung sind. Solche Degradierungen des Nutzsignals sind irreversibel und beeinträchtigen nicht nur die mess-, sondern auch die hörphonetischen Untersuchungen erheblich, wenngleich die Verständlichkeit durchaus erhalten bleibt. Auch der entgegen gesetzte Fall, die Untersteuerung, bei der sprachliche Äußerungen zu leise aufgezeichnet werden, bringt Probleme mit sich, da der Intensitätsabstand zwischen dem Sprachanteil als Nutzsignal und dem vorhandenen Grundrauschen bzw. zusätzlichen Hintergrundgeräuschen als Störsignal zu gering ist. Der Fachmann spricht hier von einem geringen Signal-Rausch-Abstand bzw. einer eingeschränkten Dynamik. Verstärkt man als Gegenmaßnahme eine solche Aufzeichnung insgesamt, so werden natürlich beide Signalanteile gleichermaßen angehoben. Telefonate per Handy bergen die Gefahr weiterer qualitativer Einschränkungen; die ohnehin schon eingeschränkte Signalqualität wird zusätzlich beeinträchtigt, z.B. durch Signalkompression, worunter insbesondere die Zuverlässigkeit bestimmter messphonetischer Verfahren leidet.

Materialkritik hinsichtlich der Ergiebigkeit


Neben der qualitativen Eignung ist für eine umfassende Begutachtung einer Sprachaufzeichnung die ausreichende Ergiebigkeit der Sprechleistungen von großer Bedeutung, da neben der Bewertung einer repräsentativen Anzahl einzelner Laute oder Lautverbindungen auch solche Merkmale untersucht werden müssen, die über den Einzellaut hinausgehen, wie z.B. die Betonung oder der Sprechmelodieverlauf. Eine Netto-Sprachdauer von 30 Sekunden, also die Sprechleistungen ausschließlich des fraglichen Sprechers nach Abzug der Pausen, liefert in der Regel eine für höhere Wahrscheinlichkeitsaussagen zur Sprecheridentität ausreichende Datengrundlage.

Audio-Vergleichsmaterialien


Audio-Spurenmaterialien sollen im Rahmen eines forensisch-phonetischen Gutachtens Vergleichsstimmproben Verdächtiger gegenübergestellt werden, deren Herkunft ebenfalls unterschiedlichster Natur sein kann. So kommen prinzipiell auch weitere Telefonaufzeichnungen in Betracht, bei denen die Identität des Sprechers bekannt oder zumindest nahezu geklärt ist. Geeigneter im Sinne der Beweisführung sind authentisierte Stimmaufzeichnungen, bei denen das Einverständnis der betreffenden Vergleichsperson für die Aufzeichnung seiner Stimme vorliegt. Vergleichsstimmproben werden im Land Brandenburg und für Bundesländer, für die das Landeskriminalamt Brandenburg im Rahmen von Kooperationen (Thüringen, Sachsen, Sachsen-Anhalt und Mecklenburg-Vorpommern) tätig ist, grundsätzlich durch die Sachverständigen für Sprecher-Erkennung im LKA Brandenburg selbst aufgezeichnet, um den notwendigen Qualitätsstandard für ein forensisch-phonetisches Stimmenvergleichsgutachten zu gewährleisten. Grundsätzlich sind hier jedoch auch offen aufgezeichnete Vernehmungsmitschnitte geeignet.
Im vorliegenden Fall kam zunächst die bereits erwähnte, bei einem Telefonat des Freundes entstandene TKÜ-Aufzeichnung, die unter anderem Sprechleistungen des Tatverdächtigen enthielt, in Frage. Allerdings bestand hier keine letztgültige Sicherheit über die Sprecheridentität. Die zuständige Staatsanwältin, der dieses Manko durchaus bewusst war, veranlasste, gezielt nach in dieser Hinsicht geeigneten privaten Videoaufzeichnungen des Beschuldigten zu suchen. Tatsächlich fand sich in seiner Wohnung ein längeres Video in ausreichender akustischer Qualität, in der er sich selbst sprechend filmt. Für eine Untersuchung zum Stimmenvergleich gestaltete sich die gesamte Materialkonstellation als ausgesprochener Glücksfall. Durch das Auffinden der Videoaufzeichnung des Beschuldigten bot sich die vorteilhafte Situation, dass sowohl das Audio-Spurenmaterial als auch das Audio-Vergleichsmaterial als Mikrofonaufnahmen, also ohne nennenswerte qualitative Einschränkungen, zur Verfügung standen.
Prinzipiell stellen derartige nachträglich beschlagnahmte audio-visuelle Aufnahmen, wenn sie qualitativ und quantitativ geeignet sind, eine Möglichkeit dar, auch bei nicht vorliegendem Einverständnis des Tatverdächtigen einen Stimmenvergleich mit authentischem Material durchführen zu können.

Untersuchung zum Stimmenvergleich


Die eigentliche Untersuchung bei einem Stimmenvergleich erstreckt sich auf die drei wesentlichen Bereiche sprachlichen Verhaltens des Menschen: Stimme, Sprache und Sprechweise.
Bei der Analyse von Merkmalen der Stimme richtet sich zunächst das Augenmerk auf die Schwingungsvorgänge der Stimmlippen im Kehlkopf. Der hier erzeugte primäre Stimmklang wird beim Passieren des Vokaltraktes, also des Rachen-, Mund- und Nasenraumes, der infolge anatomisch-physiologischer Eigenheiten bei jedem Menschen individuell ausfällt, resonatorisch weiter überformt. Dabei entsteht der sekundäre Stimmklang. Primäre stimmliche Merkmale können beispielsweise Rauigkeit, Behauchtheit, Gepresstheit oder Knarrstimme im Bereich der Stimmgebung im Kehlkopf sein. Zu den sekundären stimmlichen Merkmalen zählen etwa eine charakteristische Nasalität oder ein dunkler bzw. heller oder sonstiger spezifischer Stimmklang. Grundsätzlich werden die für jeden Sprecher typischen Abweichungen von der Normal- bzw. Modalstimme und deren Ausprägungsgrad, einschließlich pathologischer Auffälligkeiten, beschrieben.

Foto: Thomas Hofem


Jeder Sprecher erfährt seine regionalsprachliche Prägung üblicherweise innerhalb der Zeit des Schulbesuches. Die daraus resultierenden dialektalen Eigenheiten stellen eine wesentliche Komponente des zweiten Bereiches zu analysierender Merkmale dar, dem der Sprache. Selbst wenn eine Person ihren Wohnort nach Beendigung der Schulausbildung wechselt, bleiben erworbene regionaltypische Merkmale erhalten. Andere, der neuen Umgebung entstammende Einflüsse können zwar hinzukommen, behalten aber im Allgemeinen einen eher peripheren Charakter. Ferner werden individualtypische Besonderheiten auf den sprachlichen Ebenen der Wortwahl, Grammatik, Semantik und Stilistik analysiert.Der dritte Bereich, die Sprechweise, umfasst zwei Komplexe. Zum einen richtet sich der Fokus auf charakteristische Merkmale der Lautbildung. Hierzu gehören auch pathologische Auffälligkeiten, wie z.B. das Lispeln. Der zweite Komplex umfasst Merkmale, die nicht als primär sprachlich bezeichnet werden können, für das Verständnis aber von großer Wichtigkeit sind, insbesondere da sie Äußerungen gliedern, differenzieren und werten. Zu ihnen gehören solche Parameter wie z. B. Sprechmelodie, Akzentuierung, Sprechgeschwindigkeit, -rhythmus, -pausengestaltung, -lautstärke und Atemverhalten.

UNTERSUCHUNGSMATERIALIEN


Häufig stellen sich zwei miteinander verknüpfte Fragen im Zusammenhang mit Untersuchungsmaterialien im Bereich der Sprecher-Erkennung:

  • Welche Materialien können überhaupt untersucht werden?
  • In welcher Form sollten sie zur Untersuchung eingesandt werden?

Für das Sachgebiet Sprecher-Erkennung im Landeskriminalamt Brandenburg lautet die kurze Antwort darauf:
Jedes Material, welches einen relevanten Audioanteil beinhaltet, kann eingesandt und hinsichtlich seiner Eignung bezüglich der entsprechenden Fragestellung untersucht werden.
Die längere Antwort erfordert eine etwas differenziertere Betrachtung. Zunächst muss zwischen analogen und digitalen Trägermedien unterschieden werden.
Analog vorliegendes Material umfasst die ganze Bandbreite an historisch gewachsenen Magnetband-Tonträgern. Angefangen beim Spulen-Tonband, über verschiedene Diktiergerät- und Audio-Kassettentypen bis zur Tonspur von VHS- oder Hi8-Videobändern. In diesem Zusammenhang ist anzumerken, dass die Grundlage für eine Analyse mit aktuellen Digital-Audio-Workstations im digitalen Vorliegen der Untersuchungsmaterialien besteht. Um eine solche hochwertige Analog-Digital-Wandlung zu gewährleisten, ist grundsätzlich die Einsendung der Originalmedien erforderlich. Nochmals um Einiges vielfältiger als die Anzahl analoger Trägermedien ist die Landschaft digitaler Dateistandards. Durch den Einsatz professioneller Softwarelösungen können jedoch auch weniger gebräuchliche Formate verlustfrei der Analyse zugänglich gemacht werden. Zu beachten ist generell, dass Änderungen des Dateiformats, beispielsweise aus Speicherplatzerwägungen heraus, immer kritisch zu bewerten sind und nicht auf Seiten des Einsenders durchgeführt werden sollten. Wenn ein geschlossenes System vorliegt, aus dem die Aufzeichnungen zum Versand extrahiert werden müssen, so sind unkomprimierte Formate, wie etwa das .wav-Format in PCM-Kodierung, stets zu bevorzugen.


Die aus der Untersuchung resultierende Merkmalskonfiguration wird für jede einzelne Sprachprobe separat erhoben.
Es gibt Menschen, die aufgrund besonderer und seltener Merkmale einen höheren Wiedererkennungswert haben. Für andere Personen hingegen sind eher allgemeine stimmliche und sprachliche Eigenschaften kennzeichnend, die auf eine größere Anzahl weiterer Sprachteilhaber ebenfalls zutreffen und somit wenig spezifisch ausfallen. Phoniert beispielsweise ein männlicher deutscher Muttersprachler in einer mittleren Sprechstimmlage von 120 Hz und wird beim Vergleichssprecher ein sehr ähnlicher Wert gemessen, so besteht hier zwar eine prinzipielle Merkmalsübereinstimmung. Allerdings lässt sich bei ca. 50% der Männer deutscher Herkunft ebenfalls ein vergleichbares Messergebnis erzielen. Der individualisierende Charakter einer derartigen Merkmalskongruenz ist somit als sehr gering zu bewerten. Liegt hingegen eine Sprachaufzeichnung eines deutschsprachigen Mannes mit einer mittleren Sprechstimmlage von 200 Hz vor, einer Frequenz, die schon im unteren Bereich der weiblichen mittleren Sprechstimmlage rangiert, dann haben wir es mit einem in der männlichen Bevölkerung sehr seltenen Messwert zu tun. Die Aussagekraft dieses Merkmals besitzt also einen viel höheren Stellenwert für eine sich anschließende Identitätsaussage. Es muss somit in jedem Einzelfall gewichtet werden, welches Merkmal welche Bedeutung für das Gesamtergebnis besitzt.

Merkmalsanalyse


Zurück zum Leipziger Mordfall: Der Sprecher der wiederhergestellten 14 Audio-Dateien des digitalen Diktiergerätes aus dem Besitz des Beschuldigten, die einen mit dem tatsächlichen Geschehen auffällig übereinstimmenden Tat- und Fluchtplan enthielten, wies mehrere als stark individualisierend zu klassifizierende Merkmale von Stimme, Sprache und Sprechweise auf, die mit denen der Vergleichsperson aus der TKÜ-Aufzeichnung bzw. mit denen der privaten Video-Aufzeichnung in hohem Maße übereinstimmten. Einige herausragende Beispiele sollen nachfolgend dargestellt werden.
Der jeweilige Sprecher von Audio-Spurenmaterial und Vergleichsstimmproben zeigte zunächst eine auffällige Fehlbildung des sch-Lautes, einen so genannten lateralen Schetismus, umgangssprachlich auch „Hölzeln“ genannt. Hierbei wird der konzentrierte Luftstrahl nicht, wie für eine physiologische Bildung dieses Reibelautes erforderlich, in Richtung der Schneidezähne gelenkt, sondern entweicht seitlich in Richtung der Wangentaschen. Daraus resultiert ein allgemein als unangenehm empfundenes schlürfendes Geräusch.
Ferner erbrachte die Analyse, dass der jeweilige Sprecher in allen untersuchten Audio-Materialien stotterte. Prinzipiell lassen sich zwei Arten dieser Redeflussstörung unterscheiden, das klonische und das tonische Stottern. Die erste Form äußert sich in mehrmaligen Wiederholungen von Silben meist am Wortanfang. Die zweite Variante ist durch krampfartige Blockaden zu Sprechbeginn gekennzeichnet. Untersuchungen haben ergeben, dass die Redeflussstörung Stottern bei ca. 1 % der Bevölkerung auftritt, wobei Männer drei- bis viermal häufiger betroffen sind als Frauen. Beim jeweiligen Sprecher von Audio-Spuren- und -Vergleichsmaterial zeigte sich eine spezifische Stottersymptomatik. Dabei standen die tonischen Anteile (kurze krampfartige Stockungen) im Vordergrund, ergänzt durch gelegentliche klonische Einschübe (wenige Male wiederholte Silben). Allerdings wurden die genannten Auffälligkeiten durch das Einfügen von Pausen und Häsitationen, Verzögerungen des Sprechtempos, überdeutliche Artikulation oder plötzliche Veränderung des Stimmklangs bzw. der Intonation recht gut kaschiert und waren für den phonetischen Laien nicht ohne weiteres erkennbar.
Ein drittes übereinstimmendes und zugleich ungewöhnliches Merkmal in allen untersuchten Audio-Materialien bestand in einem abrupten Wechsel des Artikulationsortes im Vokaltrakt, deren Ursache pathologischer Natur zu sein schien und am ehesten mit der ebenfalls auffälligen Nasalität im Zusammenhang stand. Hierbei kam es zu einer kurzzeitigen Rückverlagerung der Lautbildung in Richtung des Rachenraums. Verschluss- und Zischlaute waren hiervon am stärksten betroffen und wurden dementsprechend nicht mehr normgerecht gebildet.

Abbildung 1: Das obige Schaubild verdeutlicht wesentliche Aspekte der verwendeten Wahrscheinlichkeitsrangskala. Ersichtlich werden sowohl die bipolare Ausprägung der Skala, wie auch die pro Skalenstufe in Richtung eines der beiden Pole zunehmende Sicherheit der Aussage. Die Grafik beruht auf gemeinschaftlichen Überlegungen beider Autoren und Herrn Dr. Masthoffs (Universität


Die angegebenen exemplarischen Merkmale können nur mit Hilfe des phonetisch geschulten, analytischen Gehörs des Sachverständigen zuverlässig beurteilt werden, dem daher auch die größte Bedeutung bei der Durchführung von Stimmenanalysen und Stimmenvergleichen zukommt. Zur Ausbildung des Sachverständigen, üblicherweise in der Fachrichtung Phonetik, gehört es, die Merkmale physiologischer Vorgänge bei der Bildung von Stimme, Sprache und Sprechweise sowie deren Abweichungen erkennen, beschreiben, klassifizieren und bewerten zu können. Darüber hinaus muss bei einer derartigen Analyse das Wissen um das äußerst variable, insbesondere von situativen Faktoren abhängige sprechsprachliche Verhalten des Menschen Berücksichtigung finden. Hierzu gehören physische oder psychische Belastung, Umgebungslärm oder die soziale Prägung eines Sprechers.

Auditiv-akustische Untersuchungsmethode


Ergänzt und erweitert werden die auditiven Befunde durch messphonetische Verfahren, bei denen es vor allem um die Objektivierung des gewonnenen Höreindruckes geht. Hierzu zählen z.B. die bereits erwähnte Grundfrequenzmessung oder die Bestimmung der Artikulationsrate als Maß für die Sprechgeschwindigkeit. Einen besonderen Stellenwert nehmen die Verfahren der Oszillografie und der Spektralanalyse ein. Im Oszillogramm wird die Amplitude der Luftdruckschwankungen dargestellt, die das Sprachsignal bewirkt und auf die Mikrofonmembran überträgt. Die auf der Grundlage der Spektralanalyse erzeugte sonagrafische Darstellung visualisiert die Frequenzcharakteristik des Sprachsignals, deren Auswertung wichtige Informationen über Stimmklangparameter und individualtypische lautliche Besonderheiten liefern kann.

Automatische Verfahren


Zusätzlich zu der beschriebenen, in der Fallarbeit bewährten und anerkannten kombinierten auditiv-akustischen Methode werden in der jüngeren Vergangenheit in einschlägigen akademischen Kreisen verstärkt Verfahren zur automatischen Sprecher-Erkennung diskutiert und entwickelt. Der Einsatz entsprechender Systeme ist besonders bei in der gutachterlichen Praxis tätigen Sachverständigen umstritten.
Nach derzeitigem Entwicklungsstand kann ein seriöser Einsatz derartiger Verfahren zur automatischen Sprecher-Erkennung nur unter sehr restriktiven Rahmenbedingungen stattfinden. Als problematisch erweisen sich Einflüsse des Übertragungskanals, der Netto-Sprachdauer, der Sprechsituation und der jeweils ausgewählten oder vorhandenen Hintergrundstatistik. Selbst wenn die Vorraussetzungen hierfür gegeben sind, ist das Ergebnis, das aus dem Einsatz eines solchen automatischen Systems resultiert, im Rahmen der Gesamtbewertung lediglich als ein Merkmal unter vielen zu verstehen. Ihm kommt allenfalls eine vergleichbare Wertigkeit wie beispielsweise der Grundfrequenzmessung zu.
Nach eingehender fachlicher Bewertung setzt die Sprecher-Erkennung des LKA Brandenburg das ihr zur Verfügung stehende System zum aktuellen Zeitpunkt explizit nicht in der Fallbearbeitung ein.

Untersuchungsergebnisse und Schlussfolgerung im Gutachten


Jedes zu untersuchende Audio-Material wird zunächst einer Einzelanalyse unterzogen, deren Befunde denen der anderen Aufzeichnungen gegenübergestellt werden. Im Anschluss daran wird in der Gesamtschau der jeweiligen Merkmalskonfigurationen eine verbale Aussage zur Identität oder Nichtidentität auf der nachfolgenden bipolaren Wahrscheinlichkeitsrangskala getroffen:


Identität / Nichtidentität

  • liegt mit an Sicherheit grenzender Wahrscheinlichkeit vor
  • liegt mit sehr hoher Wahrscheinlichkeit vor
  • liegt mit hoher Wahrscheinlichkeit vor
  • liegt mit überwiegender Wahrscheinlichkeit vor
  • kann nicht beurteilt werden („non liquet“)

Zum besseren Verständnis der Skala soll die Visualisierung in Abbildung 1 dienen.


Wie lautete die Aussage im Leipziger Mordfall?

Die in den untersuchten Audio-Materialien festgestellten Merkmalsübereinstimmungen hinsichtlich Stimme, Sprache und Sprechweise waren in ihrer Anzahl und Typizität so groß, dass zumindest im Vergleich des Audio-Spurenmaterials mit der Heimvideo-Aufzeichnung die Aussage „Identität liegt mit an Sicherheit grenzender Wahrscheinlichkeit vor“ getroffen werden konnte. Wegen der kanalbedingten Einschränkungen der Telefonüberwachungsaufzeichnung fiel die Aussage für dieses Audio-Vergleichsmaterial nicht so hoch aus; immerhin wurde noch eine „Identität mit sehr hoher Wahrscheinlichkeit“ festgestellt.

Literatur

Baken, R. J., and Robert F. Orlikoff. Clinical Measurement of Speech and Voice. San Diego: Singular Publishing Group, 2000.
Becker, Timo. Automatischer forensischer Stimmenvergleich. Norderstedt: Books on Demand GmbH, 2012.
Braun, Angelika. “Forensische Sprach- und Signalverarbeitung.” In Handbuch des Fachanwalts Strafrecht, herausgegeben von Jan Bockemühl, 1632-1654. Köln: Wolters Kluwer, 2012.
Hollien, Harry. The Acoustics of Crime. The New Science of Forensic Phonetics. New York: Plenum Press, 1990.
Hollien, Harry. Forensic Voice Identification. London: Academic Press Inc., 2002.
Wendler, Jürgen, Wolfram Seidner, and Ulrich Eysholdt. Lehrbuch der Phoniatrie und Pädaudiologie. Stuttgart: Georg Thieme Verlag KG, 2005.Wirth, Günther. Sprachstörungen, Sprechstörunge, Kindliche Hörstörungen: Lehrbuch für Ärzte, Logopäden und Sprachheilpädagogen. Köln: Deutscher Ärzte-Verlag GmbH, 2000.

UNTERSUCHUNGEN BEI SCHWER VERSTÄNDLICHEN AUFZEICHNUNGEN


Die Verständlichkeit von Sprachaufzeichnungen kann durch unterschiedliche Störfaktoren beeinträchtigt sein. Um aus solchen Materialien dennoch möglichst viele Informationen zu extrahieren, stehen zwei Herangehensweisen zur Verfügung.
Zum einen kann eine technische Aufbereitung des beeinträchtigten Materials angestrebt werden. Zu diesem Zweck wird in der Regel auf auditiv-spektralanalytischem Weg ein Profil der vorliegenden Störkomponenten erstellt, die in ihrer Gesamtheit zur Beeinträchtigung der Verständlichkeit des Nutzsignals geführt haben. Auf Grundlage dieses „Störprofils“ wird in der Folge unter Einsatz spezialisierter softwarebasierter Werkzeuge versucht, diese unerwünschten Einflüsse zu reduzieren und die relevanten Signalanteile nach Möglichkeit prominenter abzubilden. Die daraus resultierende Fassung der Aufzeichnung wird im Anschluss dem Auftraggeber zur weiteren Verwendung übersandt. Liegen allerdings Störprofile vor, die sich aus verschiedenen nicht-konstanten Störkomponenten zusammensetzen, kann die technische Aufbereitung an ihre Grenzen stoßen.

In solchen Fällen bietet sich das zweite Verfahren zum Umgang mit schwer verständlichen Aufzeichnungen, die phonetische Textanalyse, an. Hierbei wird eine sprachwissenschaftlich fundierte auditiv-phonetische Analyse unter optimalen technisch-akustischen Abhörbedingungen durchgeführt. Das Ergebnis einer phonetischen Textanalyse besteht in einer detaillierten Verschriftung, die mit dem Anspruch größtmöglicher Objektivität erstellt wird. Dementsprechend werden beispielsweise nicht eindeutig verständliche Äußerungen als solche gekennzeichnet oder unter Angabe von plausiblen Alternativen notiert. Unverständliche Sprachanteile werden speziell gekennzeichnet. Neben der eigentlichen phonetischen Textanalyse können bei Bedarf Zusatzinformationen, wie über relevante Hintergrundgeräusche und -sprecher, zur Verfügung gestellt werden. Weiterhin können bereits vorliegende Verschriftungen auf Wunsch hinsichtlich ihrer phonetischen Plausibilität geprüft werden. Da es sich bei der phonetischen Textanalyse grundsätzlich um eine sehr aufwändige Untersuchungsmethode handelt, sollte die zu verschriftende Passage fünf Minuten Aufzeichnungsdauer nicht wesentlich überschreiten.


Wichtiges in Kürze

Von Gunhild v. d. Groeben, Journalistin, Mainz

Stille Post: Digitale Überwachungsmaßnahmen nehmen zu


Digitale Überwachungstechnik wird von den Sicherheitsbehörden in Deutschland verstärkt eingesetzt. Das ergibt sich aus der Antwort der Bundesregierung auf eine Kleine Anfrage der Fraktion Die Linke.
Das Bundesamt für Verfassungsschutz verschickte im ersten Halbjahr 2014 fast 53000 sogenannte stille SMS zur Ortung von Handys. Das waren fast doppelt so viele wie im ersten Halbjahr 2013. Das BKA versandte in den ersten sechs Monaten des Jahres fast 35 000 solcher Kurzmitteilungen, die Bundespolizei fast 69 000. Über den Versand von "stillen SMS" beim Zoll machte die Regierung keine Angaben; sie wurden als Verschlusssache eingestuft.
Beim BKA gab es in der ersten Jahreshälfte 704 Maßnahmen der Telekommunikationsüberwachung (TKÜ). Etwa 200 hatten bereits im vergangenen Jahr begonnen. Im Vergleich zum ersten Halbjahr 2013 blieben die Zahlen laut BKA in etwa gleich.
Drei Mal machte das BKA in der ersten Jahreshälfte 2014 von der Möglichkeit der Funkzellenabfrage Gebrauch, die Bundespolizei weniger als 50 Mal, der Zoll 100 Mal.
Der Einsatz sogenannter IMSI-Catcher zum Abhören von Telefongesprächen nahm leicht ab; der Zoll setzte diese Technik öfter ein als zuvor.Mehr: http://dip21.bundestag.de/dip21/btd/18/022/1802257.pdf