GraPho - Bedienungsanleitung

Inhaltsverzeichnis:
Allgemeines
Überblick
Konfiguration
Änderung des Grundfrequenzverlaufs
Änderung der Dauern
Abspeichern von Dateien
Anzeige optimieren
Upload und Anzeige von pho-Dateien


Allgemeines
GraPho - der grafische pho-Editor für MBROLA-pho-Dateien - erlaubt die interaktive Bearbeitung von F0-Verläufen und Lautdauern. Bisher erhältliche Editoren für die pho-Files, aus denen das Sprachsignal generiert wird, waren textbasiert, sodass zur Erzeugung eines bestimmten Grundfrequenzverlaufs sehr viel Tipp- und Rechenarbeit notwendig war. Das vorliegende Tool wurde entwickelt, um diesen Aufwand deutlich zu verringern und die Synthese intuitiver zu gestalten. Dies kann bei einer Vielzahl von Fragestellungen aus der Intonationsforschung eine wertvolle Hilfe sein.
Verwendet wird für die eigentliche Synthese das frei erhältliche Sprachsynthesesystem MBROLA sowie das an der Universität Bonn entwickelte HADIFIX/txt2pho für die Umsetzung des Textes in Phoneme.

Überblick
Sie sehen auf der Seite zwei Eingabefelder und eine Tabelle mit diversen Konfigurationsmöglichkeiten. Sie können entweder in das Feld "Text" normalen Text eingeben oder im Feld "Lautfolge" eine Transkription in Sampa-Notation (dabei die Laute durch Leerzeichen trennen). Klicken Sie auf "LOS" oder drücken Sie "RETURN" (auf der Tastatur), um das von HADIFIX/txt2pho standardmäßig erzeugte pho-File grafisch angezeigt zu bekommen. Unter der Tabelle sehen Sie nun zwei neue Zeilen, in denen die einzelnen Laute und ihre jeweiligen Dauern angegeben sind. Außerdem sehen Sie eine Grafik, in der der Grundfrequenzverlauf abgebildet ist. Um sich die erzeugte Synthese anhören zu können, klicken Sie in der Tabelle unten links auf "Audio" und nochmals auf "LOS". Daraufhin erscheint unter dem Bild eine Zeile "anhören: de1 de2 de3 de4 ..... 7-loud". Diese sind alle in MBROLA verfügbaren deutschen Stimmen. Klicken Sie diese an und es wird eine Wav-Datei heruntergeladen, die Sie - sofern ihr Internetbrowser richtig konfiguriert ist - sofort hören. Sie können nun die Intonation dieser Äußerung entsprechend ihren Wünschen anpassen. Sie können die Dauer der gesamten Äußerung, die Dauern einzelner Laute sowie den Verlauf der Grundfrequenz (Tonhöhe) verändern. Genaueres dazu erfahren Sie in den folgenden Abschnitten.

Konfiguration
Die Konfigurationstabelle (grauer Hintergrund) beinhaltet alle Einstellungen, um das Verhalten des Synthesetools zu beeinflussen.
Achtung: Ändern Sie eine Option (Radiobutton oder Checkbox), müssen Sie danach die Schaltfläche "LOS" anklicken. Ändern Sie dagegen den Wert in einem Eingabefeld, genügt es, die "RETURN"-Taste zu drücken.

Änderung des Grundfrequenzverlaufs
Punkt setzen oder löschen: Klicken Sie mit der Maus auf einen beliebigen Punkt im grauen Bereich der Grafik, so wird dort ein F0-Wert gesetzt. Falls Sie auf einen Punkt klicken, der scon vorhanden war, wird dieser gelöscht. Manchmal kann es vorkommen, dass dieser Punkt erst beim zweiten oder dritten Mal anklicken gelöscht wird, dann haben Sie evtl. nicht genau den Punkt getroffen. Sie können die Größe der Punkte einstellen, indem Sie in der Konfigurationstabelle (grau) den Wert für "Punktgröße" ändern (und danach den Button "LOS" anklicken oder "RETURN" auf der Tastatur drücken).
Punkt vertikal verschieben: Sie können einen schon vorhandenen F0-Wert nach oben oder unten verschieben, indem Sie an die neue Stelle in der Grafik klicken.
Punkt horizontal verschieben: Ist nicht möglich.

Dauer der Gesamtäußerung ändern
Tragen Sie im Feld "Dauer ändern" (rechts in der Konfigurationstabelle) einen Zeitfaktor ein, mit dem die aktuelle Dauer multipliziert werden soll und klicken Sie auf "LOS" oder drücken Sie "RETURN". Der Faktor muss größer als 0 sein. Werte zwischen 0 und 1 führen zu einer Verkürzung der Dauer, Werte größer 1 zu einer Verlängerung (z.B. 0.5 = Halbierung und 2 = Verdoppelung). Geben Sie Kommastellen immer mit Punkt an! Im Feld "Dauer ändern" wird nach einer Daueränderung wieder der Faktor "1" angezeigt, damit Sie die Dauer nicht ungewollt erneut verändern. Wenn Sie eine längere Äußerung erstellen, wird die Grafik wahrscheinlich zu groß für Ihren Bildschirm. Sie können zwar nach rechts scrollen, aber wenn Sie die ganze Äußerung auf dem Bildschirm sehen wollen, sollten Sie die Zeitskalierung entsprechend einstellen (siehe Abschnitt: "Anzeige optimieren").

Dauer einzelner Laute ändern
Um die Dauer eines einzelnen Lautes zu ändern, klicken Sie einfach mit der Maus in das Feld unter dem Laut (in der Liste "Lautfolge"). Dort ändern Sie die aktuelle Dauer in den von Ihnen gewünschten Wert und drücken "RETURN". Dauerwerte dürfen keine negativen Zahlen sein.
Achtung: In der Konfigurationstabelle (grau) sehen Sie die Optionen "bei Daueränderung: unverändert / anpassen". Ist die Option "anpassen" eingestellt (das ist standardmäßig der Fall), dann wird der aktuelle F0-Verlauf der neuen Dauer proportional angepasst. Ist die Option "unverändert" eingestellt, dann werden die vorhandenen F0-Werte einfach nach rechts oder links verschoben, je nachdem, ob Sie die Dauer des Lautes verlängert oder verkürzt haben.

Dateien abspeichern
Links neben der Grafik befinden sich zwei Links:

Sie können Sich diese Dateien durch Anklicken mit der Maus anzeigen lassen, oder mit Rechtsklick abspeichern.

Anzeige optimieren
Siehe Abschnitt "Konfiguration - Anzeigeoptionen"
Sie haben die Möglichkeit, die Größe des angezeigten Bildes in Höhe und Breite anzupassen. Dies erfolgt unabhängig von der Einstellung des Maximalwertes der anzuzeigenden Grundfrequenz und unabhängig von der realen Dauer der Äußerung. Sie müssen dazu die Werte für "Bildhöhe" und "Zeitfaktor" Ihren Wünschen entsprechend einstellen.
Sie können außerdem die maximal anzuzeigende Grundfrequenz einstellen - Option "F0-max".

Upload und Anzeige von pho-Dateien
pho-Dateien sind diejenigen Dateien, aus denen mit MBROLA eine Audiodatei erzeugt wird. Sie können eigene pho-Dateien auf den Server hochladen und anzeigen lassen, indem Sie auf "Durchsuchen" klicken, auf Ihrem Rechner eine pho-Datei auswählen und dann auf "senden" klicken. Daraufhin wird ihnen diese Datei grafisch und mit ihren Lautdauern angezeigt. Sie können "Audio" aktivieren und sich die Synthese mit allen verfügbaren Stimmen anhören und auch den Intonationsverlauf sowie die Lautdauern verändern. Das veränderte pho-File können Sie auch wieder abspeichern. Dazu befindet sich links neben dem Bild ein Link "Download: pho-Datei".

Anmerkungen und Fragen bitte per Mail an Astrid Bartels