rltdfdok: 20130802

Ich experimentiere mit Text-to-Speech-Softwares, die das Problem der Quantität und potentiellen, qualitativen Heterogenität bei der Erzeugung von Sprachpassagen mit einem Schlag lösen könnten.

Mesosticha TtS Generierung (Stimmnamen: m Reiner, f Klara)

Erstes Substantiv (Geschlecht m/f) definiert Lesestimme



(Screenshot: Online-TtS-Software http://www2.research.att.com/~ttsweb/tts/demo.php)

61 Soundfiles (Names ff.: M01_tts_Male.wav) sind auf ein zweites Soundboard mit 2 Racks zu platzieren. Weitere Beobachtungen:

-> Vor allem Überschneidung (overlap) mehrerer Files hören sich gut an und machen das Stück lebendig.

-> Zu überlegen, ob nicht vielleicht auch die STL-Texte im TtS-Verfaren als Files (45) zu generieren wären … Das gesamte Arrangement würde allerdings komplett den Charakter einer “Lesung” einbüssen, stattdessen erhälte es evtl. den Charakter einer DJ-Session.

Folgende (kostenlose) Softwares sind ebenfalls zu testen:

http://codewelt.com/proj/speak (2/5)

http://www.fromtexttospeech.com/ (4/5)

Stimmen: m/f, Sarah/Klaus, Satzzeichen sind zu entfernen, da sonst (unverständlich) mitgesprochen -> Weitere Anforderungen: Zeilenumbrüche einfügen … kürzere Sätze… alle Umlaute müssen ausgeschrieben werden zu ü zu ue etc … )

mehr: http://myappmag.com/free-online-text-to-speech-voice-converter/

Auch denkbar wäre der gesamte Sprechtext der STL in einem sauber angepassten File, das entsprechend nach Ablauf einer STL-Passage angehalten wird … (Elemente mit Titel?: “Zahl Ort” (Start) -> “Ende Zahl Ort” (Ende) (1) ) (= verworfen. Aber: Zu überprüfen wäre, ob solch ein Gesamt-File nicht mit einer speziellen Software nach Passagen getrackt werden könnt. Zu testen, bspw., die Software „Slice Audio File Splitter“.)

Eine zweite Text-to-Speech-Software soll also die Stimme für die Passagen der STL generieren.



(Screenshot: http://www.fromtexttospeech.com/)

Das Ergebnis liegt in einer Datei. Zur Abspielung benötigt wird noch etwas Hardware:

Ich lege das File in ein Android Tablet und installiere eine extragrosse PLAY/PAUSE-Taste.



(Screenshot: PLAY/PAUSE-Taste auf Android Tablet)

Wie vermutet ist eine Bedienung nach diesem Verfahren in einer multitaskerischen Performance zu umständlich, sodass diese Idee verworfen werden muss. Und weitergearbeitet werden muss mit dem Versuch, aus den STL-Passagen Einzelfiles für ein weiteres Soundboard zu erzeugen.

Derweil wird Arbeitstitel und Untertitel dieser Arbeit revidiert:

„Recycling Le Tour de France“

Komposition für drei Soundboards, eine Yamaha PSR-420 und diverse, künstliche Stimmen

————

1 Diese Idee wird nach Praxistest verworfen. Das Verfahren ist live nicht gut handlebar …

rltdfdok: 20130801

Erster Entwurf einer Partitur(struktur):

(Screenshot/Image: der Partitur Seite 1. Weil verschiedenste Bilder und Zeichen implementiert werden, die Scorio-Notenblattentwürfe aber unkonvertierbar als PDF ausgegeben werden, müssen die Partiturseiten fortan einzeln mit Acrobat Pro ediert und weiterentwickelt werden.)

Noch zu bestimmen ist die mengenmässige Verteilung von 61 Mesosticha auf 45 Orte, bei teilweiser M-Dublierung von STL-Elementen mit kürzeren, kleineren Textmengen.

Und als nächstes vorzubereiten:

Die Umrechnung Orte in Zahlen / Noten -> Notensatz (KL/STL)

Sowie Keyboard-Tests, ML-Sounds?

Allg, Partitur-Arrangement

rltdfdok: 20130730 [2]

ad 03: Weiter zu überlegen: Ob die 61 Mesosticha nicht von verschiedenen Stimmen gesprochen und aufgezeichnet werden. Dann könnten diese ebenfalls (via weiterem Soundboard) abrufbar gemacht und in eine umfassendere Partitur geplant werden.

Oder: Gibt es Softwares, die unterschiedliche Stimmen für kurze Textpassagen (in die ML = Mesosticha Line) generieren? -> OK s. 20130802

Vorteile: Stimmen, Keyboards und Soundboards können dann doch insgesamt von 1, maximal 2 Personen bedient werden.

Theoret. Implikationen: Demokratische, multisonore, abwechslungsreiche Stimmung, stärkere Betonung der Rezeption der Texte

Nachteile: Stimmen sammeln und schneiden = viel Arbeit

ad 09 und generell:

Es besteht ein zahlenmässiges Ungleichgewicht im Verhältnis Orte (= Seitenzahl der Partitur), Mesosticha und Soundelemente. Wie bzw. nach welchem Schlüssel können diese umgelegt bzw. verteilt werden? Quantitativ? Qualitativ) Andere?:

In Zahlen:

45 Orte (Orteliste)

Mehr als 180 Sätze (Stimme 2) = > 4 Sätze / Ort

61 Mesosticha

91 image2sounds (= ISL)-Elemente

X Weitere Elemente (Sorten)?*

__________

* X Sounds FieldRecordings (zu überlegen, ob solche noch genommen / recherchiert werden). X Sounds Musiktracks (sollen solche überhaupt verwendet werden, oder ist Keyboard ausreichend?)

rltdfdok: 20130730

FF Weitere / Folgenotizen

Ich habe mich dafür entschieden, da nun das Arbeitsfeld in den vergangenen 10 Punkten eher inhaltlich aufgespannt wurde, den weiteren Prozess sozusagen chronologisch, d.h. im Zeitpfeil zu dokumentieren. Eine Zeitcodierung (JJJJ.MM.TT) verweist auf einen geplanten oder umgesetzten Arbeitsschritt. Diese kann aber manchmal auch unmittelbar an Überlegungen in o.a. Punkten anschliessen. Auch hier wird es stichwortartige Einträge, Reflektionen, Dokumentationen verworfener Ideen geben …

20130730

ad 08: Ich entscheide mich für einen Neuansatz in der Keyboardverwendung (Kombination Stimme 2 mit Keyboard): Zur Verwendung steht nun vor allem die Orte-Liste (Bewegung im Raum). Aus den ersten 2 mal 2 Zeichen der Ortschaften werden mit einem spezifischen Schlüssel numerische VOICE- und STYLE-Informationen für das Yamaha-Keyboard generiert (Quersummenbildung bei Mehrstelligkeit):



(Screenshot: Excel-Tabelle der Ortschaften und der Schlüssel)

Mit einem anderen Schlüssel („Tonref.“ in Abb.) werden (zu spielende) Tonfolgen generiert.



(Screenshot: Versuch der Tonfolgen-Abbildung, sowie der Integration der „2. Stimme“ mit der Online-Software scorio.com)

ad 05: Um die Textmenge der 2. Stimme gleichflächig verteilen zu können, wurde diese in eine Excel-Tabelle gefügt und die “Satzmenge” berechnet (= ca. 180). Verteilt auf 45 x “Ort” sind je etwas mehr als 4 Sätze als “Liedtext” auf eine Ort-Tonfolge umzulegen.



(Screenshot: Ausschnitt Exceltabelle zur quantitativen Bestimmung des Textes der 2. Stimme)

Das Notensatzprogramm scorio.com ermöglicht eine Darstellung von Tonfolge und Liedtext, ordnet beides automatisch an, sodass Text vertikal und horizontal gelesen werden kann.

Kann / Sollte dieser Effekt eingesetzt werden?

Oder sollte der Text in dieser Anordnung noch überarbeitet bzw. gekürzt werden?

Nebenbei: Es gilt auch zu überlegen, ob nicht alle Einzelbilder (= Seiten der Partitur, s.o.) als 2. Thread der Serie im Blog veröffentlicht werden sollten (Parallel dazu? Oder im Anschluss?)

rltdfdok: 10 Metatext, Dokumentation, Selbstreflexivität

Glücklicherweise wurden bis hier hin immer kleine Produktionsnotizen gemacht. Der Arbeits- und Projektkomplex schwillt weiter an (glücklicherweise, so soll das bei autopoetischen Ansätzen sein) und ohne diese würde der gesamte Hergang langsam nicht mehr rekonstruierbar werden.

Der Entschluss packt mich, dass es neben einer „Partitur“ (sowie einer „Aufführung“) als Endprodukt noch einen Textapparat geben sollte, der den gesamten Entstehungsprozess und die Zusammenhänge rudimentär zeigen kann. Kein Romanwerk, kein elaborierter Essaytext, eher ein offenes Gewebe aus Notizen, assoziativen Stichwortkatalogen, Entwürfen und Ideenskizzen und anderen Materialien, die möglicherweise aber auch selbst erklärungsbedürftig sind … aber es muss auch nicht alles ausgetreten werden. Pfeile, Signale als potentielle Richtungsgeber sollten genügen, um auch einen kreativen Prozess beim Rezipienten auszulösen … Aber wir wären die Notizen anzulegen bzw. zu strukturieren?

Über die Schreibung der (dieser) Notate / des Materialapparates …:

Zu berücksichtigen sind

● Inhalt

● Struktur

● Date-Model

1

Allmähliches Auffüllen, Weiterreflektieren der Struktur, der / obiger Punkte 1-9 (notfalls weitere Punkte 11ff. einführen?)

2

Spielen mit „wissenschaftlichen“ Zitaten, Sekundärliteratur etc. (plus Quellangaben, ausgehend von Wikipedia und anderen Lexika etc … einzubauen in kleinerer Punktgrösse. Oder als Fussnote? Oder beides?)

3

Lineare Fortentwicklung?

Oder fortlaufende Ergänzung der Punkte?

Mit Datumsangabe? Der Niederschrift? Der Ergänzung?

(Z.B.: Timestamp: 2013-08-02 _13:24)

4

Lässt sich das smarte Tiddlywiki5 (1) dazu einsetzen? (Ich gebe zu: meine derzeitige Lieblingssoftware … Und das schon seit „Bibliotheca Caelestis“.)

———————



1 Vgl. http://tiddlywiki.com/