Bereits 1775 erkannte Joshua Steele, daß rhythmische Organisation als Bezugsgröße immer (nicht nur in der Musik) ein festes Taktmuster, also eine Folge gleicher (isochroner) Zeitintervalle voraussetzt. Auch ein in der Folgezeit immer wieder vermuteter Zusammenhang zwischen der kognitiven Präferenz für rhythmisierte Signale und dem menschlichen Herzrhythmus von Systole und Diastole wird von ihm erstmals formuliert.
Wichtig für die neuere Diskussion innerhalb der Phonetik und Linguistik wurde jedoch die folgende Bemerkung von Pike (1945):
The timing of rhythm units produces a rhythmic succession which is an extremely important characteristic of English phonological structure. The units tend to follow one another in such a way that the lapse of time between the beginning of their prominent syllables is somewhat uniform.[Pike 1945], S. 35 f.; zitiert nach [Auer/Uhmann 1988], S. 216
Die stärkste Formulierung der Isochronie-Hypothese findet sich aber bei [Abercrombie 1967]:
Although hesitation and other pauses tend at times to disguise the fact, all human speech possesses rhythm. [...] Rhythm in speech as in other human activities, arises out of the periodic recurrence of some sort of movement, producing an expetation that the regularity of succession will continue. [...] There are two basically different ways in which chest-pulses and stress-pulses can be combined, and these give rise to two main kinds of speech-rhythm. As far as is known, every language in the world is spoken with one kind of rhythm or with the other. In the one kind, known as syllable-timed rhythm, the periodic recurrence of movement is supplied by the syllable-producing process: the chest pulses, and hence the syllables recur at equal intervals of timethey are isochronous. [...] In the other kind, known as stress-timed rhythm, the periodic recurrence is supplied by the stress-producing process: the stress-pulses, and hence the stressed syllables, are isochronous [...].[Abercrombie 1967], S. 96 f.; zitiert nach [Auer 1993], S. 3f.
In diesem Zitat werden zwei Kandidaten für rhythmische Bezugsrahmen genannt: die Silbe und das (phonologische) Wort. Abercrombie nimmt an, daß alle Sprachen Isochronie jeweils bzgl. einer der beiden Einheiten anstreben, wobei aufgrund der unterschiedlichen Silbenzahl verschiedener Wörter sich natürlich der jeweils andere Parameter anisochron verhält. Abercrombie benennt drei Beispiele von Sprachen, für welche er Isochronie auf der Ebene der Silben vermutet: Silbenzählend (i. f. sz., s. Anmerkung 1) sind ihm zufolge das Französische, Telugu (eine dravidische Sprache) und Yoruba (aus der Kwa-Gruppe); akzentzählend (i. f. az.) hingegen das Russische, Englische und Arabische.
Die Isochronie-Hypothese in ihrer zitierten, starken Form induziert folglich eine Bipartition auf der Klasse der Sprachen der Welt und könnte falls sie empirisch bestätigt werden kann eine typologisch interessante Grundlage der Sprachklassifikation bilden, insbesondere, wenn aus dem Isochronietyp einer Einzelsprache noch weitere Eigenschaften der phonologischen Gestalt ableitbar wären. Die wenigen in der traditionellen Sprachwissenschaft vorgeschlagenen phonologischen »Typologien« (Ton vs. Akzent, Druckakzent vs. musikalischer Akzent, iambische [romanische] vs. trochäische [germanische] Sprachen), s. Anmerkung 2, kranken ja alle daran, daß einzelne isolierte Parameter noch nicht typologisch relevant sind im Sinne einer weit verbreiteten Auffassung von Sprachtypologie, die an der Auffindung kohärenter, umfassend bestimmter Idealtypen der einzelsprachlichen Strukturierung interessiert ist.
Länge des phonologischen Wortes [in Silben]: | 1 | 2 | 3 | 4 | 5 | 7 |
---|---|---|---|---|---|---|
Silbendauer [in cs]: | 22 | 17 | 16 | 17 | 16 | 14 |
Auch zum Spanischen, welches dem sz. Typ zugeordnet worden war, waren die Meßergebnisse nicht eindeutig. [Delattre 1966] betont etwa, daß Struktur und Position der Silbe im Spanischen großen Einfluß auf ihre Länge haben; jedoch ist die Varianz der Silbendauer insgesamt deutlich geringer als im Englischen.
Während die bisher erwähnten experimentellen Befunde zumindest eine Tendenz zur Isochronie auf Silben- bzw. Fußebene erkennen ließen, erbrachte die Überprüfung der 6 Beispielsprachen von Abercrombie durch [Roach 1982] Ergebnisse, welche sogar gegen die Isochronie-Hypothese in einer abgeschwächten Form sprechen, da die Unterschiede der Silbendauer in beiden Gruppen etwa gleich sind, während die als az. postulierten Sprachen sogar größere Abweichungen der durchschnittlichen Fußdauer aufweisen:
Französisch | 75,5 | Englisch | 86 |
Telugu | 66 | Russisch | 77 |
Yoruba | 81 | Arabisch | 76 |
Französisch | 617 | Englisch | 1267 |
Telugu | 870 | Russisch | 917 |
Yoruba | 726 | Arabisch | 874 |
Ferner wurde z. B. in Experimenten zum Englischen und Portugiesischen festgestellt, daß Auftakte (Silben vor der ersten Akzentposition) von der rhythmischen Organisation der Äußerung nicht betroffen werden, also extrarhythmisch sind. Darüberhinaus durchbricht auch die Tendenz zur phonetischen Dehnung von in einer Intonationsphrase finalen Einheiten (final lengthening) die Isochronie und demarkiert dadurch Tongruppengrenzen.
Noch in einem weiteren Punkt erweisen sich die Ergebnisse der Experimentalphonetiker als unangemessen im Hinblick auf unsere Fragestellung: Nicht das akustische Signal als solches ist entscheidend, sondern dessen Perzeption. Es zeigt sich in anderen Zusammenhängen, daß der postulierten Dichotomie doch eine gewisse psychologische Realität zukommt. So haben etwa Exophone eine verstärkte Wahrnehmung von in der fremden Sprache angelegten Tendenzen, außerdem zeigen Mitklopf-Experimente, daß mehr Rhythmus wahrgenommen wird, als physikalisch im untersuchten Signal vorhanden ist. [Fowler 1979] kommt sogar zu dem verblüffenden Schluß, daß die Sprecher bei der Artikulation rhythmisch isochroner Sequenzen genau die systematischen Anisochronien produzieren, welche die Hörer wiederum als isochron wahrnehmen. Da es jedoch weder ein eindeutiges artikulatorisches noch ein akustisches Korrelat dieses wahrnehmungspsychologischen Konzeptes gibt, ist die Isochronie-Hypothese wohl vom Phonetiker allein nicht entscheidbar.
[Auer 1993] weist jedoch zu Recht darauf hin, daß die Syntax von Spezifikator-Kopf-Strukturen nicht immer mit den semantisch bestimmten modifier-modified-Gliederung übereinstimmt. Ferner gibt es in den Sprachen nicht nur links- oder rechtsperipheren Akzent, so wie wir auch wortphonologisch nicht nur Erst- und Letztsilbenakzent finden. Weitere Probleme dieses Versuches einer Korrelation phonologischer und syntaktischer Struktureigenschaften von Sprachen ergeben sich aus den Voraussagen bzgl. der Segmentinventare und Tonalitätsphänomene: Die empirischen Überprüfungen von Auer anhand eines anderen OV/VO-Sprachpaares (Munda und Mon-Khmer) etwa ergaben hinsichtlich der phonologischen Systeme teilweise sogar gegenläufige Ergebnisse.
Zusammenfassend halten wir fest, daß zwischen morpho-syntaktischen Serialisierungsmustern und der Verteilung rhythmischer Prominenzstellen im Satz bzw. der Äußerung kein signifikanter Zusammenhang besteht.
[Ladefoged 1986], S. 244 spricht in ähnlichem Zusammenhang von einer »conspiracy« verschiedener phonologischer Faktoren im Englischen, welche eine gewisse rhythmische Regularität gewährleisten; der Isochronietyp wird so zu einem Epiphänomen des phonologischen Systems einer Sprache. Im folgenden sollen in stark verkürzter Form einige Grundgedanken der von [Auer 1993] postulierten phonologischen Idealtypen »sz. vs. az.« deduktiv entwickelt werden:
In einer az. Sprache etwa sind aufgrund der erforderlichen Variabilität der Silbendauer eher Reduktionsphänomene wie z. B. reduzierte Vokale zu erwarten; in sz. Sprachen kann dagegen eher Quantität phonologisch distinktiv werden, da die Dauer von Einzelsegmenten in geringerem Maße suprasegmentalen Erfordernissen unterworfen ist. Da Töne v. a. in hoch sonoren Silben auftreten, also solchen ohne Reduktionsvokale, sind sie bei az. Sprachen nur in Akzentsilben in jedem Falle möglich, in sz. Sprachen jedoch überall realisierbar und somit wahrscheinlicher. Hingegen sollten in einer idealtypisch sz. Sprache keine intrinsisch kürzeren Phoneme wie zentralisierte oder stimmlose Vokale zu finden sein. Auch muß die Silbenstruktur in konsequenter Weiterverfolgung dieser deduktiven Argumentation in sz. Sprachen möglichst einfach sein, vor allem in der konsonantischen Koda, daher sind für diese Sprachen insbesondere intervokalische Konsonanten-Cluster ungünstig. Dagegen sind in einer az. Sprache Cluster sogar wahrscheinlich (cf. den Begriff »schwere Silbe«), eventuell sogar solche, welche gegen den universell präferierten Sonoritätsverlauf innerhalb einer Silbe verstoßen; als Folge dieser komplexen Konsonantenfolgen erwarten wir Assimilations- und Dissimilationsvorgänge.
Ferner kann die Bestimmung von Silbengrenzen in az. Sprachen schwierig sein, da akzentuierte Silben dazu neigen, bei schnellem Sprechen Konsonanten an sich zu ziehen, d. h. die Silbentrennung kann sogar in Abhängigkeit vom Sprechtempo variabel erfolgen. Sz. Sprachen hingegen können durchaus Geminaten aufweisen, da die für die Existenz von Geminaten erforderliche Eindeutigkeit der Silbengrenzen in diesen Sprachen ja gewährleistet ist.
Dafür werden Wortgrenzen eher in az. Sprachen phonologisch relevant, etwa indem initiale und finale Konsonanten eines phonologischen Wortes verstärkt werden, um die dominante prosodische Einheit zu demarkieren, und zwar durch bestimmte phonetische Prozesse, die im Wortinneren nicht vorhanden sind (z. B. Aspiration, [Prä-]Glottalisierung). Also ist in az. Sprachen die Opposition wortmedial wortperipher phonologisch relevant. Demgegenüber sind in sz. Sprachen die Wortgrenzen schwierig zu bestimmen, ja unter Umständen sogar Resyllabifizierungsprozesse über Wortgrenzen hinweg vorstellbar.
Unter (3) findet sich eine Zusammenstellung dieser und weiterer postulierter Eigenschaften der beiden rhythmologisch begründeten Idealtypen konsistenter phonologischer Systeme:
Silbenrhythmus | Wortrhythmus |
---|---|
keine akzentabhängigen Reduktionen | Reduktion nichtakzentuierter Silben |
[±lang] bei C und V aller Silben möglich | keine distinktiven Qualitäten in unakz. Silben |
Töne möglich | keine Töne |
einfache Silbenstruktur | komplexe Silbenstruktur, evtl. nicht-optimaler Sonoritätsverlauf |
wenig Assimilationsregeln | häufige Assimilationen und Dissimilationen |
Silbengrenzen eindeutig | Gelenkbildung, Silbengrenzen können variabel sein |
keine Wortbezogenen phonologischen Prozesse | wortbezogene phonologische Prozesse |
externe = interne Sandhiphänomene | ¬ (externe = interne Sandhiphänomene) |
Vokalharmonie möglich | keine Vokalharmonie |
phonetisch schwach markierter oder fehlender Wortakzent | starker phonetischer Wortakzent |
Wortakzent, falls vorhanden, fest, ohne grammatische Funktionen | Regeln der Akzentuierung komplex, evtl. grammatikalische Funktionen |
Geminaten möglich | keine Geminaten |
keine zentralen (reduzierten) Vokalphoneme | zentrale Vokale als Phoneme möglich |
Das Fehlen eines solchen eindeutigen Prominenzgipfel bedeutet jedoch noch nicht automatisch eine Abwertung der phonologischen Bedeutung der Worteinheit. So fanden sich in der Stichprobe von Auer drei Sprachen (z. B. die wegen ihrer clicks zu einer gewissen Berühmtheit gelangte Khoisansprache !xóo), die wortbezogen Töne zuweisen, jedoch keine Wortakzente im Trubetzkoyschen Sinne vergeben. Somit ergibt sich eine neue prototypikalische Dichotomie »Silben- vs. Wortsprachen« nach der das Lautsystem einer Sprache dominierenden »Hauptkategorie«. Dabei spielen Wortakzente in Silbensprachen eine geringere Rolle als in Akzentsprachen; das Fehlen eines Wortakzentes in einer Sprache erlaubt allerdings, wie wir gesehen haben, keinerlei Rückschlüsse auf ihren prosodischen Typ.
|| | Il a sollicité ma collaboration | || | car Pierre aime toujours l'art | || |
A (12 Silben) | B (6 Silben) |
Abschnitte | A+B | A | B | Pause zwischen A und B |
---|---|---|---|---|
Dauer [in cs] | 341 | 162 | 148 | 30 |
Es ergibt sich eine beinahe perfekte Isochronie, v. a. wenn man die intervenierende Pause zu B rechnet.