1. Eine auditive Intuition: Alternative Rhythmisierungen
Im Anschluss an Karl Bühlers Vorschlag die Audition sprachlicher Zeichen nicht ausschließlich im System distinktiver Einzellaute (Phoneme) zu verankern, sondern im Normalfall von der ganzheitlichen Wahrnehmung lautlicher Komplexe (‘Klanggesicht’) auszugehen (♦), hatte sich die Sonorität und ihre silbische Kombination mit mehr oder weniger starken Obstruktionen als elementar erweisen (♦). Aber unter den relevanten "Komplexmerkmalen" erwähnt Bühler ausdrücklich auch prosodische Phänomene, nämlich "die Melodie, das Stimmhöhenrelief des Lautstroms, weiter das rhythmische Gepräge (stark – schwach, kurz – lang)" (Bühler 1934a, 284). Die drei Ausdrücke sind unterschiedlich klar: ‘Rhythmus’ steht für Muster, die sich wiederholen und das ‘Stimmhöhenrelief’ entspricht gewiss der Intonation. Wenig klar ist, was darüber hinaus noch mit ‘Melodie’ gemeint kann. Aber in jedem Fall setzen alle drei Ausdrücke eine Silbenfolge, d.h. eine über die Einzelsilbe hinausgehende zeitliche Gestaltung des lautlichen Ausdrucks voraus.
Die auditive Bedeutung dieser prosodischen Gestaltung (vgl. zur Prosodie Lehmann Abruf 14.05.2019, Kap. 15; ♦) gehört zum intuitiven Wissen der Sprecher (♦), wie sich darin zeigt, dass in der Heteroperzeption prosodische Charakteristika anderer Sprachen/Dialekte als auffällig empfunden werden; auf Deutsch spricht man dann alltagssprachlich vom Tonfall, auf Italienisch von der cadenza usw. Im Folgenden werden einige prosodisch unterschiedlich organisierte romanische Sprache durch kurze Proben illustriert:
1.1. Englisches Beispiel
The little Prince (♦)
Once when I was six years old I saw a magnificent picture in a book, called True Stories from Nature, about the primeval forest. It was a picture of a boa constrictor in the act of swallowing an animal. Here is a copy of the drawing.
In the book it said: "Boa constrictors swallow their prey whole, without chewing it. After that they are not able to move, and they sleep through the six months that they need for digestion."
I pondered deeply, then, over the adventures of the jungle. And after some work with a colored pencil I succeeded in making my first drawing. My Drawing Number One. (Quelle Text)
1.2. Französisches Beispiel
Le petit prince (♦)
Lorsque j’avais six ans j’ai vu, une fois, une magnifique image, dans un livre sur la forêt vierge qui s’appelait Histoires vécues. Ça représentait un serpent boa qui avalait un fauve. Voilà la copie du dessin.
J’ai alors beaucoup réfléchi sur les aventures de la jungle et, à mon tour, j’ai réussi, avec un crayon de couleur, à tracer mon premier dessin. (Quelle Text)
1.3. Italienisches Beispiel
Il piccolo principe (♦)
Un tempo lontano, quando avevo sei anni, in un libro sulle foreste primordiali, intitolato “Storie vissute della natura”, vidi un magnifico disegno. Rappresentava un serpente boa nell’atto di inghiottire un animale. Eccovi la copia del disegno.
1.4. Portugiesisches Beispiel
(1) O pequeno principe (Port. Portugal) (♦)
Certa vez, quando tinha seis anos, vi num livro sobre a Floresta Virgem, "Histórias Vividas", uma imponente gravura. Representava ela uma jibóia que engolia uma fera. Eis a cópia do desenho.
(2) O principezinho (Port. Brasilien) (♦)
2. Rhythmus und Dauer (Isochronie)
Ein britischer Phonetiker, Arthur Lloyd James (1940), hat diesen intuitiven, alternativen Höreindruck zunächst ganz vorwissenschaftlich als Gegensatz eines "machine-gun rhythm" (Französisch) und eines "morse code rhythm" (Englisch) bezeichnet. Der amerikanische Linguist Kenneth Lee Pike formulierte dann terminologisch genauer die Dichotomie von "stress timed" vs. "syllable timed languages" (Pike 1945, 35). David Abercrombie hat hinter den beiden Typen zwei alternative Isochronieprinzipien vermutet, die entweder nach Akzentisochronie streben und die zeitlichen Abstände zwischen Akzenten gleich lang gestalten (‘stress timed’) oder aber nach Silbenisochronie und die Silbenlänge ausgleichen (‘syllable timed’).
Although hesitation and other pauses tend at times to disguise the fact, all human speech possesses rhythm. [...] Rhythm in speech as in other human activities, arises out of the periodic recurrence of some sort of movement, producing an expectation that the regularity of succession will continue. [...] There are two basically different ways in which chest-pulses and stress-pulses can be combined, and these give rise to two main kinds of speech-rhythm. As far as is known, every language in the world is spoken with one kind of rhythm or with the other. In the one kind, known as a syllable-timed rhythm, the periodic recurrence of movement is supplied by the syllable-producing process: the chest pulses, and hence the syllables recur at equal intervals of time - they are isochronous. [...] In the other kind, known as a stress-timed rhythm, the periodic recurrence is supplied by the stress-producing process: the stress-pulses, and hence the stressed syllables, are isochronous. [...] When one of the two series of pulses is in isochronous succession, the other will not be. Thus in a syllable-timed rhythm the chest-pulses are unevenly spaced. (Abercrombie 1967, 96 f. zit. in Auer 1993)
Allgemein kann man also sagen, dass isochroniebasierte Konzeptionen davon ausgehen, dass Sprachen grundsätzlich dazu tendieren ihre lautliche Form auf der Basis gleichlanger prosodischer Einheiten zu organisieren. Allerdings unterscheiden sich die einzelnen Sprachen, so Andreas Dufter, "in ihrer Wahl der prosodischen Konstituentenkategorie für diese zeitliche Angleichung" (Dufter 2003, 1). Es können Silben, akzentuierte Guppen oder in anderen Darstellungen außerdem Phrasen oder Moren1 sein.
Man beachte, dass diese Isochronie-Hypothese ausschließlich und nachdrücklich in Produktionsprozessen fundiert ist (‘pulse’, ‘producing process’). Damit verbunden waren zwei andere Annahmen, nämlich - wie bereits gesagt - die alternative Zugehörigkeit einer Sprache entweder zum einen oder aber zum anderen Typ, und die Konditionierung des phonologischen Systems einer Sprache durch den jeweiligen rhythmischen Typ, oder allgemeiner gesagt, durch die Prosodie:
Ambedue le predizioni della dicotomia IA [=Akzentisochronie; Th.K.] e IS [=Silbenisochronie; Th.K.] nominate sopra, inoltre, sono state falsificate: per quanto riguarda la non esistenza di sistemi intermedi, che non hanno, cioè, né il suono di una mitragliatrice né quello di un messaggio in alfabeto morse, è stato mostrato che il portoghese brasiliano, per esempio, è una lingua intermedia tra IS e IA. La seconda predizione, che nello sviluppo linguistico il ritmo sia primario e determini il sistema fonologico, si è pure dimostrata falsa: i primi enunciati dei parlanti nativi dell’inglese contengono solo sillabe il cui nucleo è costituito da vocali pienamente articolate. La mancanza di riduzione vocalica [...] in questo stadio dello sviluppo fa sí che il ritmo sembri a isocronismo sillabico. (Nespor, 1993, 259).
Die nur über das Kriterium der Dauer definierte Isochronie ist jedoch auf der Basis von Produktionsdaten messtechnisch nicht nachzuweisen. Dennoch wurde
die Unterscheidung der beiden Rhythmisierungstypen nicht aufgegeben; zunächst wurde sie durch Auer/Uhmann kontinual, im Sinne einer ‘prototypischen’ Akzentisochronie bzw. ‘prototypischen’ Silbenisochronie aufgefasst und jeweils mit einer ganzen Reihe phonologischer Prozesse in Verbindung gebracht werden, die in der Tat oft kopräsent begegnen. In diesem Verständnis sind die beiden Rhythmisierungsprinzipen letztlich nicht mehr (und nicht weniger) als nützliche Etikettierungen (vgl. Auer/Uhmann 1988: 244) der im Folgenden genannten Bündel von lautlichen Eigenschaften (nach Auer 1993); aus der zeitbasierten Opposition ist in dieser Sicht eine Opposition von Konstellationen geworden2, die in Anlehnung an Donegan/Stampe in ‘word-rhythm’ vs. ‘syllable-rhythm’ umbenannt wurden. Die Umbennenung ist sicherlich problematisch, denn im einen wie im anderen Typ gibt es sowohl Wörter als auch Silben; im übrigen liegen die beiden Begriffe auf ganz verschieden Beschreibungsebenen, insofern ‘Silbe’ rein formbezogen ist und ‘Wort’ dagegen auch den Inhalt impliziert und sich insofern auf das Zeichen als Ganzes bezieht.
syllable-rhythm | word-rhythm |
no accent-dependent reduction | reduction of non accented syllables in quality and/or duration |
[±long] in consonants and vowels of all syllables possible | no [±long] distinction in non-accented syllables |
tone possible | no tone (or non accented syllables are “neutral”) |
simple syllable structure open syllables | complex syllable structure, sonority scale disobeyed |
few assimilations | frequent assimilations, dissimilations |
syllable division unambiguous | syllable division ambiguous a nd variable |
no word-related phonological processes | word-related phonological processes |
external = internal sandhi | external ≠ internal sandhi |
vowel harmony possible | no vowel harmony |
phonetically weak word accent or none at all | phonetically strong word accent realized by pitch (and other prosodic features) |
word accent (if any) fixed, no grammatical functions | word accent assigned by complex rules referring to syllable structure, partly morphologized, or free, may have grammatical functions |
geminates possible | no geminates |
no central (“reduced”) vowel phonemes | central vowel phonemes possible |
aus Auer 1993, 11 |
Die Dauer, aus der die beiden Prinzipien ursprünglich abgeleitet wurden, spielt hier nur noch eine ganz marginale Rolle als segmentales Merkmal [±long],
in order to underline the phonological, multiparametrical approach, and to distinguish it from a purely durational, phonetic one. (Auer 1993, 15)
Auer charakterisiert seine Konzeption als: (1993, 35 ff.)
a) [...] holistic instead of atomistic [...]
b) [...] deductive instead of inductive [...]
c) [...] phonological and phonetic instead of purely phonetic [...]
d) [...] neither process-oriented nor inventory-oriented [...]
e) [...] prototypical instead of categorical [...] (Auer 1993, 35 ff.)
Der mulitfaktorielle und prototypische Ansatz erleichtert den Umgang mit Sprachen, die in der ursprünglich Konzeption schwer zu typisieren waren. Als schwierig galt speziell der Status des Französischen, das in der Forschung teils als Vertreter des einen, teils des anderen Typs angesehen wurde:
Most difficult to answer is the question where French belongs. On the one hand, modern colloquial French („français avancé“) increasingly tolerates phonetically complex syllables, particularly in the onset and in pre-pausal (phrase-final) position, and particularly in more colloquial varieties, and it has a schwa-vowel which occurs in non-accented syllables only, although the overall degree of phonetic reduction of full vowels in non-accented position is minor. On the other hand, liaison and enchaînement favour open syllables, syllable division is largely unambiguous by consequence, and there is no word accent independent of phrasal accent. This justifies its classification as non-prototypically syllable-timed. (Auer 1993, 11)
Es wäre zweifellos interessant, die romanischen Standardsprachen oder Dialekte einzelner Standardsprachen im Hinblick auf die in der oben zitierte Tabelle aus Auer 1993, 11 genannten Kriterien zu überprüfen; vermutlich würde keine davon einem der beiden Prototypen vollständig entsprechen; aber vermutlich wären Italienisch und Spanisch näher beim silbenrhythmischen, Französisch und Portugiesisch dagegen näher beim wortrhythmischen Pol des Kontinuums. In Bezug auf manche Parameter ist das Bild sicherlich diffus:
- Das eher silbenrhythmische Italienische kennt, wenngleich in sehr reduzierter Weise, komplexe Silbenanfangsränder des Typs CCCVCV (/s/+Plosiv+Liquid, z.B. strano) ;
- das eher wortrhythmische europäische Portugiesisch zeichnet sich durch (schwach ausgeprägte) Harmonisierungsprozesse aus (vgl. das Audio zu novo vs. nova sowie dass Audio zu certo vs. certa); das bras. Portugiesische ist in den genannten Beispielen uneindeutig, da eine Harmonisierung nur im Fall des /o/, aber nicht im Fall des /e/ zu hören ist.
Auers Konzeption ist dominant produktionsorientiert, allerdings wird die Perzeption durchaus beachtet:
A first feature of stress-timing languages is an immediate consequence of their tendency to keep the duration of the foot/word constant. Although a number of different 'strategies' are available to reach this end, an important one surely is that, compared with accent syllables, non-accented syllables are reduced. This reduction may be phonetic and/or phonological, depending on | whether we think of phonetic or phonological duration. Phonetically, non-accented syllables tend to have central or massively centralized, short vowels; phonemically, they permit fewer contrasts than accent syllables, i.e. there is "neutralization". In particular, long phonemic segments (long vowels or geminate consonants) will not be allowed in non-accented syllables, as they would enhance the quantitative differences between mono- and polysyllabic words. A perceptual correlate is this: since in a stress-timed language stress guides the listener to syllables of perceptual and cognitive prominence, a maximum of information tends to be concentrated in these syllables. For this reason, the maximum of phonemic contrasts will be found in these syllables. In contradistinction, in a prototypical syllable-timing language, accented and non-accented syllables are treated much the same; there is no phonemic reduction, and phonetic reduction is comparatively small. (Auer 1993, 6)
Es ist in der Tat unausweichlich, dass die mit dem Akzentrhythmus einhergehenden Reduktionsprozesse zu einer starken kognitiven Salienz der Tonsilbe führen. Deshalb liegt der Versuch nahe, der Opposition eine über die Phonetik und Phonologie hinausgreifende, grundsätzliche Relevanz im Sinne einer holistischen Typologie beizumessen und die rhythmischen/prosodischen Charakteristika mit morphosyntaktischen Erscheinungen der jeweiligen Einzelsprache bzw. des jeweiligen Typs zu korrelieren. Viel Beachtung fand der Vergleich zweier genetisch eng verwandter, jedoch typologisch völlig divergenter austroasiatischer Sprachen (Munda und Mon-Khmer) von Patricia Donegan und David Stampe (1983). Die folgende Tabelle gibt einen Überblick (Donegan/Stampe 1983, 337).
MUNDA | MON-KHMER | |
Phrase Accent: | Falling (initial) | Rising (final) |
Word Order: | Variable - SOV, AN,Postpositional | Rigid - SVO, NA, Prepositional |
Syntax: | Case, Verb Agreement | Analytic |
Word Canon: | Dactylic/Trochaic, Iambic, | Monosyllabic |
Morphology: | Agglutinative, Suffixing, Polysynthetic | Fusional, Prefixing or Isolating |
Timing:(C)(C) | Isosyllabic | Isomoric Isoaccentual |
Syllable Canon: | (C)V(C) | (C)V or (C)(C)V(C)(C) |
Consonantism: | Stable, Geminate Clusters | Shifting, Tonogenetic, Non-Geminate Clusters |
Tone/Register: | Level Tone (Korku Only) | Contour Tones/Register |
Vocalism: | Stable, Monophthongal, Harmonic | Shifting, Diphthongal, Reductive |
Die von den Autoren an die erste Stelle gesetzte Opposition zwischen initialem und finalem Satzakzent ist auch die hierarchisch wichtigste,
because accent is the only factor pervading all the levels of language, and the only factor capable of explaining the specific typological tendencies at each level in evolutions such as those of Munda and Mon Khmer. (Donegan/Stampe 1983, 340)
Wie man sieht, wird dem Satzakzent die ‘Erklärung’ aller typologisch relevanten Faktoren (Wortstellung, Kongruenz, Rhythmus, Silbenstrukur) zugemutet; dazu zählen auch segmentale Prozesse wie die Vokalharmonie und -reduktion, vokalischer und konsonantischer Wechsel usw. Frans Plank (1998) hat gezeigt, daß die holistische Hoffnung, eine typologisch stichhaltige Kovariation zwischen der phonologischen Ebene auf der einen Seite und der morphologisch/syntaktischen Ebene auf der anderen festzustellen, die Sprachwissenschaft seit je begleitet hat; seine Zusammenstellung zeigt aber auch, wie sehr sich die bisher vertretenen Positionen widersprechen:
[...] the likeliest candidates for true cross-level links would be agglutination/flection, and perhaps morpheme and word size in morphology, constituent order in syntax, and segment inventories, phonotactics, vowel harmony processes, and rhythm in phonology. For all these parameters it is yet to be seen whether freqency of mention will be confirmed by the sounder evidence of reasonable cross-linguistic samples. (Plank 1998, 224)
3. Perzeptive Evidenz für rhythmustypologische Unterschiede
Die ursprüngliche, perzeptive Fundierung rhythmustypologischer Unterschied wurde jedoch nicht aufgegeben, sondern durch phonetische Experimente zur rhythmisch konditionierten Unterscheidbarkeit von Sprachen wieder aufgenommen. Insbesondere wurde festgestellt dass bereits Neugeborene allem Anschein nach dazu in der Lage sind. In Nazzi u.a. 1998 werden die Ergebnisse von drei Experimenten publiziert, die zeigen, dass Neugeborene die Prosodie mancher Sprachen unterscheiden; Kriterium ist die zunehmende Frequenz und Intensität von Saugbewegungen (ohne dabei zu trinken):
- Im ersten Experiment unterschieden die Kinder zwischen einem englischem (‘stress timed’) und einem japanischen (‘mora-timed’) Stimulus; die Stimuli waren tiefpassgefiltert, d.h. alle Frequenzen oberhalb der Grundfrequenz (Formant 0) waren ausgefiltert.
- Im zweiten Experiment zeigte sich, dass Kinder nicht zwischen einem englischen (‘stress timed’) und einem niederländischen (‘stress timed’) Stimulus unterschieden.
- Im dritten Experiment unterschieden die Kinder zwischen kombinierten Stimuli aus Englisch/Niederländisch (beide ‘stress timed’) einerseits und aus Spanisch/Italienisch (beide ‘syllable-timed’) andererseits.
Die Unterscheidbarkeit prosodischer Unterschiede scheint also zur angeborenen auditiven Verarbeitung akustischer Signale zu gehören, die den erst später beginnenden Spracherwerb im eigentlich Sinn konditionieren. Es erhebt sich allerdings die Frage, welche akustischen Phänomene dafür verantwortlich sind. In Ramus u.a. 1999, 266 f. werden (im Anschluss an Dauer 1983) vor allem zwei Phänomene identifiziert:
- Syllable structure: stress-timed languages have a greater variety of syllable types than syllable-timed languages. As a result, they tend to have heavier syllables. In addition, this feature is correlated with the fact that in stress-timed languages, stress most often falls on the heaviest syllables, while in syllable-timed languages stress and syllable weight tend to be independent.
- Vowel reduction: in stress-timed languages, unstressed syllables usually have a reduced vocalic system (sometimes reduced to just one vowel, schwa), and unstressed vowels are consistently shorter, or even absent (this was also noticed by Bertinetto, 1981). (Ramus u.a. 1999, 268)
Beide gemeinsam konstituieren den "phonological account of rhythm" (Ramus u.a. 1999, 269). Auf dieser Grundlage wurden andere Analysen und Tests durchgeführt. So zeigt die folgende Tabelle Unterschiede zwischen rhythmustypologisch offenkundig unterschiedlichen Sprachen. Im Verhältnis vokalischer und konsonantischer Intervalle unterscheiden sich Englisch und Niederländisch deutlich von den romanischen Sprachen (Französisch, Spanisch, Italienisch und Katalanisch) und innerhalb der erfassten romanischen Sprachen3 fällt auf, dass
- Fra. als einzige weniger vokalische als konsonantische Intervalle zeigt;
- Italienisch die größte Mehrheit an vokalischen Intervallen aufweist.
Wählt man die beiden Variablen vokalischer Anteil (= %V) und konsonantische Längenvarianz (= ΔC) ergibt sich folgendes Bild:
Im einem mit Erwachsenen durchgeführten Test, der ausschließlich auf der Variable der vokalischen Intervalle (= %V) beruht, wird jedoch die eher schlechte Unterscheidbarkeit der romanischen Sprachen offenkundig; es finden sich auch Indizien für eine Sonderstellung des Französischen, dass nur von Italienisch und Katalanisch mit mehr als zufälliger Wahrscheinlichkeit unterschieden wird. Am schlechtesten unterschieden werden Katalanisch und Italienisch (35%) sowie Katalanisch und Spanisch (37,5%).
Ganz analoge Ergebnisse zeigen die Tests mit Neugeborenen, wie die folgende Auswertung zeigt:
Aus den Unterscheidungsexperimenten geht hervor,
that the proportion of vocalic intervals (%V) and the variability of consonantal intervals (DC) in eight languages are congruent with the notion of rhythm classes [...] (Ramus u.a. 1999, 288)
Allerdings weisen die Autoren selbst zu Recht darauf hin, dass daraus nicht abgeleitet werden kann, "that all spoken languages can be classified into just a few categories" (Ramus u.a. 1999, 288).
4. Rhythmus und Prominenz
Andreas Dufter (2003) hat darauf hingewiesen, dass sich noch eine zweite Forschungslinie, die sogenannte metrische Phonologie, mit dem sprachlichen Rhythmus befasst, ohne jedoch von der zeitlichen Dimension auszugehen:
Die Metrische Phonologie als die zweite Forschungsrichtung, welche die rhythmische Grundlage der prosodischen Organisation von Lautsprache untersucht, begreift Rhythmizität demgegenüber als Abfolge von Verschiedenem und fasst diese Verschiedenheit akzentuell. Sprachen bevorzugen nach dieser Theorie eine regelmäßige Alternanz von akzentuell prominenteren und weniger prominenten Einheiten und unterscheiden sich allein in der Organisation dieser Alternanz. (Dufter 2003, 1)
Die Prominenz kann in zweifacher Weise ausgdrückt werden: durch Quantität (Dauer) oder durch Intensität (Akzent). Es ergeben sich folgende Typen (- ‘lang’; ˘ ‘kurz’, σ ‘Silbe’, s ‘strong’, w ‘weak’):
quantierende Metrik | quantierende Metrik | ||
Fußtyp | Muster | Muster | Beispiel |
Trochäus | -˘ | σsσw | deu. Fenster ita. porta |
Jambus | ˘- | σwσs | deu. Verstand ita. città |
Spondäus | -- | σsσs | deu. Bluttat ita. ?? |
Daktylus | -˘˘ | σsσwσw | deu. Autobahn ita. mandorla |
Anapäst | ˘˘- | σwσwσs | deu. Paradies ita. realtà |
(nach Pustka 2016, 137; ita. Beispiel Th.K.) |
In der metrischen Phonologie ist auch die folgende Darstellungsweise üblich:
x |
x |
x |
Eine ausführliche Darstellung der metrischen Phonologie findet sich in Nespor 1993. Obwohl sie auf dem perzeptiven Konzept der Prominenz beruht, ist die metrische Phonologie vollkommen von der Produktion her gedacht; deshalb erübrigt sich im Rahmen dieser Vorlesung eine detaillierte Darstellung.
5. Fazit: Rhythmus und Audition
Es ist zweifellos wichtig, die beiden beiden rhythmischen Parameter - Dauer und Prominenz - in Verbindung zu sehen und theoretisch im Verbund zu modellieren, wie (Dufter 2003) nachdrücklich fordert. Aus perzeptiver Sicht muss man jedoch festhalten, dass die Dauer, d.h. die Zeitlichkeit, in besonderer Weise mit der Audition verbunden ist: Akustische Reize werden notwendigerweise nacheinander, als zeitliche Folge empfangen, und wie es scheint, gehört ihre Verarbeitung als Strom sich wiederholender Muster, d.h. als rhythmisch geordnet, zu den konstitutiven Prozeduren der Audition. Gerade in dieser als rhythmisch wahrgenommenen Zeitlichkeit liegt der grundlegende Unterschied zur visuellen Wahrnehmung, die sehr stark durch die Gleichzeitigkeit der Sinneseindrücke geprägt ist.
Bibliographie
- Abercrombie 1967 = Abercrombie, David (1967): Elements of general phonetics, Edinburgh, University Press.
- Auer 1993 = Auer, Peter (1993): Is a rhythm-based typology possible?: A study of the role of prosody in phonological typology, Freiburg im Breisgau (Link).
- Auer/Uhmann 1988 = Auer, Peter / Uhmann, Susanne (1988): Silben- und akzentzählende Sprachen. Literaturüberblick und Diskussion, in: Zeitschrift für Sprachwissenschaft, vol. 7, 214-259.
- Dauer 1983 = Dauer, Rebecca (1983): Stress-timing and syllable-timing reanalyzed, in: Journal of Phonetics, vol. 11, 51-62.
- Donegan/Stampe 1983 = Donegan, Patricia / Stampe, David (1983): Rhythm and the holistic organization of language structure,in:: The Interplay of Phonology, Morphology and Syntax , in: Richardson / Marks / Chukerman 1983, 337-353 (Link).
- Dufter 2003 = Dufter, Andreas (2003): Typen sprachrhythmischer Konturbildung, Tübingen, Niemeyer.
- James 1940 = James, Arthur Lloyd (1940): Speech signals in telephony, London, Pitman & sons.
- Lehmann Abruf 14.05.2019 = Lehmann, Christian (2019 (Abruf 14.5.)): Phonetik und Phonologie Einführung, Erfurt, Philosophische Fakultät Universität (Link).
- Nazzi u.a. 1998 = Nazzi, Thierry u.a. (1998): Language discrimination by newborns: toward an understanding of the role of rhythm., in: Journal of Experimental Psychology: Human perception and performance, vol. 24, 3, American Psychological Association, 756-766.
- Nespor 1993 = Nespor, Marina (1993): Fonologia, Bologna, Il Mulino.
- Pike 1945 = Pike, Kenneth (1945): The intonation of American English, Ann Arbor, Michigan University Press.
- Plank 1998 = Plank, Frans (1998): The co-variation of phonology with morphology and syntax: A hopeful history, in: Linguistic Typology, vol. 2, 195-230 (Link).
- Pustka 2016 = Pustka, Elissa (2016): Einführung in die Phonetik und Phonologie des Französischen, Berlin, Schmidt.
- Ramus u.a. 1999 = Ramus, Franck u.a. (1999): Correlates of linguistic rhythm in the speech signal, in: Cognition, vol. 73, 3, Elsevier, 265-292 (Link).