James R. Hurford

Fonetyka w ujęciu ewolucyjnym

W ujęciu ewolucyjnym fonetyka definiowana jest zwykle jako dziedzina wiedzy dotycząca fizykalnych uwarunkowań działalności mownej człowieka. Chociaż zachowania werbalne mogą być realizowane zarówno oralnie jak i gesturalnie, to ani nasze wyjątkowe zdolności gestykulacyjne, ani też percepcja wzrokowa, nie wydają się być rezultatem ewolucyjnej adaptacji do posługiwania się językiem migowym. O stosunkowo niedawnej adaptacji możemy natomiast z dużą pewnością mówić w przypadku narządów artykulacyjnych współtworzących wraz z częścią układu oddechowego tzw. aparat mowy. Jeśli chodzi o percepcję języka mówionego, jak dotąd niewiele wskazuje na to, aby układ słuchowy człowieka był w jakikolwiek sposób wyspecjalizowany pod kątem przetwarzania dźwięków mowy. Zanim przejdę do omówienia procesu adaptacji narządów artykulacyjnych, postaram się krótko scharakteryzować fizjologię percepcji głosek w ujęciu komparatywnym.

Percepcja słuchowa u większości ssaków rozwinięta jest na zbliżonym poziomie, ze względu na praktycznie jednorodną anatomię ucha wewnętrznego, wraz z przewodem ślimakowym zawierającym właściwy narząd słuchu. Pomiary eksperymentalne percepcji parametru VOT (ang. voice onset time) u szynszyli wykazały, iż zwierzęta te podobnie jak ludzie kategoryzują kontinuum głosek (np. rozpoznają różnicę w realizacji spółgłosek [b] i [p]). Tamaryny (rodzaj małp szerokonosych) radzą sobie tak samo dobrze jak ludzkie niemowlęta z odróżnianiem języków naturalnych (np. niderlandzkiego i japońskiego) na podstawie odmiennego akcentowania i rytmizacji usłyszanych wypowiedzi (Tincoff et al., 2005). Szympansy słyszą różnice między prostymi sylabami (takimi jak np. [ba], [ga], [da]) w taki sam sposób jak ludzie (Kojima et al., 1989), a także potrafią normalizować różnice w tembrze głosu, rozpoznając „te same” głoski wypowiadane przez różne osoby (Kojima i Kiritani, 1989). Rezultaty tych badań przemawiają przeciwko tezie o istnieniu jakiejkolwiek specyficznej wyłącznie dla człowieka adaptacji narządów słuchu do przetwarzania głosek charakterystycznych dla ludzkiej mowy. Warto jednak zwrócić uwagę na fakt, iż prawidłowa percepcja mowy wymaga równoczesnego zaangażowania całego zespołu wyizolowanych wyżej kompetencji w skomplikowanym procesie, jakim jest niezmiernie szybkie i precyzyjne rozpoznawanie kompozycyjnie powiązanych se sobą struktur znaczeniowych w linearnym kontinuum dźwięków mowy – i jak dotąd nic nie wskazuje na to, by jakiekolwiek inne zwierzęta były do tego zdolne (Pinker i Jackendoff, 2005). Osławione zdolności językowe szympansa bonobo o imieniu Kanzi pozwalają mu wprawdzie na wyodrębnianie poszczególnych elementów leksykalnych w strukturze wypowiedzeń typu „Nalej kawy do mleka!” (i odwrotnie: „Nalej mleka do kawy!”), skoro potrafi wykonać żądane czynności, zachowując odpowiednią kolejność komponentów tej procedury (Savage-Rumbaugh et al., 1993). Z drugiej jednak strony wykazano, iż – w porównaniu z możliwościami człowieka – sprawność tzw. słuchowej pamięci operacyjnej szympansa jest istotnie ograniczona (Hashiya i Kojima, 2001).

Zagadnienie specyficznego przystosowania fizjologii percepcji słuchowej człowieka do przetwarzania dźwięków mowy często mylnie kojarzone jest z innego rodzaju problemem badawczym – mianowicie z ewolucyjną ścieżką rozwoju dwóch odrębnych mechanizmów percepcji: mechanizmu przetwarzania głosek i mechanizmu przetwarzania wszelkich innych dźwięków docierających z otoczenia do organów słuchu. Działanie takich odrębnych mechanizmów percepcji audytywnej u człowieka (Liberman i Mattingly, 1989) sprowadza się do tego, iż pozornie jednakowy system przetwarzania dla obu typów dźwięków na poziomie organów słuchu, na poziomie procesów neuronalnych uzupełniany jest o swego rodzaju „neurofizjologiczny” filtr, który przekierowuje procesy rozpoznawania dźwięków mowy do obszarów korowych odpowiedzialnych za przetwarzanie języka, zlokalizowanych u większości osób w lewej półkuli mózgu. „Dwukanałowa” percepcja tych dwóch typów bodźców słuchowych nie jest wszakże właściwa wyłącznie człowiekowi. Wiele innych zwierząt, łącznie z przedstawicielami rzędu naczelnych, przetwarza nawoływania pobratymców i pozostałe dźwięki napływające z otoczenia za pomocą przynajmniej częściowo odseparowanych procesów neurofizjologicznych (Zoloth et al., 1979; Heffner i Heffner, 1984, 1986; Ghazanfar i Hauser, 2001; Hauser i Andersson, 1994; Ghazanfar et al., 2001). W przypadku zachowań werbalnych człowieka teza, iż dźwięki mowy zyskują specjalny status w naszej percepcji dźwięków (por. anglojęzyczny slogan „Speech is special”) znajduje swoje uzasadnienie o tyle, o ile dotyczy tego „podziału pracy” na poziomie procesów przetwarzania bodźców słuchowych, dzięki któremu niektóre z odbieranych dźwięków mogą być przez nas przetwarzane jako głoski. Na tej podstawie nie można jednak bronić tezy o specyficznej adaptacji fizjologii percepcji słuchowej człowieka do przetwarzania mowy, skoro inne zwierzęta naczelne również dysponują podobnymi mechanizmami percepcji, umożliwiającymi im rozpoznawanie gatunkowo specyficznych wokalizacji i nawoływań.

Jeśli chodzi o produkcję dźwięków mowy, to bez wątpienia mamy tu do czynienia z szeregiem względnie niedawnych, specyficznych adaptacji. Praktycznie cały aparat mowy jest wynikiem przysposobienia do nowych funkcji narządów, które wyewoluowały do pełnienia innych, bardziej podstawowych zadań: język i uzębienie nadal ułatwiają spożywanie pokarmu, płuca wspierają oddychanie, a nagłośnia wciąż chroni drogi oddechowe przed przedostaniem się tam przełykanych treści pokarmowych.

Najczęściej dyskutowaną ewolucyjną adaptacją związaną z produkcją głosek jest obniżona pozycja krtani u współczesnego człowieka. Ssaki inne niż ludzie mają krtań zlokalizowaną stosunkowo wysoko, w miejscu gdzie jama nosowa łączy się z jamą ustną, tuż za podniebieniem miękkim. Taką pozycję krtani mają też ludzkie noworodki, dzięki czemu zachowują one swobodę oddychania nawet w trakcie ssania piersi. Jednakże już we wczesnym okresie niemowlęcym krtań zaczyna zstępować, by po upływie zaledwie pół roku osiągnąć poziom zbliżony do jej położenia u osoby dorosłej. W procesie tym można dopatrywać się potwierdzenia tezy o ontogenetycznej rekapitulacji filogenezy, jako że krtań u człowieka w analogiczny sposób uległa obniżeniu w toku ewolucji. Dzięki obniżonej krtani aparat głosowy człowieka wykorzystuje dwie komory rezonacyjne, znajdujące się ponad nagłośnią – jamę ustną oraz gardziel – które mogą być komplementarnie zwężane lub poszerzane. Przykładowo, słup wibrującego powietrza generujący samogłoski może przechodzić przez węższą komorę do szerszej (w przypadku samogłoski [a]) lub odwrotnie (jak przy wymawianiu samogłoski [i]). Taka rozpiętość rezonacyjna aparatu głosowego umożliwia artykułowanie rozległego spektrum odróżnialnych od siebie samogłosek, co znacznie przekracza możliwości innych człowiekowatych w tym zakresie. Niewątpliwie przemawia to na rzecz tezy, iż mamy tu do czynienia z ewolucyjną adaptacją, która pozwalała na operowanie coraz bardziej zróżnicowanymi repertuarami sygnałów mownych (Lieberman, 1984).

Argumentacja związana z obniżoną pozycją krtani jest jednak nieco bardziej zniuansowana. Niektóre ssaki inne niż ludzie są w stanie dynamicznie obniżać krtań podczas wokalizacji – krótkotrwale obniżają ją np. szczekające psy, a nieco dłużej (i w sposób bardziej zdecydowany) porykujące samce jeleni (Fitch i Reby, 2001). Jednak zwierzęta te nie dysponują aparatem głosowym w najmniejszym stopniu zbliżonym do dwukomorowej przestrzeni rezonacyjnej, która umożliwia człowiekowi produkcję wielu zróżnicowanych formantów samogłoskowych. Chociaż pierwotną funkcją przystosowawczą obniżonej krtani było zwiększenie zakresu artykułowanych głosek, to dalsze nieznaczne zstępowanie krtani w okresie dojrzewania u chłopców można postrzegać jako rodzaj adaptacji związanej z doborem płciowym. Różnica jakościowa między tonami głosów żeńskich i męskich u człowieka stanowi ewidentny przejaw dymorfizmu płciowego w sferze zachowań werbalnych.

Inną stosunkowo niedawną adaptacją ewolucyjną jest sprawowanie wolicjonalnej kontroli nad wokalizacją i oddechem. Małpy człekokształtne kontrolują swoje wokalizacje w niewielkim stopniu, bądź też w ogóle nie mają takiej możliwości, ze względu na słabo rozwiniętą neurofizjologię odpowiedzialnych za ten proces obszarów kory czołowej mózgu. Ich okrzyki i nawoływania są spontaniczne lub zupełnie odruchowe. Istotną rolę przy wymawianiu głosek odgrywa też kontrola czynności oddechowych, która umożliwia nam spowolnienie wydechu aż do trzydziestu sekund i modulowanie wydychanego powietrza poprzez skoordynowane ruchy narządów mowy. Badania komparatywne kanałów szkieletowych wspierających unerwienie mięśni zaangażowanych w procesie oddychania wykazały, iż mamy do czynienia z ich niedawnym rozrostem u człowieka współczesnego, co wskazywałoby na ich funkcję przystosowawczą: zwiększenie kontroli nad czynnościami oddechowymi w trakcie mówienia (MacLarnon i Hewitt, 1999). Podobna teza dotycząca otworu w podstawie czaszki, który stanowi kanał nerwu podjęzykowego, nie znalazła wprawdzie równie mocnego uzasadnienia (Kay et al., 1998; DeGusta et al., 1999), jednakże nie ma wątpliwości co do tego, iż ludzie potrafią kontrolować ułożenie języka z precyzją, która znacznie przekracza możliwości małp człekokształtnych. Dźwięki mowy powstają dzięki finezyjnej koordynacji ruchów licznych mięśni tworzących aparat artykulacyjny, który wraz z kontrolującą go neurofizjologią mózgu jest niewątpliwie jedną z licznych adaptacji, jakim podlegał nasz gatunek od momentu wyodrębnienia się jego linii rozwojowej od linii ostatniego wspólnego przodka ludzi i szympansów przed około sześcioma milionami lat.


CZYTAJ DALEJ

 

Przekład tekstu autorstwa prof. J. Hurforda publikuję za uprzejmą zgodą Autora.
The translation appears here by the kind permission of the author of the original work.
 

Tekst źródłowy: Hurford, J.R. (2012). Linguistics from an evolutionary point of view.
W: R. Kempson, T. Fernando i N. Asher, (red.), Handbook of the Philosophy of Science. Volume 14: Philosophy of Linguistics. Amsterdam: Elsevier BV, 473–498.
DOI: 10.1016/B978-0-444-51747-0.50014-7

Cytowanie: Odnosząc się do tych treści w innych publikacjach, należy uwzględnić podany na końcu permalink (odnośnik bezpośredni) do tej sekcji lub link do kompletnego tekstu przekładu. Tekst przyjęto do druku w czasopiśmie AVANT.

 


Z języka angielskiego przełożył Arkadiusz Jasiński
permalinkhttp://evolectorium.com/spip.php?article35
data publikacji: 09.05.2014


Creative Commons License


Artykuł dostępny na licencji CC BY-SA 4.0
Creative Commons · Uznanie autorstwa
Na tych samych warunkach 4.0 Międzynarodowe
.

 


 
 


Bibliografia i przypisy

  • DeGusta, D., Gilbert, W. H. i Turner, S. P. (1999). Hypoglossal canal size and hominid speech. Proceedings of the National Academy of Sciences of the USA 96, 1800–1804.
  • Fitch, W.T. i Reby, D. (2001). The descended larynx is not uniquely human. Proceedings of the Royal Society B: Biological Sciences, 268 (1477), 1669–1675. DOI: 10.1098/rspb.2001.1704
  • Ghazanfar, A. A. i Hauser, M. D. (2001). The auditory behaviour of primates: a neuroethological perspective. Current Opinion in Neurobiology 11, 712–720.
  • Ghazanfar, A. A., Smith-Rohrberg, D. i Hauser, M. D. (2001). The role of temporal cues in rhesus monkey vocal recognition: Orienting asymmetries to reversed calls. Brain, Behavior and Evolution 58, 163–172.
  • Hashiya, K. i Kojima, S. (2001). Hearing and auditory-visual intermodal recognition in the chimpanzee. W: T. Matsuzawa, red., Primate Origins of Human Cognition and Behavior, rozdział 8. Tokyo: Springer Verlag, 155–189.
  • Hauser, M. D. i Andersson, K. (1994). Left hemisphere dominance for processing vocalizations in adult, but not infant, rhesus monkeys: Field experiments. Proceedings of the National Academy of Sciences of the USA 91, 3946–3948.
  • Heffner, H. i Heffner, R. (1984). Temporal lobe lesions and perception of species-specific vocalizations by macaques. Science 226, 75–76.
  • Heffner, H. i Heffner, R. (1986). Effect of unilateral and bilateral auditory cortex lesions on the discrimination of vocalizations by japanese macaques. Journal of Neurophysiology 56, 683–701.
  • Kay, R.F., Cartmill, M. i Balow, M. (1998). The hypoglossal canal and the origin of human vocal behavior. Proceedings of the National Academy of Sciences of the United States of America, 95 (9), 5417–5419. PMID: 9560291
  • Kojima, S. i Kiritani, S. (1989). Vocal-auditory functions in the chimpanzee: Vowel perception. International Journal of Primatology 10, 199–213.
  • Kojima, S., Tatsumi, I., Kiritani, S. i Hirose, H. (1989). Vocal-auditory functions of the chimpanzee: consonant perception. Human Evolution, 4 (5), 403–416. DOI: 10.1007/BF02436436
  • Lieberman, P. (1984). The biology and evolution of language. Cambridge, MA: Harvard University Press.
  • Liberman, A. M. i Mattingly, I. G. (1989). A specialization for speech perception. Science 243, 489–494.
  • MacLarnon, A. M. i Hewitt, G. P. (1999). The evolution of human speech: The role of enhanced breathing control. American Journal of Physical Anthropology 109, 341–363.
  • Pinker, S. i Jackendoff, R. S. (2005). The faculty of language: What’s special about it?. Cognition 95, 201–236.
  • Savage-Rumbaugh, E.S., Murphy, J., Sevcik, R.A., Brakke, K.E., Williams, S.L., Rumbaugh, D.M. i Bates, E. (1993). Language Comprehension in Ape and Child. Monographs of the Society for Research in Child Development, 58 (3/4). DOI: 10.2307/1166068
  • Tincoff, R., Hauser, M., Tsao, F., Spaepen, G., Ramus, F. i Mehler, J. (2005). The role of speech rhythm in language discrimination: further tests with a non-human primate. Developmental Science 8, 26–35.
  • Zoloth, S., Petersen, M, R., Beecher, M., Green, S., Marler, P., Moody, D. i Stebbins, W. (1979). Species-specific perceptual processing of vocal sounds by monkeys. Science 204, 870–873.