Phonetic Exercises

Phonetic Exercises - Languages in Danger

Autor: Maciej Karpiński, tłum. z ang. Maciej Karpiński, Katarzyna Klessa
Zobacz dźwięk

Zapoznajmy się z Praatem lub Wavesurferem i najbardziej podstawowymi cechami sygnału mowy


Nagraj kilka wypowiedzi w Twoim własnym języku

Nagraj kilka wypowiedzi używając krótkich fraz lub zdań o długości nie większej niż pięć-siedem sekund. Aby to zrobić, uruchom Praata, wybierz opcję [Record mono sound] z menu [New]. Wyświetli się okno Praat SoundRecorder. Rozpocznij nagrywanie klikając na przycisk [Record] i zatrzymaj je, klikając na [Stop]. Następnie kliknij przycisk [Save to list] w oknie SoundRecorder.

Ryc. 1. Okno SoundRecorder. Możesz w nim nagrywać dźwięki i umieszczać je jako “obiekty” na liście obiektów w głównym oknie Praata. Nagrywanie jest możliwe w trybie stereo i mono. Można wybrać jedną z dostępnych częstotliwości próbkowania (ich faktyczna dostępność może zależeć od możliwości karty dźwiękowej w Twoim komputerze). /p>

Zamknij okno SoundRecorder. Na liście obiektów w oknie Praat Object pojawił się nowy obiekt. Wybierz go (używając myszki) i użyj przycisku ekranowego [Viewe & Edit] na prawym panelu okna. Program otworzy nowe okno. Będzie ono zawierało graficzną reprezentację sygnału. Możliwy jest wybór tych parametrów sygnału, których reprezentację chcesz widzieć. Jeśli tryby pokazywania spektrogramu [Spectrum] oraz częstotliwości podstawowej [Pitch] nie są w Twoim programie aktywne domyślnie, wybierz je i aktywuj. Spektrogram (przypominający niekiedy pochmurne niebo) przedstawia rozkład energii sygnału w różnych częstotliwościach i w czasie, podczas gdy niebieska linia częstotliwości podstawowej odpowiada w dużej mierze odbieranej przez słuchacza wysokości głosu. Warto zwrócić uwagę na to, że gdy aktywne są te dwa typy analizy sygnału, aktywne będą również dwie niezależne osie pionowe wykresu. Oś lewa będzie dotyczyła spektrogramu i znajdą się na niej wartości rzędu tysięcy herców. Oś prawa wiąże się z intonogramem i pojawiają się na niej wartości co najwyżej setek herców. Skalę każdej osi można zmodyfikować w odpowiednich menu. Aby uniknąć dużych opóźnień wyświetlania przy “przewijaniu” dłuższych sygnałów, Praat może ograniczać okno dla wyświetlanej części sygnału. Wartość tę można ustawić w menu [View], posługując się opcją [Analysis]. Jeśli wartość zostanie ustawiona na, na przykład, pięć sekund, a do oglądania wybierzemy dłuższy fragment sygnału, wówczas będzie widoczny jedynie jego oscylogram. Zatem, aby widzieć spektrogram i intonogram, musimy wybierać fragmenty sygnału krótsze niż wstępnie wybrane najszersze okno czasowe.

Ryc. 2. Pamiętaj o możliwości powiększania i pomniejszania oglądanych grafów na osi czasu za pomocą przycisków w lewym dolnym rogu okna. Dowolny fragment sygnału można odtworzyć wybierając go za pomocą myszy, a następnie klikając odpowiednią część paska pod sygnałem (znajdują się tam trzy paski, służące do otwarzania wybranych części sygnału, całej widocznej w danej chwili na ekranie części sygnału oraz całości nagrania).


Przyjrzyj się teraz bliżej spektrogramowi i ...

Dla jakiego rodzaju dźwięków są charakterystyczne ciemne obłoki w wyższej części spektrogramu?

[“Obłoki”, które znajdują się wysoko na skali częstotliwości najczęściej odpowiadają bezdźwięcznym szumom - takim, jak w przypadku pierwszych głosek w wyrazach “sanie” lub “szal”. “Obłoki” zlokalizowane niżej to najczęściej reprezentacje zwykłych samogłosek.]

Przyjrzyj się, czy na spektrogramie pojawiają się jakieś wyraźne, pionowe linie. Jakie rodzaje dźwięków są z nimi powiązane?

[Spółgłoski wybuchowe (plozywne) są reprezentowane przez pionowe linie lub pasy, często nieco bardziej rozmyte po prawej stronie, gdzie przechodzą w “obłoki” reprezentujące inne dźwięki mowy (z reguły będą to samogłoski). Mlaski na spektrogramie również mogą się pojawiać w postaci linii pionowych, jednak będą one zwykle mniej wyraziste.]

Czy na spektrogramie znajdują się jeszcze inne, mniej wyraziste, lecz dostrzegalne pionowe kształty? Jeśli tak, posłuchaj odpowiadających im fragmentów sygnału. Jaki rodzaj dźwięków reprezentują? Warto zauważyć, że nawet w częściach spektrogramu odpowiadających ciszy widać często “mgiełkę” lub “piasek”. W większości przypadków to tylko szumy w tle.

[W większości przypadków pionowe linie na spektrogramie odpowiadają spółgłoskom wybuchowym, takim jak /p/ lub /b/. Faktycznie, wymawiając je, powodujemy małą “eksplozję” powietrza. Podnosimy ciśnienie w torze głosowym, a następnie gwałtownie uwalniamy powietrze.]

Poszukaj w spektrogramie miejsc, które wydają się prawie “puste” (“prawie” - bo i w nich będą dostrzegalne choćby drobne szumy). Można zauważyć, że tego rodzaju chwile ciszy, chociaż bardzo krótkie, znajdują się nawet wewnątrz wyrazów, często przed pionowymi liniami na spektrogramie. Czy domyślasz się dlaczego?

[Przed głoskami wybuchowymi, takimi jak /p/ lub /b/, zawsze pojawia się chwila ciszy, która jest potrzebna, aby “wyprodukować” wybuch. Zaciskamy usta, aby zebrane powietrze nie wydostało się, podnosimy jego ciśnienie, a dopieor potem rozwieramy usta i uwalniamy powietrze.]


Przyjrzyj się teraz niebieskiej linii, która odpowiada przebiegowi częstotliwości podstawowej.


Czy linia jest ciągła na całej długości nagranego sygnału? Czy na jakichś odcinkach linia znika? Jeśli tak, to gdzie? Czy zdarza się to również w czasie trwania wypowiedzi? Jeżeli tak, posłuchaj uważnie tych fragmentów sygnału.

[To oczywiste, że linia reprezentująca częstotliwość podstawową wypowiedzi nie będzie pojawiała się w trakcie pauz, ale nie ma jej również w miejscach, gdzie sygnał mowy jest bezdźwięczny. Gdy fałdy głosowe wibrują nieregularnie, programowi trudno ustalić częstotliwość podstawową i na wykresie mogą pojawić się poważne błędy.]

Ponownie otwórz Praat Sound Recorder i nagraj te same dwa lub trzy zdania, ale tym razem mówiąc szeptem. Staraj się mówić zrozumiale, ale zwróć uwagę, aby jednak przez cały czas mówić szeptem. Nie zamykaj poprzedniego okna analizy, tylko otwórz nowy sygnał w nowym oknie. Teraz możesz bezpośrednio porównać te dwa spektrogramy:
- Czy słyszysz melodię wypowiedzi szeptanych?
- Czy potrafisz ją naśladować, używając swojego normalnego dźwięcznego głosu?
- Jeśli możesz, popoś inną osobę, aby spróbowała naśladować ten szeptany dźwięk i nagraj głos tej osoby podczas tej próby.

[Ściśle rzecz biorąc, w wypowiedziach szeptanych nie da się określić wysokości dźwięku, więc można by pomyśleć, że nie mamy podstaw aby w jakikolwiek sposób słyszeć melodię takich wypowiedzi. Jednak nie do końca tak jest! Coś sprawia, że słyszymy tę melodię. Ten fenomen wynika z pewnych właściwości mowy szeptanej oraz w bardzo dużym stopniu - z mechanizmów percepcji mowy, tego jak ją człowiek odbiera. Na podstawie pewnych innych niż częstotliwość podstawowa właściwości rekonstruujemy (lub wysnuwamy hipotezy) co do melodii wypowiedzi szeptanych.]