Akustisk teori om taleproduktion

Den akustiske teori om taleproduktion  er et afsnit af akustisk fonetik , der studerer de aerodynamiske og akustiske processer, der forekommer i stemmekanalen . Forståelse af disse processer skaber mulighed for omvendte konklusioner: fra akustik til artikulationsbilledet. Viden om akustikken af ​​taleproduktion er også nødvendig for den korrekte fortolkning af fysiske data, da det gør det muligt at adskille de akustiske egenskaber af talesignalet forudsagt ved artikulation fra de uventede, hvilket igen får en til at tænke over årsagerne til sådanne. akustiske overraskelser. For fonetisk videnskab er det vigtigt, at den akustiske teori om taleproduktion giver fortolkningen af ​​fysiske taledata en forklarende, videnskabelig status. Grundlaget for den akustiske taleteori blev lagt i det 19. århundrede af den tyske fysiker Hermann von Helmholtz . I det 20. århundrede tilhører de vigtigste værker i dette område Gunnar Fant og James Flanagan .

De vigtigste bestemmelser i den akustiske teori om taleproduktion

Talesignal-foldning af excitationsfunktionen med responser fra lineære filtre. Excitationsfunktionen kan være støj, der opstår som en laminær, turbulent proces eller tone. Tonehøjdefrekvensen for menneskelig tale varierer fra 90 Hz. op til 300 Hz og bestemmer dens melodi. Den gennemsnitlige værdi af grundtonefrekvensen for hver højttaler er forskellig, mandlige stemmer ligger normalt i området 90-180 Hz, mens kvinders og børns stemmer er i området 185-300 Hz. Glottisens klik er repræsenteret af et sæt harmoniske, der er multipla af grundtonen. Energiniveauet af de harmoniske falder eksponentielt med stigende frekvens. Den øvre afskæringsfrekvens for talesignalet, ca. 18 kHz. Men for informationstransmissionsveje er den øvre grænsefrekvens op til 3500 Hz tilstrækkelig, selvom der med et sådant frekvensbånd ikke høres et antal fonemer. Når glottisens klik interagerer med stemmekanalens resonanshulrum, resonerer nogle harmoniske, der er multipla af grundtonen, og de lokale maksima dannet i spektret, ifølge Flanagan-modellen, danner områder med energikoncentration, som kaldes formanter. Det er almindeligt accepteret, at fire formanter danner vokalfonem, og deres dynamiske ændringer i tid (formantspor), amplitude og frekvens danner konsonanter, begge kaldes fonemer. Formanternes kvalitetsfaktor er en af ​​talens statiske karakteristika og kan karakterisere taleren. Fonemer ophidset af støj kan ikke synges, mens fonemer ophidset af tone kan synges. En af de unikke mekanismer for støjbestandig kodning af taleinformation er allofoniniseringen af ​​vokalfonem, faktisk er disse ændringer i banerne for formantspor under hensyntagen til de foregående og følgende fonemer efter vokalen. Der er 43 fonemer i russisk tale, og kun to "Ж" og "З" dannes samtidigt af tone og støj.