Psykoakustik er en videnskabelig disciplin , der studerer de psykologiske og fysiologiske karakteristika ved menneskelig opfattelse af lyd .
Rent musikalsk er psykoakustikkens hovedopgaver følgende:
I mange akustik- og lydsignalbehandlingsapplikationer er det nødvendigt at vide, hvad folk hører . Lyden produceret af lufttrykbølger kan måles nøjagtigt med moderne udstyr. Det er imidlertid ikke let at forstå, hvordan disse bølger modtages og vises i vores hjerne. Lyd er et kontinuerligt analogt signal , der (forudsat at luftmolekyler er uendeligt små) teoretisk kan bære en uendelig mængde information (da der er et uendeligt antal vibrationer, der indeholder amplitude- og faseinformation).
Forståelse af perceptionsprocesserne gør det muligt for videnskabsmænd og ingeniører at fokusere på høreevnen og ignorere de mindre vigtige egenskaber i andre systemer. Det er også vigtigt at bemærke, at spørgsmålet "hvad en person hører" ikke kun er et spørgsmål om ørets fysiologiske evner , men på mange måder også et spørgsmål om perceptionspsykologi .
En person hører nominelt lyde i området fra 16 til 20.000 Hz . Den øvre grænse, ligesom den nedre grænse, har en tendens til at falde med alderen. De fleste voksne kan ikke høre lyd over 16 kHz. Selve øret reagerer ikke på frekvenser under 20 Hz, men de kan fornemmes gennem følesansen .
Udvalget af opfattede lyde er enormt. Men trommehinden i øret er kun følsom over for trykændringer . Lydtryksniveauet måles normalt i decibel (dB) . Den nedre tærskel for hørbarhed er defineret som 0 dB (20 mikropascal), og definitionen af den øvre grænse for hørbarhed refererer mere til tærsklen for ubehag og derefter til høretab , hjernerystelse osv. Denne grænse afhænger af, hvor længe vi lytter til lyden. Øret kan tåle kortvarige lydstyrkestigninger på op til 120 dB uden konsekvenser, men langvarig eksponering for lyde over 80 dB kan forårsage høretab. [en]
Mere omhyggelige undersøgelser af den nedre høregrænse har vist, at den minimumstærskel, hvor lyden forbliver hørbar, afhænger af frekvensen. Grafen for denne afhængighed kaldes den absolutte høretærskel . I gennemsnit har den et område med størst følsomhed i området fra 1 kHz til 5 kHz, selvom følsomheden falder med alderen i området over 2 kHz.
Kurven for den absolutte høretærskel er et særligt tilfælde af mere generelle - kurver med samme lydstyrke, isofoner : lydtryksværdier ved forskellige frekvenser , hvor en person føler, at lydene er lige høje. Kurverne blev først opnået af H. Fletcher og W. A. Munson og offentliggjort i 1933 i Loudness, dens definition, måling og beregning [2 ] . Mere nøjagtige målinger blev senere foretaget af DW Robinson og RS Dadson [3 ] . De resulterende kurver adskiller sig væsentligt, men dette er ikke en fejl, men forskellige måleforhold. Fletcher og Munson brugte hovedtelefoner som lydbølgekilde , mens Robinson og Dutson brugte en frontvendt højttaler i et lydløst rum.
Robinson og Dutsons målinger dannede grundlaget for ISO 226 i 1986. I 2003 blev ISO 226 opdateret til at afspejle måledata fra 12 nye internationale undersøgelser.
Der er også en måde at opfatte lyd på uden deltagelse af trommehinden - den såkaldte mikrobølge auditive effekt , når pulseret eller moduleret stråling i mikrobølgeområdet påvirker vævene omkring cochlea , hvilket tvinger en person til at opfatte forskellige lyde. [fire]
I visse tilfælde kan en lyd skjules af en anden lyd. Det kan for eksempel være helt umuligt at tale ved siden af togskinner, hvis et tog kører forbi. Denne effekt kaldes maskering. En svag lyd siges at være maskeret, hvis den ikke kan skelnes i nærvær af en højere lyd.
Der er flere typer forklædning:
Enhver to lyde, når de lyttes til på samme tid, påvirker opfattelsen af den relative lydstyrke mellem dem. En højere lyd reducerer opfattelsen af en svagere lyd, indtil dens hørbarhed forsvinder. Jo tættere frekvensen af den maskerede lyd er på frekvensen af den maskerende lyd, jo mere vil den blive skjult. Maskeringseffekten er ikke den samme, når den maskerede lyd forskydes lavere eller højere i frekvens i forhold til den maskerede.
Til den matematiske beskrivelse af grænserne for indflydelsen af en tone på tilstødende frekvenser, bruger litteraturen [5] begrebet en spredningsfunktion , som sætter maskeringstærsklen [6] :
hvor er afstanden mellem to kritiske områder på Barkov-skalaen .
Baseret på spredningsfunktionen kan maskeringen af det kritiske område i med det kritiske område j [7] [8] beregnes :
hvor er signaleffekten i det i-te kritiske område.
For at bestemme graden af maskering i en situation, hvor der er mange maskeringstoner, bruges konceptet med en global maskeringstærskel
hvor er forskydningen mellem signalniveauet og maskeringstærsklen [9] , er toneindekset, der viser graden af periodicitet af audiosignalet (for støjlignende signaler [10] ), er maskeringsindekset [11] og er frekvensen i kilohertz. Maskeringsindekset erstattes ofte af en konstant på 5,5 dB [7] [8] .
Samtidig maskeringsdata bruges for eksempel ved komprimering af lydfiler på kvantiseringsstadiet [12] .
Lavfrekvente lyde maskerer høje frekvenser. Det er vigtigt at bemærke, at højfrekvente lyde ikke kan skjule lavfrekvente lyde.
Dette fænomen ligner frekvensmaskering, men her er der maskering i tid. Når maskeringslyden stoppes, fortsætter den maskerede med at være uhørlig i nogen tid. Maskeringstiden afhænger af signalets frekvens og amplitude og kan være op til 100 ms. Under normale forhold varer effekten af midlertidig maskering meget mindre.
I det tilfælde, hvor maskeringstonen vises senere end den maskerede tone, kaldes effekten post-masking. Når maskeringstonen vises før den maskerede (og dette er også muligt), kaldes effekten præ-maskering.
Ofte, efter udsættelse for høje lyde af høj intensitet, falder en persons auditive følsomhed kraftigt. Gendannelse af normale tærskler kan tage op til 16 timer. Denne proces kaldes "midlertidig tærskelforskydning" eller "træthed efter stimulus". Tærskelforskydning begynder at forekomme ved lydtrykniveauer over 75 dB og stiger tilsvarende, efterhånden som signalniveauet stiger. Desuden har signalets højfrekvente komponenter den største indflydelse på forskydningen af følsomhedstærsklen.
Se artiklen Mangler fundamental
Nogle gange kan en person høre lyde i lavfrekvensområdet, selvom der i virkeligheden ikke var nogen lyde af en sådan frekvens. Dette skyldes, at svingningerne af basilarmembranen i cochlea ikke er lineære, og svingninger med en forskelsfrekvens mellem to højere frekvenser kan forekomme i den.
Denne effekt bruges i nogle kommercielle lydsystemer til at udvide lavfrekvensresponsen, når sådanne frekvenser ikke kan gengives tilstrækkeligt direkte, såsom i hovedtelefoner, mobiltelefoner, lavprishøjttalere (højttalere) osv.
Psykoakustiske høremodeller tillader signalkomprimering af høj kvalitet med tab af information (når det gendannede signal ikke matcher originalen), på grund af det faktum, at de giver dig mulighed for præcist at beskrive, hvad der sikkert kan fjernes fra det originale signal - dvs. betydelig forringelse af lydkvaliteten. Ved første øjekast kan det se ud til, at dette usandsynligt vil give stærk signalkomprimering, men programmer, der bruger psykoakustiske modeller, kan reducere lydstyrken af musikfiler med 10-12 gange.[ usikkerhed ] , og forskellen i kvalitet vil ikke være særlig væsentlig.
Disse typer komprimering omfatter alle moderne lydkomprimeringsformater med tab :