Psykoakustik

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 27. juni 2017; checks kræver 17 redigeringer .

Psykoakustik  er en videnskabelig disciplin , der studerer de psykologiske og fysiologiske karakteristika ved menneskelig opfattelse af lyd .

Rent musikalsk er psykoakustikkens hovedopgaver følgende:

Baggrund

I mange akustik- og lydsignalbehandlingsapplikationer er det nødvendigt at vide, hvad folk hører . Lyden produceret af lufttrykbølger kan måles nøjagtigt med moderne udstyr. Det er imidlertid ikke let at forstå, hvordan disse bølger modtages og vises i vores hjerne. Lyd er et kontinuerligt analogt signal , der (forudsat at luftmolekyler er uendeligt små) teoretisk kan bære en uendelig mængde information (da der er et uendeligt antal vibrationer, der indeholder amplitude- og faseinformation).

Forståelse af perceptionsprocesserne gør det muligt for videnskabsmænd og ingeniører at fokusere på høreevnen og ignorere de mindre vigtige egenskaber i andre systemer. Det er også vigtigt at bemærke, at spørgsmålet "hvad en person hører" ikke kun er et spørgsmål om ørets fysiologiske evner , men på mange måder også et spørgsmål om perceptionspsykologi .

Grænser for lydopfattelse

En person hører nominelt lyde i området fra 16 til 20.000 Hz . Den øvre grænse, ligesom den nedre grænse, har en tendens til at falde med alderen. De fleste voksne kan ikke høre lyd over 16 kHz. Selve øret reagerer ikke på frekvenser under 20 Hz, men de kan fornemmes gennem følesansen .

Udvalget af opfattede lyde er enormt. Men trommehinden i øret er kun følsom over for trykændringer . Lydtryksniveauet måles normalt i decibel (dB) . Den nedre tærskel for hørbarhed er defineret som 0 dB (20 mikropascal), og definitionen af ​​den øvre grænse for hørbarhed refererer mere til tærsklen for ubehag og derefter til høretab , hjernerystelse osv. Denne grænse afhænger af, hvor længe vi lytter til lyden. Øret kan tåle kortvarige lydstyrkestigninger på op til 120 dB uden konsekvenser, men langvarig eksponering for lyde over 80 dB kan forårsage høretab. [en]

Mere omhyggelige undersøgelser af den nedre høregrænse har vist, at den minimumstærskel, hvor lyden forbliver hørbar, afhænger af frekvensen. Grafen for denne afhængighed kaldes den absolutte høretærskel . I gennemsnit har den et område med størst følsomhed i området fra 1 kHz til 5 kHz, selvom følsomheden falder med alderen i området over 2 kHz.

Kurven for den absolutte høretærskel er et særligt tilfælde af mere generelle - kurver med samme lydstyrke, isofoner : lydtryksværdier ved forskellige frekvenser , hvor en person føler, at lydene er lige høje. Kurverne blev først opnået af H. Fletcher og W. A. ​​Munson og offentliggjort i 1933 i Loudness, dens definition, måling og beregning [2 ] . Mere nøjagtige målinger blev senere foretaget af DW Robinson og RS Dadson [3 ] . De resulterende kurver adskiller sig væsentligt, men dette er ikke en fejl, men forskellige måleforhold. Fletcher og Munson brugte hovedtelefoner som lydbølgekilde , mens Robinson og Dutson brugte en frontvendt højttaler i et lydløst rum.

Robinson og Dutsons målinger dannede grundlaget for ISO 226 i 1986. I 2003 blev ISO 226 opdateret til at afspejle måledata fra 12 nye internationale undersøgelser.

Der er også en måde at opfatte lyd på uden deltagelse af trommehinden - den såkaldte mikrobølge auditive effekt , når pulseret eller moduleret stråling i mikrobølgeområdet påvirker vævene omkring cochlea , hvilket tvinger en person til at opfatte forskellige lyde. [fire]

Maskeringseffekt

I visse tilfælde kan en lyd skjules af en anden lyd. Det kan for eksempel være helt umuligt at tale ved siden af ​​togskinner, hvis et tog kører forbi. Denne effekt kaldes maskering. En svag lyd siges at være maskeret, hvis den ikke kan skelnes i nærvær af en højere lyd.

Der er flere typer forklædning:

Samtidig udklædning

Enhver to lyde, når de lyttes til på samme tid, påvirker opfattelsen af ​​den relative lydstyrke mellem dem. En højere lyd reducerer opfattelsen af ​​en svagere lyd, indtil dens hørbarhed forsvinder. Jo tættere frekvensen af ​​den maskerede lyd er på frekvensen af ​​den maskerende lyd, jo mere vil den blive skjult. Maskeringseffekten er ikke den samme, når den maskerede lyd forskydes lavere eller højere i frekvens i forhold til den maskerede.

Til den matematiske beskrivelse af grænserne for indflydelsen af ​​en tone på tilstødende frekvenser, bruger litteraturen [5] begrebet en spredningsfunktion , som sætter maskeringstærsklen [6] :

hvor er afstanden mellem to kritiske områder på Barkov-skalaen .

Baseret på spredningsfunktionen kan maskeringen af ​​det kritiske område i med det kritiske område j [7] [8] beregnes :

hvor er signaleffekten i det i-te kritiske område.

For at bestemme graden af ​​maskering i en situation, hvor der er mange maskeringstoner, bruges konceptet med en global maskeringstærskel

hvor er forskydningen mellem signalniveauet og maskeringstærsklen [9] , er toneindekset, der viser graden af ​​periodicitet af audiosignalet (for støjlignende signaler [10] ), er maskeringsindekset [11] og er frekvensen i kilohertz. Maskeringsindekset erstattes ofte af en konstant på 5,5 dB [7] [8] .

Samtidig maskeringsdata bruges for eksempel ved komprimering af lydfiler på kvantiseringsstadiet [12] .

Lavfrekvente lyde maskerer høje frekvenser. Det er vigtigt at bemærke, at højfrekvente lyde ikke kan skjule lavfrekvente lyde.

Temporal forklædning

Dette fænomen ligner frekvensmaskering, men her er der maskering i tid. Når maskeringslyden stoppes, fortsætter den maskerede med at være uhørlig i nogen tid. Maskeringstiden afhænger af signalets frekvens og amplitude og kan være op til 100 ms. Under normale forhold varer effekten af ​​midlertidig maskering meget mindre.

I det tilfælde, hvor maskeringstonen vises senere end den maskerede tone, kaldes effekten post-masking. Når maskeringstonen vises før den maskerede (og dette er også muligt), kaldes effekten præ-maskering.

Post-stimulus træthed

Ofte, efter udsættelse for høje lyde af høj intensitet, falder en persons auditive følsomhed kraftigt. Gendannelse af normale tærskler kan tage op til 16 timer. Denne proces kaldes "midlertidig tærskelforskydning" eller "træthed efter stimulus". Tærskelforskydning begynder at forekomme ved lydtrykniveauer over 75 dB og stiger tilsvarende, efterhånden som signalniveauet stiger. Desuden har signalets højfrekvente komponenter den største indflydelse på forskydningen af ​​følsomhedstærsklen.

Phantoms

Se artiklen Mangler fundamental

Nogle gange kan en person høre lyde i lavfrekvensområdet, selvom der i virkeligheden ikke var nogen lyde af en sådan frekvens. Dette skyldes, at svingningerne af basilarmembranen i cochlea ikke er lineære, og svingninger med en forskelsfrekvens mellem to højere frekvenser kan forekomme i den.

Denne effekt bruges i nogle kommercielle lydsystemer til at udvide lavfrekvensresponsen, når sådanne frekvenser ikke kan gengives tilstrækkeligt direkte, såsom i hovedtelefoner, mobiltelefoner, lavprishøjttalere (højttalere) osv.

Psykoakustik i software

Psykoakustiske høremodeller tillader signalkomprimering af høj kvalitet med tab af information (når det gendannede signal ikke matcher originalen), på grund af det faktum, at de giver dig mulighed for præcist at beskrive, hvad der sikkert kan fjernes fra det originale signal - dvs. betydelig forringelse af lydkvaliteten. Ved første øjekast kan det se ud til, at dette usandsynligt vil give stærk signalkomprimering, men programmer, der bruger psykoakustiske modeller, kan reducere lydstyrken af ​​musikfiler med 10-12 gange.[ usikkerhed ] , og forskellen i kvalitet vil ikke være særlig væsentlig.

Disse typer komprimering omfatter alle moderne lydkomprimeringsformater med tab :

Se også

Noter

  1. Ændringer fra intens industriel støj - Erhvervssygdomme i høreorganet forbundet med eksponering for intens industriel støj - Medicinsk arbejde ... . Hentet 4. februar 2013. Arkiveret fra originalen 11. februar 2013.
  2. Fletcher H., Munson W. A. ​​Loudness, dens definition, måling og beregning // J. Acoust. Soc Am.5, 82-108 (1933)
  3. Robinson DW, Dadson RS En genbestemmelse af ligestyrkeforholdet for rene toner // Br. J. Appl. Phys. 7, 166-181, 1956)
  4. Tigranyan R. E., Shorokhov V. V. Fysisk grundlag for den auditive effekt af mikroovn / Administrerende redaktør - Doktor i fysiske og matematiske videnskaber prof. L.P. Kayushin. - Pushchino: ONTI fra Pushchino Scientific Center for Videnskabsakademiet i USSR, 1990. - 131 s. - 370 eksemplarer.
  5. Zölzer U. Digital lydsignalbehandling. - New York: Wiley, 2008. - T. 9. - C. 280-284
  6. MR Schroeder, BS Atal, JL Hall: Optimizing Digital Speech Coders by ExploitingMasking Properties of the Human Ear, J. Acoust. soc. Am., bind. 66, nr. 6, s. 1647-1652, december 1979.
  7. 1 2 J. D. Johnston: Transform Coding of Audio Signals Using Perceptual Noise Criteria, IEEE J. Selected Areas in Communications, Vol. 6, nr. 2, s. 314-323, februar 1988.
  8. 1 2 J. D. Johnston: Estimation of Perceptual Entropy Using Noise Masking Criteria, Proc. ICASSP-88, s. 2524-2527, 1988.
  9. RP Hellman: Asymmetry in Masking between Noise and Tone, Perception and Psychophys., Vol. 11, s. 241-246, 1972.
  10. "Psychoacoustics Models" (TU Ilmenau) Arkiveret 11. december 2019 på Wayback Machine - slide 7.
  11. R. Kapust: A Human Ear Related Objective Measurement Technique Giver Audible Error and Error Margin, Proc. 11. Int. AES Conference - Test & Measurement, Portland, s. 191-202, 1992.
  12. "Lydkodningskvantisering og kodningsmetoder" (TU Ilmenau) . Hentet 12. december 2019. Arkiveret fra originalen 12. december 2019.

Litteratur

Links