Silent Access Interface

Silent access interface ( engelsk silent speech interfaces , SSI ) - talebehandlingssystemer baseret på modtagelse og behandling af talesignaler på et tidligt stadium af artikulationen .

Historie

Grænseflader med lydløs adgang har en meget ny historie, der går tilbage til begyndelsen af 2000'erne. I det seneste årti er ydeevnen af automatiske talebehandlingssystemer, herunder talegenkendelse , tekstgenkendelse, oversættelse og talesyntese, forbedret betydeligt. Dette har ført til brugen af tale- og taleteknologi i en bred vifte af tjenester såsom informationssøgningssystemer, callcentre , stemmestyring af mobiltelefoner og bilnavigationssystemer , personlige oversættere og brug af taleteknologi i sikkerhed. Talegrænseflader baseret på traditionelle akustiske talesignaler har dog stadig en række væsentlige begrænsninger .
For det første er akustiske signaler, der transmitteres gennem luften , udsat for forvrængning på grund af støj . Pålidelige talebehandlingssystemer, der ville fungere fejlfrit i overfyldte restauranter, lufthavne og andre offentlige steder, på trods af titaniske anstrengelser, er stadig ikke i syne.
For det andet kræver traditionelle talegrænseflader klar og forståelig tale, hvilket har to hovedulemper: På et offentligt sted kompromitterer det budskabets fortrolighed og for det andet forstyrrer andre. Tjenester, der kræver adgang, hentning og transmission af private eller fortrolige oplysninger såsom pinkoder og adgangskoder, er særligt sårbare.

I begyndelsen af 2000'erne, for at løse dette problem, blev der foreslået grænseflader med tavs adgang , som gør det muligt for brugere at kommunikere ved at tale "lyde", det vil sige uden at lave nogen lyde. Dette gøres ved at modtage talesignaler i de tidlige stadier af menneskelig artikulation, nemlig før talen dukker op i luften; derefter sendes artikulationssignalerne til systemet til videre bearbejdning og fortolkning. På grund af denne nye tilgang har lydløse grænseflader potentialet til at overvinde de vigtigste mangler ved nutidens traditionelle talegrænseflader:

begrænsning af pålideligheden af talesignalgenkendelse ved tilstedeværelse af baggrundsstøj,
manglende pålidelighed i overførsel af private og fortrolige oplysninger,
andres bekymringer.

Derudover kunne silent access-grænseflader være et alternativ for personer med talehandicap (f.eks. laryngektomi) og for ældre eller svækkede mennesker, som ikke kan tale højt nok, klart og forståeligt.

Teknologi

pak. H. Chan et al. beviste ( 2001 , 2002) [1] at det myoelektriske signal fra de artikulatoriske ansigtsmuskler indeholder nok information til præcist at skelne et lille sæt ord. Disse ord genkendes, selv når de bliver sagt sagte, dvs. i fravær af et lydsignal (Jorgensen et al. 2003, Bradley et al. 2006). Nyere arbejde tyder på, at genkendelsen af fonemiske enheder baseret på elektromyografiske (EMG) enheder (Jou et al. 2006, Walliczek et al. 2006) baner vejen for genkendelsen af omfattende ordforrådsbaser.

For nylig er der også opstået forskning, der muliggør udvikling af en Silent Access Interface baseret på tunge- og læbebevægelser ved hjælp af ultralyd og optisk billeddannelse (Denby og Stone 2004, Denby et al. 2006, Hueber et al. 2007).

SSI-systemer, der konverterer "grynt" til tale, er overvejende udviklet i Japan . I USA finansierer DARPA forskning i glottal aktivitet til brug af sensorer i støjende omgivelser:

Som en del af programmet for moderne talekodning ( engelsk Advanced speech encoding , forkortelse ASE ) [2] vil der blive udviklet teknologier, der vil muliggøre udveksling af information under vanskelige militære forhold.

Der er gjort store fremskridt i udviklingen af stemmekoderen ( vokoderen ) i løbet af de sidste 50 år , men stemmekodning med ultralav bithastighed (ULBR) ved 300 bps er fortsat en stor udfordring. Især har ULBR-vokodere stadig ikke en højkvalitets taleanalysator, der kan genkende højttalerens tale uden interferens; disse ulemper er overdrevet i akustisk vanskelige miljøer (for eksempel i et støjende rum eller i et rum med genklang).

Den tilgang, der følges af programmet Advanced Speech Encoding (ASE) er at bruge nye sensorer , der er upåvirket af støj, som et supplement til de behandlede akustiske signaler (se figur). Sådanne sensorer vil blive udforsket for deres potentiale, således at før-tale/hørbar tale kan bruges som et alternativt kommunikationsmiddel i akustisk barske og farlige miljøer, hvor militær camouflage er obligatorisk.

—

Se også

Noter

↑ Pakke. H. Chan Håndbog i Neurochemistry and Molecular Neurobiology
↑ Avanceret talekodning Arkiveret 6. marts 2016 på Wayback Machine . Virtuelt worldlets netværk.

Silent Access Interface

Historie

Teknologi

Se også

Links

Noter