Talekorpus

Talekorpus ( lydkorpus ) er en database med lydfiler og transskriptioner af tekster, en type korpus af tekster . I taleteknologier bruges talekorpuer blandt andet til at skabe akustiske modeller (som så kan bruges i talegenkendelsesmotorer ). I lingvistik bruges talekorpus til forskning i fonetik , dialektologi , samtaleanalyse og andre områder.

Der er to typer talekorpus:
1. Grundlag af vellæste tekster, herunder:

2. Baser på lydoptagelser af spontan tale - herunder:

En særlig form for talekorpus er en database over tekster, der er talt af personer, der ikke er indfødte , og som indeholder tale med en fremmed accent .

Noter

  1. Buckeye Corpus . Hentet 6. april 2018. Arkiveret fra originalen 23. marts 2018.

Litteratur

Links