Talekorpus ( lydkorpus ) er en database med lydfiler og transskriptioner af tekster, en type korpus af tekster . I taleteknologier bruges talekorpuer blandt andet til at skabe akustiske modeller (som så kan bruges i talegenkendelsesmotorer ). I lingvistik bruges talekorpus til forskning i fonetik , dialektologi , samtaleanalyse og andre områder.
Der er to typer talekorpus:
1. Grundlag af vellæste tekster, herunder:
2. Baser på lydoptagelser af spontan tale - herunder:
En særlig form for talekorpus er en database over tekster, der er talt af personer, der ikke er indfødte , og som indeholder tale med en fremmed accent .
naturlig sprogbehandling | |
---|---|
Generelle definitioner | |
Tekstanalyse |
|
Referencer |
|
Maskinoversættelse |
|
Identifikation og dataindsamling | |
Tematisk model | |
Peer review |
|
Naturlig sproggrænseflade [ |