VoiceXML
Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den
version , der blev gennemgået den 7. november 2021; checks kræver
2 redigeringer .
VoiceXML ( Voice eXtensible Markup Language , VXML ) er en af W3C 's åbne standarder baseret på XML - sprog [1] , protokol [2] , konversationsopmærkningssprog. VoiceXML 3.0 bliver den næste store version af VoiceXML med store nye funktioner. Det inkluderer et nyt XML-statechart-beskrivelsessprog kaldet SCXML.
Historie
Maj 2000 - offentliggørelse i det internationale konsortium World Wide Web (W3 Consortium) af den første version. Formålet er at udvikle interaktive stemmeapplikationer (Interactive Voice Response, IVR) til styring af medieressourcer. Målet med at skabe standarden er at bringe alle fordelene ved webprogrammering til udviklingen af IVR-applikationer [1] .
Multimodale applikationer, der kombinerer talegenkendelse med andre former for informationsinput (fra tastaturet, pen, et sæt numeriske knapper) er blevet opmærksom på en række store virksomheder (Microsoft og andre), som har besluttet at støtte SALT Forum (Tale Application Language Tags ) projekt. applikationer). Så nu dannes to forskellige lejre omkring SALT og VoiceXML af W3C-konsortiet. Indtil nu kan virksomheder ikke nå til enighed om valget af hovedstandard, og nu udvikler begge områder sig lige meget [1] .
Ved udvikling af pakker (Software Development Kit, SDK ) til oprettelse af taleapplikationer understøtter virksomheder en eller anden standard. For eksempel understøtter Speech SDK (af Philips) Voice XML-specifikationen og er designet til at kommunikere med C/C++ API'en [1] .
Specifikationer foreslået af W3C:
- Voice Extensible Markup Language (VoiceXML) Version 2.0 - 16. marts 2004. En del af W3C Speech Interface Framework, udviklet som en del af W3C Voice Browser Activity af medlemmer af Voice Browser Working Group (link utilgængeligt) . [3]
- Voice Extensible Markup Language (VoiceXML) 2.1 - 19. juni 2007 [4]
- Voice Extensible Markup Language (VoiceXML) 3.0 (W3C Working Draft) - 4. marts 2010 [5] . Giver mulighed for stemmeidentifikation [6]
Brug
Titusindvis af applikationer er allerede blevet oprettet [7]
- Opera (siden version 7.6)
- Moodle - planlagt til at blive brugt i anden version.
VoiceXML har tags, der er kommandoer til stemmebrowseren , som: syntetiserer, genkender tale, giver dialogstyring.
Eksempelkode
Eksempel på VoiceXML-dokument:
<vxml version= "2.0" xmlns= "http://www.w3.org/2001/vxml" >
<form>
<blok>
<prompt>
Hej Verden!
</prompt>
</block>
</form>
</vxml>
VoiceXML-tolken konverterer tekstsætningen "Hej verden!" til syntetiseret tale
Noter
- ↑ 1 2 3 4 Moderne talegenkendelsesteknologier Arkiveret 29. oktober 2007.
- ↑ Nortel udgav nye løsninger til integration af forretningsprocesser og applikationer (utilgængeligt link)
- ↑ Voice Extensible Markup Language (VoiceXML) version 2.0 . Hentet 6. april 2010. Arkiveret fra originalen 12. april 2010. (ubestemt)
- ↑ Voice Extensible Markup Language (VoiceXML) 2.1 . Hentet 6. april 2010. Arkiveret fra originalen 7. maj 2021. (ubestemt)
- ↑ Voice Extensible Markup Language (VoiceXML) 3.0 . Hentet 6. april 2010. Arkiveret fra originalen 2. marts 2021. (ubestemt)
- ↑ UzInfoCom Center for udvikling og implementering af computer- og informationsteknologier Arkiveret 25. oktober 2011.
- ↑ VoiceXML Forum . Hentet 6. april 2010. Arkiveret fra originalen 5. maj 2021. (ubestemt)
Se også
Links
talesyntese |
---|
Proprietær software |
- Gennemse højt
- CereProc
- DECtalk
- IVONA
- Microsoft Agent
- Microsoft Speech API
- Microsoft tekst-til-tale-stemmer
- Læser
- Tal det!
- stemmebrowser
- Vocaloid
- Kantor
- voiceroid
- Utau
- Software Automatisk Mund
- CoolSpeech
- La La Voice
- Symfoniske kor
- Realivox
- CeVIO Creative Studio
- Chiptale
- Alter ego
- PPG fonem
|
---|
gratis software |
|
---|
Bil |
- ekko 2
- Mønsterafspilning
- Phasor
- RIAS
- Texas Instruments LPC-talechips
- TuVox
|
---|
Ansøgninger |
- AOLbyPhone
- Dialog OS
- Dr. Sbaitso
- MBROLA
- Microsoft Fortæller
- Microsoft Speech Server
- PlainTalk
- stemme skrifttype
|
---|
Protokoller | Opmærkningssprog for talesyntese |
---|
Udviklere / forskere |
|
---|
Behandle |
- Artikulatorisk syntese
- Konkatenativ syntese
- Currah
- omvendt filter
- PSOLA
- Fase vocoder
- SABEL
- Selvudtalende
|
---|
World Wide Web Consortium (W3C) |
---|
Produkter og standarder | Anbefalinger |
|
---|
OOSO |
- IndieAuth
- XADES
- XBL
- +SMIL
- XUP
|
---|
Arbejdsprojekter |
|
---|
Vejledninger |
- Retningslinjer for tilgængelighed til webindhold
|
---|
Initiativer |
- Service
- Webtilgængelighedsinitiativ
- Webplatform
|
---|
Pensioneret _ |
|
---|
Forældet |
|
---|
|
---|
Organisationer |
| Arbejdsgrupper |
|
---|
Fællesskabs- og erhvervsgrupper |
|
---|
Lukkede grupper |
- Enhedsbeskrivelse (DDWG
- HTML
- Multimodal interaktionsaktivitet (MMI
|
---|
|
---|
PÅ | |
---|
Konferencer |
|
---|