ANTAŬE VI trajno
DATUMaJ Preparadoj |
- Aro de trajto dosieroj komputita de la audio trejnado datumoj, oni ĉiu por ĉiu registrado vi havas en la trejnado korpuso. Ĉiu registrado povas esti konvertita enen vico de trajto vektoroj uzante front-end ruleblan provizita per la SPHIN-III trejnado pako. Ĉiu front-end ruleblan havigis ludas alian analizo de la parolado signaloj kaj komputas malsama tipo de funkcio.
- Al kontrolo dosiero enhavanta la listo de karakterizaĵo-aro dosiernomojn kun plena vojoj al ili. Ekzemplo de la elementoj en ĉi tiu dosiero:
dir/subdir1/utt1 dir/subdir1/utt2 dir/subdir2/utt3
Notu ke la vastigaĵoj ne estas donita. Ili estos provizita de aparta por la trejnisto. Estas bona ideo doni unika nomojn al ĉiuj prezentas dosieroj, eĉ se inkludante la plenan vojoj ŝajnas fari ĉiu eniro en la kontrolo dosieron unika. Vi trovos poste tiu ĉi havigas multajn fleksebleco por fari multajn aferojn. - Al transskribo dosieron en kiu la transskriboj responda al la trajto dosieroj estas listigitaj en ĝuste la sama ordo kiel la trajto dosiernomojn en la kontrolo dosiero.
- Al ĉefa vortaro kiu havas ĉiujn akustiko eventoj kaj vortoj en la transskriboj mapita sur la akustiko unuoj vi volas trejni. Redundo en formo de ekstraj vortoj estas permesita. La vortaro devas havi ĉiuj alternaj prononco markitaj per paranthesized seria nombroj ekde (2) por la dua prononcon. La markilo (1) estas nefarita. Jen ekzemplo:
Direkti D AY R EH KTI ng Direkti (2) D ER EH KTI ng Direkti (3) DIR EH KTI ng
- Al plenigita vortaro, kiu kutimas listas la ne-parolado okazaĵoj kiel "vortoj" kaj mapas ilin user_defined telefonoj. Ĉi tiu vortaro devas almenaŭ havi la enskriboj
<s> SIL <sil> SIL </ S> SIL
La enskriboj por stari<s>: begining-parolo silento <sil>: ene-parolo silento </ S>: fino-parolo silento
Notu ke la vortoj <s>, </ s> kaj <sil> estas traktitaj kiel specialaj vortoj kaj estas postulita por ĉeesti en la kompletigo vortaro. Almenaŭ unu el tiuj devas esti mapita al telefono nomita "SIL". La telefono SIL estas traktita en speciala maniero kaj estas postulita al esti aktuala. La sfinkso atendas vin enoficigi la akustiko eventoj responda al via ĝenerala fono kondiĉo kiel SIL. Por pura parolado tiuj eventoj povas esti silentigas, sed por brua parolado tiuj povas esti la plej ĝenerala klaso de fono bruo kiu regas en la datumbazo. Aliaj bruoj povas tiam esti modelita per telefonoj difinita de la uzanto. Dum trejnado SIL anstataŭas ĉiu telefono flanqueada por "+" kiel la kunteksto por najbaraj telefonoj. La telefonoj flanqueada por "+" estas nur modelita kiel CI telefonoj kaj estas ne uzata kiel kuntekstoj por triphones. Se vi ne volas ke ĉi tio okazas al vi eble mapaj viaj kompletigoj al telefonoj kiuj ne flanqueada por "+". - Al phonelist, kiu estas listo de ĉiuj akustiko unuoj ke vi volas trejni modeloj por. La Sfinkso ne permesas vin havi unuoj aliaj ol tiuj en via vortaroj. Ĉiuj ekzemplerojn en viaj du vortaroj devas esti listigitaj tie. En aliaj vortoj, via phonelist devas havi ekzakte la sama unuoj uzataj en via vortaroj, ne pli, nenio malpli. Ĉiu telefono devas esti listita en aparta linio en la dosiero, begining de maldekstre, sen ekstra spacoj post la telefono. ekzemplo:
AA AE OW B Ch
- Estas ĉiuj la transskribon vortojn en la vortaro / plenigita vortaro?
- Certiĝu ke la grandeco de transskribo kongruas la. CTL dosiero.
- Kontrolu la limoj difinitaj en la. CTL dosiero por certigi ke ili ekzistas te, vi havas ĉiujn kadrojn ke estas listigitaj en la kontrolo dosieron
- Kontroli la phonelist kontraŭ la vortaron kaj fillerdict
Se vi havas nur ĉirkaŭ 50-60 vortoj en vian vortprovizon, kaj se via tuta testo datumoj vortostoko estas kovrita de la trejnado datumojn, tiam oni verŝajne pli bone trejnado vorto modeloj anstataŭ telefonon modeloj. Por tion fari, simple difini la phoneset kiel via aro de vortoj mem kaj havi vortaron kiu mapas ĉiu vorto al sin kaj trajno. Ankaŭ, uzu malpli da kompletigoj, kaj se vi bezonas trejni telefono modeloj certigi ke ĉiu el viaj ligita ŝtatoj havas sufiĉe grafoj (almenaŭ 5 aŭ 10 petskribojn de ĉiu).
Nenhum comentário:
Postar um comentário