Páginas

domingo, 3 de março de 2013

ENTRENAMIENTO kuntekston SENDEPENDA Modeloj

ENTRENAMIENTO kontinua Modeloj

Iam la ebena inicialización estas farita, vi estas preta por komenci trejnado la akustiko modeloj por la bazo aŭ "kunteksto-sendependa" aŭ CI telefonoj. Tiu paŝo estas nomata CI-trejnado. En CI-trejnado, la plat-inicializado modeloj estas re-taksita tra la antaŭen-malantaŭen re-korinklino algoritmo nomata Baum-Welch algoritmo. Ĉi tiu estas ripeta re-korinklino procezo, do vi devas kuri multaj "pasas" de la Baum-Welch re-korinklino super via trejnado datumoj. Ĉiu de ĉi tiuj paŝoj, aŭ ripetoj, ripetas, rezultigas iomete pli bonan aron de modeloj por la CI telefonoj. Tamen, ĉar la objektiva funkcio maksimumigita en ĉiu de la tezo pasas estas la verŝajneco, tro multaj iteraciones estus finfine rezultos en modeloj kiuj persvadis tre proksime al la trejnado datumoj. vi eble ne volas ke ĉi tio okazas pro multaj kialoj. Tipe, 5-8 iteraciones de Baum-Welch estas sufiĉa por prenantaj bonaj taksoj de la CI modeloj. Vi povas aŭtomate determinas la nombron de ripetoj, ripetas, ke vi bezonas rigardi la tuta verŝajneco de la trejnado datumojn al la fino de la unua ripeto kaj elektante por "konverĝo rilatumo" de likelihoods. Ĉi tiu estas simple la rilatumo de la plena verŝajneco en la nuna ripeto al tiu de la antaŭa ripeto. Kiel la modeloj ricevas pli kaj pli persvadis al la trejnado datumojn en ĉiu ripeto, la trejnado datumoj likelihoods tipe pliigi monotone. La konverĝo rilatumo estas tiel malgranda pozitiva nombro. La konverĝo rilatumo iĝas pli kaj pli kiel la iteraciones progreso, ĉar ĉiufoje kiam la aktualaj modeloj estas iom malpli diferencas de la antaŭaj. Konverĝo kvocientoj estas datumoj kaj tasko specifa, sed tipa valoroj al kiuj vi povas haltigi la Baum-Welch iteraciones por via CI trejnado povas varii de 0.1-0.001. Kiam la modeloj estas varianco-ununormigita, la konverĝo kvocientoj estas multe pli malgranda.
La plenumebla uzata por ruli Buam-Welch ripeto nomas "BW", kaj prenas la sekvan ekzemplon argumentojn por trejnado kontinua CI modeloj:
FLAG PRISKRIBO
-Moddeffn modelo difino dosiero por CI telefonoj
-Ts2cbfn ĉi flago devas esti aro al ". daŭrigo." se vi trejnis kontinua modeloj, kaj al ". semi". se vi trejnis duon-kontinua modeloj , sen la duoblaj citiloj
-Mixwfn nomo de la dosiero en kiu la miksaĵo-pezoj de la antaŭa ripeto estas stokitaj. Kompletan padon devas esti provizita
-Mwfloor Etaĝo valoro por la miksaĵo pezoj. Ajnan numeron sub la planko valoro estas metita sur la plankon valoro.
-Tmatfn nomo de la dosiero en kiu la transiro matricoj de la antaŭa ripeto estas stokitaj. Kompletan padon devas esti provizita
-Meanfn nomo de la dosiero kiun la rimedoj de la antaŭa ripeto estas stokitaj. Kompletan padon devas esti provizita
-Varfn nomo de la dosiero en kiu la varianzas fromt li antaŭa ripeto estas stokitaj. Kompletan padon devas esti provizita
-Dictfn Vortaro
-Fdictfn Plenigita vortaro
-Ctlfn kontrolo dosieron
-Parto Vi povas dividi la trejnado en N egalaj partoj per opcio flagon. Se estas M eldiroj en via kontrolo dosiero, tiam ĉi ebligos al vi kuri la trejnado aparte sur ĉiu (M / N) th parto. Tiu flago povas esti agordita por specifi, kiu el tiuj partoj vi volas aktuale trejni plu. Kiel ekzemplo, se via tuta numero de partoj estas 3, tiu flago povas preni unu el la valoroj 1,2 aŭ 3
-Npart nombro de partoj en kiuj vi jam fendis trejnado
-Cepdir dosierujo kie viaj karakterizaĵo dosieroj stokitaj
-Cepext la pligrandigo kiu venas post la nomo listigitaj en la kontrolo dosiero. Ekzemple, vi povas havi dosiero nomata / b / cd kaj eble listigita a / b / c en via kontrolo dosiero. Tiam ĉi flago devas esti donita la argumento "d", sen la duoblaj citiloj aux la skalara antaux gxi
-Lsnfn nomo de la transskribo dosieron
-Accumdir Interaj rezultoj de ĉiu parto de via trejnado estos skribita en ĉi tiu dosierujo. Se vi havas T signifas taksi, tiam la grandeco de la meznombro buffer de la aktuala parto de via trejnado estos T * 4 bajtoj (diri). Estos ankaux esti varianco buffer, buffer por miksaĵo pezoj kaj buffer por transiro matricoj
-Varfloor minimuma varianco valoro permesita
-Topn ne. de gaussians konsideri por komputanta la verŝajneco de ĉiu ŝtato. Ekzemple, se vi havas 8 gaussians / stato modeloj kaj topn estas 4, do la 4 plej verŝajne gaŭsa estas uzitaj.
-Abeam antaŭen beamwidth
-Bbeam malantauxen beamwidth
-AGC aŭtomata gajno kontrolo
-CMN cepstral meznombro normaligo
-Varnorm varianco normaligo
-Meanreest signifas re-proksumumo
-Varreest varianco re-proksumumo
-2passvar Opcio ĉi flago por "jes" lasas BW uzi la antaŭa rimedoj en la korinklino de la varianco. La nuna varianco estas tiam taksis kiel E [(x - prev_mean) 2]. Se ĉi tiu flago estas metita al "ne" la nuna takso de la rimedoj estas uzataj por taksi varianzas. Tio necesigas la korinklino de varianco kiel E [x 2] - (E [x]) 2, malstabila proksimumilo ke kelkfoje rezultas en negativaj taksoj de la varianco pro aritmetiko imprecision
-Tmatreest re-takso transiro matricoj aŭ ne
-Heroaĵo karakterizaĵo agordo
-Ceplen longo de baza trajto vektoro
Se vi kuras la trejnado en multaj partoj, aŭ eĉ se vi kuros al la trejnado en unu parto, la ruleblan por Baum-Welch priskribita supre generas nur intera buffer (s). La modelo fino parametroj, nome la rimedoj, varianzas, miksaĵo-pezoj kaj transiro matricoj, devas esti taksita per la valoroj stokitaj en tiuj bufroj. Ĉi tiu estas farita de la ruleblan nomita "normo", kiu portas la sekvajn argumentojn:
FLAG PRISKRIBO
-Accumdir Intera buffer katalogo
-Heroaĵo karakterizaĵo agordo
-Mixwfn nomo de la dosiero kiun vi volas skribi la miksaĵo pezoj. Kompletan padon devas esti provizita
-Tmatfn nomo de la dosiero kiun vi volas skribi la transiro matricoj. Kompletan padon devas esti provizita
-Meanfn nomo de la dosiero kiun vi volas skribi la rimedoj. Kompletan padon devas esti provizita
-Varfn nomo de la dosiero kiun vi volas skribi la varianzas. Kompletan padon devas esti provizita
-Ceplen longo de baza trajto vektoro
Se vi ne re-taksita iu el la modelo parametroj en la BW paŝo, tiam la responda flago devas esti preterlasita de la argumento donita al la normo ruleblan. La plenumebla estos alie provu legi neekzistanta buffer de la buffer dosierujon kaj ne iros tra. Tial se vi starigis-meanreest esti "ne" en la argumento por BW, tiam la flago-meanfn devas ne estos transdonita en la argumento por normo. Ĉi tio estas utila ĉefe dum adapto. Iteraciones de Baum-Welch kaj normo fine rezultos CI modeloj. La iteraciones povas haltis tuj la verŝajneco de la trejnado datumoj konverĝas. La modelo parametroj komputita per normo en la fina ripeto estas nun uzata por pravalorizi la modeloj por kunteksto-dependa telefonoj (triphones) kun deĉenigis ŝtatoj. Ĉi tiu estas la sekva granda paŝo de la trejnado procezo. Ni raportos al la procezo de formado triphones HMMs kun deĉenigis ŝtatoj kiel la "KD deĉenigis trejnado".

Nenhum comentário:

Postar um comentário