Páginas

domingo, 3 de março de 2013

FLAT inicialización DE CI MODELO PARAMETROJ

ENTRENAMIENTO kontinua Modeloj

CI-modeloj konsistas el 4 parametraj dosieroj:
  • mixture_weights: la pezoj donita al ĉiu Gaŭsa en la Gaŭsa miksaĵo responda al stato
  • transition_matrices: la matrico de stato transiro probabloj
  • signifas: per tuta Gaussians
  • varianzas: varianzas de ĉiuj Gaussians
Por komenci trejni la CI modeloj, ĉiu el ĉi tiuj dosieroj devas havi iujn komencajn enskriboj, kio estas, devas esti "inicializado". La mixture_weights kaj transition_matrices estas inicializado uzanta la ruleblan mk_flat. Ĝi bezonas la sekvaj argumentoj:
FLAG PRISKRIBO
-Moddeffn CI modelo difino dosieron
-Talpo HMM topologio dosieron
-Mixwfn dosiero kiun vi volas skribi la inicializado miksaĵo pezoj
-Tmatfn dosiero kiun vi volas skribi la inicializado transiro matricoj
-Nstream nombro de sendependa trajto torentojn por kontinuaj modeloj tiu nombro devus esti aro al "1", sen la duoblaj citiloj
-Ndensity numeron de Gaussians modeli ĉiu stato. Por CI modeloj, tiu nombro devus esti aro al "1"
Al pravalorizi la rimedojn kaj varianzas, tutmondaj valoroj de tiuj parametroj estas unue taksita kaj poste kopiis en taŭgaj pozicioj en la parametro dosierojn. La tutmonda meznombro estas komputita uzanta ĉiujn vektoroj vi havas en via trajto dosierojn. Ĉi tiu estas kutime tre granda nombro, do la laboron estas dividita en multaj partoj. En ĉi tiu etapo vi diru al la Sfinkso kiom partoj vi volas dividi tiun operacion en (depende de la komputanta instaladoj vi havas) kaj la Sfinkso "amasigas" aŭ kolektas ĝis la vektoroj por ĉiu parto aparte kaj skribas gxin en intera buffer sur via maŝino. La plenumebla init_gau uzas tiucele. Ĝi bezonas la sekvaj argumentoj:
FLAG PRISKRIBO
-Accumdir dosierujo en kiu vi volas skribi la intera buffers
-Ctlfn kontrolo dosieron
-Parto parto nombro
-Npart tuteca nombro de partoj
-Cepdir pado al karakterizaĵo dosieroj - ĉi estos aldonita antaŭ ĉiuj vojoj donita en la kontrolo dosieron
-Cepext dosiernomo etendo de trajto dosieroj, ekz. "MFC" por dosieroj nomiĝas / b / c.mfc. Duoblaj citiloj ne bezonis
-Heroaĵo tipo de funkcio
-Ceplen dimensinombro de bazo karakteriza vektoroj
-AGC aŭtomata gajno kontrolo faktoro (max / neniu)
-CMN cepstral meznombro normaligo (jes / ne)
-Varnorm varianco normaligo (jes / ne)
Iam la bufroj estas skribitaj, la enhavo de la bufroj estas "ununormigita" aŭ uzata por komputi tutmonda meznombra valora por la karakteriza vektoroj. Ĉi tiu estas farita uzante la ruleblan normo kun la sekva flago agordoj:
FLAG PRISKRIBO
-Accumdir buffer katalogo
-Meanfn dosiero kiun vi volas skribi la tutmonda meznombro
-Heroaĵo tipo de funkcio
-Ceplen dimensinombro de bazo karakteriza vektoro
La sekva paŝo estas "amasigi" la vektoroj por komputanta tutmonda varianco valoro. La plenumebla init_gau, kiam nomas duafoje ĉirkaŭe, prenas la valoro de la tutmonda meznombro kaj kolektas aron de (vektoro-globalmean) 2 valoroj por la tuta aro de datumoj. Ĉifoje, ĉi ruleblan bezonas la sekvajn argumentojn:
FLAG PRISKRIBO
-Accumdir dosierujo en kiu vi volas skribi la intera buffers
-Meanfn globalmean dosieron
-Ctlfn kontrolo dosieron
-Parto parto nombro
-Npart tuteca nombro de partoj
-Cepdir pado al karakterizaĵo dosieroj - ĉi estos aldonita antaŭ ĉiuj vojoj donita en la kontrolo dosieron
-Cepext dosiernomo etendo de trajto dosieroj, ekz. "MFC" por dosieroj nomiĝas / b / c.mfc. Duoblaj citiloj ne bezonis
-Heroaĵo tipo de funkcio
-Ceplen dimensinombro de bazo karakteriza vektoroj
-AGC aŭtomata gajno kontrolo faktoro (max / neniu)
-CMN cepstral meznombro normaligo (jes / ne)
-Varnorm varianco normaligo (jes / ne)
Denove, tuj la bufroj estas skribitaj, la enhavo de la bufroj estas "ununormigita" aŭ uzata por komputi tutmonda varianco valoro por la karakteriza vektoroj. Tio denove faris uzante la ruleblan normo kun la sekva flago agordoj:
FLAG PRISKRIBO
-Accumdir buffer katalogo
-Varfn dosiero kiun vi volas skribi la tutmonda varianco
-Heroaĵo tipo de funkcio
-Ceplen dimensinombro de bazo karakteriza vektoro
Iam la tutmonda meznombro kaj varianco tutmonda estas komputita, ili devas esti kopiita en la rimedoj kaj varianzas de ĉiu ŝtato de ĉiu de la HMMs. La tutmonda meznombro estas skribita en taŭga stato poziciojn en duona dosieron dum la tutmonda varianco estas skribita en taŭga stato pozicioj en varianzas dosiero. Se vi uzas la skriptoj provizita kun la sfinkso pako, vi trovos tiujn dosierojn kun "flatinitial" kiel parto de lia nomo en la model_parameters dosierujo.
La plata rimedoj kaj varianzas dosiero povas esti kreita uzanta la ruleblan cp_parm. Por povi uzi tiun plenumeblan vi devos krei copyoperations mapo dosiero kiu estas du-kolumna dosiero, kun la maldekstra kolumno id-ing la stato * al * kiu la tutmonda valoro devas esti kopiitaj, kaj la dekstran kolumno id-ing la stato * de * kiu devas esti kopiita. Se estas "nphones" CI telefonoj kaj ĉiu ŝtato havas "nEstate_per_hmm" elsendante ŝtatoj, ekzistas volo esti ntotal_Estates = nphones * nEstate_per_hmm linioj en la copyoperations mapo dosiero; la stato id-s (sur la maldekstra kolumno) kuri de 0 thru (ntotal_Estates - 1). Jen ekzemplo por 3-stato hmm (nEstate_per_hmm = 3) por du telefonoj (nphones = 2) (ntotal_Estates = 6, do, ŝtata IDS varius de 0-5):
  0 0
 1 0
 2 0
 3 0
 4 0
 5 0
cp_parm postulas la sekvajn argumentojn.
FLAG PRISKRIBO
-Cpopsfn copyoperations mapaj dosieron
-Igaufn enigo tutmonda meznombro (aŭ varianco) dosiero
-Ncbout numeron de telefonoj fojoj la nombro de ŝtatoj por HMM (tio estas, nombro de ŝtatoj)
-Ogaufn eligo inicializado per (aŭ varianzas) dosiero
cp_parm devas kuri dufoje, unufoje por kopii la rimedoj, kaj iam por kopii la varianzas. Ĉi kompletigas la inicialización procezo por CI trejnado.

Nenhum comentário:

Postar um comentário