Páginas

domingo, 3 de março de 2013

Modeling kunteksto-dependa telefonoj kun deĉenigis STATES: KELKAJ MEMORO Postuloj

Modeling kunteksto-dependa telefonoj kun deĉenigis STATES: KELKAJ MEMORO Postuloj

ANTAŬE VI trajno

Modeling kunteksto-dependa telefonoj kun deĉenigis STATES: KELKAJ MEMORO Postuloj
Modelado Ĉirkaŭteksto-dependa telefonoj (ej. triphones) kun deĉenigis ŝtatoj postulas la plej granda kvanto de aparataro rimedoj. Preni momenton por kontroli se vi havas sufiĉe. La rimedoj bezonataj dependas de la tipo de modelo vi iras por trejni, la dimensinombro kaj agordo de via trajto vektoroj, kaj la nombro de la ŝtatoj en la HMMs.
Semi-kontinua modeloj
Trejni 5-state/HMM modeloj por 10.000 triphones:
  5 ŝtatoj / triphone = 50.000 ŝtatoj
 Por 4-fluo karakterizaĵo-aro, ĉiu = 1024 glitpunktaj nombroj / stato
 stato havas entute 4 * 256 miksaĵo   
 pezoj
                                      = 205Mb buffer por 50.000 ŝtatoj
Responda al ĉiu el la kvar karakterizaĵo riveretoj, estas 256 la rimedoj kaj 256 varianzas en la codebook. ĈIUJ tiuj, kaj ĈIUJN la miksaĵo pezoj kaj transiro matricoj estas ŝarĝitaj en en la memoro RAM, kaj dum trejni plia buffer de egala grandeco estas asignitaj por stoki interaj rezultoj. Ĉi tiuj estas poste skribita ekster en la malmola disko, kiam la ŝtonoj por la aktuala trejnado ripeto estas kompletaj. Notu ke ekzistas tiom da transiro matricoj kiel vi havas telefonoj (40-50 por la angla lingvo, depende de via vortaro) Ĉiuj ĉi tiuj kvantoj atribuo bone ol 400 Mb de RAM. Tio ĉi estas botelkolo por maŝinoj kun plej malgranda memoro. Negrave kiom grandaj vian trejnado korpuso estas, vi povas efektive trejnos nur ĉirkaŭ 10.000 triphones ĉe la cd-deĉenigis etapon se vi havas ~ 400 Mb de RAM (A 100 horon elsendo novaĵoj korpuso tipe havas 40.000 triphones). Vi povus trejni pli se via maŝino kapablas manipuli la memoro postulas efike (ĉi povus fari, ekzemple, por havi grandan kvanton de interŝanĝa spaco). Se vi trejnis en multnombraj maŝinoj, * cxiu * postulos ĉi multe memoro. Krome, ĉe la fino de ĉiu ripeto, vi devas transdoni ĉiujn bufroj al sola maŝino kiu plenumas la normo. Retoj temoj bezonas esti konsiderita ĉi tie.
La cd-deĉenigis modeloj estas uzitaj por konstrui arboj. La nombro de triphones vi trejni je ĉi tiu stadio rekte tuŝas la kvalito de la arboj, kiuj devus esti konstruitaj uzante malpli triphones ol estas reale ĉeestas en la trejnado aro se vi ne havas sufiĉan memoron.
Kontinua modeloj
Por 10.000 triphones:
  5 ŝtatoj / triphone = 50.000 ŝtatoj
 39 rimedoj (supozante
 39-komponanto karakterizaĵo
 vektoro) kaj 39
 varianzas po ŝtato = 79 flosanta punktoj por stato
                           = 15.8Mb buffer por 50.000 ŝtatoj
Tiel ni povas trejni 12 fojoj triphones kiel ni povas, kiam ni havas semicontinuous modeloj por la sama kvanto de memoro. Ĉar ni povas uzi pli triphones trejni (kaj sekve pli da informoj) La decido arboj estas pli bona, kaj fine rezultos en pli bona rekono agado. reen al indekso

Nenhum comentário:

Postar um comentário