Modeling kunteksto-dependa telefonoj kun deĉenigis STATES: KELKAJ MEMORO Postuloj
ANTAŬE VI trajno
Modeling kunteksto-dependa telefonoj kun deĉenigis STATES: KELKAJ MEMORO Postuloj |
Semi-kontinua modeloj
Trejni 5-state/HMM modeloj por 10.000 triphones:
5 ŝtatoj / triphone = 50.000 ŝtatoj Por 4-fluo karakterizaĵo-aro, ĉiu = 1024 glitpunktaj nombroj / stato stato havas entute 4 * 256 miksaĵo pezoj = 205Mb buffer por 50.000 ŝtatojResponda al ĉiu el la kvar karakterizaĵo riveretoj, estas 256 la rimedoj kaj 256 varianzas en la codebook. ĈIUJ tiuj, kaj ĈIUJN la miksaĵo pezoj kaj transiro matricoj estas ŝarĝitaj en en la memoro RAM, kaj dum trejni plia buffer de egala grandeco estas asignitaj por stoki interaj rezultoj. Ĉi tiuj estas poste skribita ekster en la malmola disko, kiam la ŝtonoj por la aktuala trejnado ripeto estas kompletaj. Notu ke ekzistas tiom da transiro matricoj kiel vi havas telefonoj (40-50 por la angla lingvo, depende de via vortaro) Ĉiuj ĉi tiuj kvantoj atribuo bone ol 400 Mb de RAM. Tio ĉi estas botelkolo por maŝinoj kun plej malgranda memoro. Negrave kiom grandaj vian trejnado korpuso estas, vi povas efektive trejnos nur ĉirkaŭ 10.000 triphones ĉe la cd-deĉenigis etapon se vi havas ~ 400 Mb de RAM (A 100 horon elsendo novaĵoj korpuso tipe havas 40.000 triphones). Vi povus trejni pli se via maŝino kapablas manipuli la memoro postulas efike (ĉi povus fari, ekzemple, por havi grandan kvanton de interŝanĝa spaco). Se vi trejnis en multnombraj maŝinoj, * cxiu * postulos ĉi multe memoro. Krome, ĉe la fino de ĉiu ripeto, vi devas transdoni ĉiujn bufroj al sola maŝino kiu plenumas la normo. Retoj temoj bezonas esti konsiderita ĉi tie.
La cd-deĉenigis modeloj estas uzitaj por konstrui arboj. La nombro de triphones vi trejni je ĉi tiu stadio rekte tuŝas la kvalito de la arboj, kiuj devus esti konstruitaj uzante malpli triphones ol estas reale ĉeestas en la trejnado aro se vi ne havas sufiĉan memoron.
Kontinua modeloj
Por 10.000 triphones:
5 ŝtatoj / triphone = 50.000 ŝtatoj 39 rimedoj (supozante 39-komponanto karakterizaĵo vektoro) kaj 39 varianzas po ŝtato = 79 flosanta punktoj por stato = 15.8Mb buffer por 50.000 ŝtatojTiel ni povas trejni 12 fojoj triphones kiel ni povas, kiam ni havas semicontinuous modeloj por la sama kvanto de memoro. Ĉar ni povas uzi pli triphones trejni (kaj sekve pli da informoj) La decido arboj estas pli bona, kaj fine rezultos en pli bona rekono agado. reen al indekso
Nenhum comentário:
Postar um comentário