去目錄頁

Morfologia analizilo de Esperantaj vortoj

Vilius, 2012年10月16日

讯息: 15

语言: Esperanto

darkweasel (显示个人资料) 2012年10月16日上午11:02:21

fakte ĉe "paperaro" mi atendus ankaŭ pap-er-ar-o - kvankam sensencas tio.

Vilius (显示个人资料) 2012年10月16日上午11:24:14

darkweasel:fakte ĉe "paperaro" mi atendus ankaŭ pap-er-ar-o - kvankam sensencas tio.
Mi limigis aperojn de mallongaj morfemoj, kiel "er", "ar" kaj multaj aliaj per reguloj. Mi faris tion, ĉar sen reguloj tiaj morfemoj estos trovataj en multegaj absurdaj kombinaĵoj. Ekzemple hipoteza vorto "komencopaleontologiokonservatoriaĉestriĝontajn" (el Vikipedio) havas ĉirkaŭ duonon da miliono da alternativaj fendaĵoj, se oni ne uzas regulojn por filtri ilin.
Kompreneble parto de miaj reguloj ja estas gramatike logikaj, ekzemple: "finaĵo ne aperu post prefikso", kaj similaj. Tamen aliaj estas nur ad-hoc reguloj por forfiltrigi nedezirataj variantoj.
Tamen, via ekzemplo teĥnike estas valida vorto, do mi nepre kontrolos kial malaperis varianto pap-er-ar-o.

Vilius (显示个人资料) 2012年10月16日上午11:42:52

Paperaro ĝustigita (jes, mi ne povis rezisti kontraŭ deziro uzi ĉi tiun vortludon ridulo.gif)
Nun tiu vorto estos disigata en tri variantoj: ^ar-o, -o kaj ^er^ar-o, en tia ordo. Mi jam ĝisdatigis programon en la servilo.

Vilius (显示个人资料) 2012年10月16日下午5:15:59

Kial neniu provas disigi simplajn vortojn, kiel ekzemple "domo" aŭ "malbona"? Kial "vagademuloj"?! Ne, mi nur ŝercas. Mi ege dankas pro via testado, dank' al kiu mi hodiaŭ ĝustigis kelkajn erarojn ridulo.gif

Iu provis disigi vorton "bonegas". La programo ne disigas ĝin al bon-eg-as, ĉar la radiko "bon" ne aperas en verba formo en vortaroj (mi plejparte uzas PIVon kaj la Retan Vortaron). Jes, tiu vorto povus ekzisti, kaj se tia formo aperos en la vortaro, aŭ mi sufiĉe ofte frovos ĝin en korpusoj, tiam mi permesos ankaŭ la verban formon.

Vilius (显示个人资料) 2012年10月29日下午3:43:39

Mi iomete ĝisdatigis mian analizilon. Kaj ŝatantoj de senutila statistiko trovos iom da informo en nova paĝo pri n-gramoj de Esperantaj leteroj.

回到上端