Sisu juurde

Morfologia analizilo de Esperantaj vortoj

kelle poolt Vilius, 16. oktoober 2012

Postitused: 15

Keel: Esperanto

darkweasel (Näita profiili) 16. oktoober 2012 11:02.21

fakte ĉe "paperaro" mi atendus ankaŭ pap-er-ar-o - kvankam sensencas tio.

Vilius (Näita profiili) 16. oktoober 2012 11:24.14

darkweasel:fakte ĉe "paperaro" mi atendus ankaŭ pap-er-ar-o - kvankam sensencas tio.
Mi limigis aperojn de mallongaj morfemoj, kiel "er", "ar" kaj multaj aliaj per reguloj. Mi faris tion, ĉar sen reguloj tiaj morfemoj estos trovataj en multegaj absurdaj kombinaĵoj. Ekzemple hipoteza vorto "komencopaleontologiokonservatoriaĉestriĝontajn" (el Vikipedio) havas ĉirkaŭ duonon da miliono da alternativaj fendaĵoj, se oni ne uzas regulojn por filtri ilin.
Kompreneble parto de miaj reguloj ja estas gramatike logikaj, ekzemple: "finaĵo ne aperu post prefikso", kaj similaj. Tamen aliaj estas nur ad-hoc reguloj por forfiltrigi nedezirataj variantoj.
Tamen, via ekzemplo teĥnike estas valida vorto, do mi nepre kontrolos kial malaperis varianto pap-er-ar-o.

Vilius (Näita profiili) 16. oktoober 2012 11:42.52

Paperaro ĝustigita (jes, mi ne povis rezisti kontraŭ deziro uzi ĉi tiun vortludon ridulo.gif)
Nun tiu vorto estos disigata en tri variantoj: ^ar-o, -o kaj ^er^ar-o, en tia ordo. Mi jam ĝisdatigis programon en la servilo.

Vilius (Näita profiili) 16. oktoober 2012 17:15.59

Kial neniu provas disigi simplajn vortojn, kiel ekzemple "domo" aŭ "malbona"? Kial "vagademuloj"?! Ne, mi nur ŝercas. Mi ege dankas pro via testado, dank' al kiu mi hodiaŭ ĝustigis kelkajn erarojn ridulo.gif

Iu provis disigi vorton "bonegas". La programo ne disigas ĝin al bon-eg-as, ĉar la radiko "bon" ne aperas en verba formo en vortaroj (mi plejparte uzas PIVon kaj la Retan Vortaron). Jes, tiu vorto povus ekzisti, kaj se tia formo aperos en la vortaro, aŭ mi sufiĉe ofte frovos ĝin en korpusoj, tiam mi permesos ankaŭ la verban formon.

Vilius (Näita profiili) 29. oktoober 2012 15:43.39

Mi iomete ĝisdatigis mian analizilon. Kaj ŝatantoj de senutila statistiko trovos iom da informo en nova paĝo pri n-gramoj de Esperantaj leteroj.

Tagasi üles