إلى المحتويات

Morfologia analizilo de Esperantaj vortoj

من Vilius, 16 أكتوبر، 2012

المشاركات: 15

لغة: Esperanto

darkweasel (عرض الملف الشخصي) 16 أكتوبر، 2012 11:02:21 ص

fakte ĉe "paperaro" mi atendus ankaŭ pap-er-ar-o - kvankam sensencas tio.

Vilius (عرض الملف الشخصي) 16 أكتوبر، 2012 11:24:14 ص

darkweasel:fakte ĉe "paperaro" mi atendus ankaŭ pap-er-ar-o - kvankam sensencas tio.
Mi limigis aperojn de mallongaj morfemoj, kiel "er", "ar" kaj multaj aliaj per reguloj. Mi faris tion, ĉar sen reguloj tiaj morfemoj estos trovataj en multegaj absurdaj kombinaĵoj. Ekzemple hipoteza vorto "komencopaleontologiokonservatoriaĉestriĝontajn" (el Vikipedio) havas ĉirkaŭ duonon da miliono da alternativaj fendaĵoj, se oni ne uzas regulojn por filtri ilin.
Kompreneble parto de miaj reguloj ja estas gramatike logikaj, ekzemple: "finaĵo ne aperu post prefikso", kaj similaj. Tamen aliaj estas nur ad-hoc reguloj por forfiltrigi nedezirataj variantoj.
Tamen, via ekzemplo teĥnike estas valida vorto, do mi nepre kontrolos kial malaperis varianto pap-er-ar-o.

Vilius (عرض الملف الشخصي) 16 أكتوبر، 2012 11:42:52 ص

Paperaro ĝustigita (jes, mi ne povis rezisti kontraŭ deziro uzi ĉi tiun vortludon ridulo.gif)
Nun tiu vorto estos disigata en tri variantoj: ^ar-o, -o kaj ^er^ar-o, en tia ordo. Mi jam ĝisdatigis programon en la servilo.

Vilius (عرض الملف الشخصي) 16 أكتوبر، 2012 5:15:59 م

Kial neniu provas disigi simplajn vortojn, kiel ekzemple "domo" aŭ "malbona"? Kial "vagademuloj"?! Ne, mi nur ŝercas. Mi ege dankas pro via testado, dank' al kiu mi hodiaŭ ĝustigis kelkajn erarojn ridulo.gif

Iu provis disigi vorton "bonegas". La programo ne disigas ĝin al bon-eg-as, ĉar la radiko "bon" ne aperas en verba formo en vortaroj (mi plejparte uzas PIVon kaj la Retan Vortaron). Jes, tiu vorto povus ekzisti, kaj se tia formo aperos en la vortaro, aŭ mi sufiĉe ofte frovos ĝin en korpusoj, tiam mi permesos ankaŭ la verban formon.

Vilius (عرض الملف الشخصي) 29 أكتوبر، 2012 3:43:39 م

Mi iomete ĝisdatigis mian analizilon. Kaj ŝatantoj de senutila statistiko trovos iom da informo en nova paĝo pri n-gramoj de Esperantaj leteroj.

عودة للاعلى