Wpisy: 5
Język: Русский
SEN7759 (Pokaż profil) 2 marca 2025, 10:09:37
Шевченко Д. А., Стриганова А. О. Во введении авторы написали: "... в первую очередь использовали слова из частотных словарей и списков наиболее употребляемых слов...". Но в словаре учебника часто отсутствуют высокочастотные слова, но часто встречаются редкие.
Решил привести Esperanto-frekvenclisto (поскольку вопрос оказался непростым и актуальным).
SEN7759 (Pokaż profil) 2 marca 2025, 10:10:43
SEN7759 (Pokaż profil) 25 marca 2025, 09:55:54
1. Окончания морфем почти случайны.
2. Тексты взяты из открытых источников в инете. Старался соблюдать баланс: а) между областями: исторические, сказки, фантастика, романы, детективы, религиозные, политические...; б) по периодам: первые 50 лет, следующие 50 лет, последние 37 лет.
3. Морфемы приводятся вместе с приписанными им СУММАРНЫМИ частотами встречаемости.
Аналогичный список из 270 лексем опубликован в 2007 году в Докладах АН Республики Таджикистан (том 50, номер 4), авторы: Усманов З. Д., Шукуров Ф., Ёкубзода С. К сожалению, в том списке отсутствуют некоторые аффиксы! Полезно сравнить эти списки.
Удивило то, что суффикс -iĝ- оказался на 11-м месте. Вспомнил о совете Рене Соссюра заменить его на новый суффикс -ev- 30-х годах (причины, наверное, были такие: потеря шляпки может привести к серьёзному изменению смысла; большая благозвучность с учётом частоты встречаемости и сочетаний).
Всего слов в исходном списке было 1371834.
SEN7759 (Pokaż profil) 3 kwietnia 2025, 11:03:49
1. Список для устных диалогов, докладов, очевидно, был бы иным, сотни морфем из перечисленных стали бы более высокочастотными, другие использовались бы очень редко. Например, pasporto, kuko, forko, juro, bo-, названия месяцев, дней недели и т.д. повысили бы частотность. Поэтому для устной речи нужен иной список.
2. Среди исходных текстов нет научных и ничтожно мало стихов.
3. В эсперанто требуется намного меньше морфем для более полного покрытия множества слов из источников, чем в английском. Например, первые 1200 морфем обеспечат примерно 94% покрытие для 1371834 слов (для английского, имхо, потребовалось бы около 3000 морфем). При расчёте вообще убрал частоты для iĝ, ig, ist, ad, et (понятно, что результат "ну, очень примерный").
4. Некоторые морфемы попали в список, поскольку один из авторов очень часто их употреблял.
Например, ĉukĉo. Отметим, что в списке есть и относительно редкие для диалогов: mavo, magra, lezo, egoo, korso и т.д.
5. В списке оказались и 5 слов на букву ĥ:
ĥalato 15, ĥaoso 13, ĥemia 54, ĥirurgo 30, ĥore 45
6. При изучении на среднем уровне владения оптимально использовать этот список можно, например, так: первые 1200 морфем нужно будет выучить, а среди оставшихся выбрать 300 интуитивно и выучить (понятно, что лучше использовать диалоги, тексты, видео, программы, методики и т.п.).
SEN7759 (Pokaż profil) 8 kwietnia 2025, 08:18:22