Сообщение от
vika906091
Здравствуйте, нашла вот такой файл РУССКИЕ ФАМИЛИИ https://anonfile.com/x2lbjfu6oc/russian_rar можете сделать работу как над предыдущим файлом?
Одна особенность,в этом файле встречаются двойные фамилии написанные через "-" ,перед созданием словарика желательно удалить такие фамилии,в переборе я думаю они не нужны.<br/>
1. allnames_1.txt Взять каждое слово в 3-х регистрах: нижний, верхний, первая буква в верхнем регистре и добавить цифры от 00 до 99 и от 1970 до 2022
2. allnames_2.txt Взять каждое слово в 3-х регистрах: нижний, верхний, первая буква в верхнем регистре и добавлены цифры от 0 до 9999. Удалить все совпадения с allnames_1.txt. Т.е. содержимое allnames_2.txt не включает файл allnames_1.txt.
Спасибо.
Удачные примеры
https://forum.antichat.ru/threads/435763/page-1743#post-4382987
https://forum.antichat.ru/threads/435763/page-1742#post-4382951
https://forum.antichat.ru/threads/435763/page-1741#post-4382802
Сделала трансляцию раскладки и удалила имена короче 4х ,а также удалила имена с мягким знаком https://anonfile.com/z7yel3udo4/russian_SmallRegistr_txt
как правильно прикрутить диапазон цифр?
Взят исходный файл russian_фамилии.txt, все слова с не кириллическими символами удалены
Переведен в латиницу и отсортирован по длине, слова меньше 4-х символов удалены russian_family.txt
russian_family_1.txt
Взято каждое слово в 3-х регистрах: нижний, верхний, первая буква в верхнем регистре и добавлены цифры от 00 до 99 и от 1970 до 2022 + еще несколько чисел.
russian_family_2.txt
Взято каждое слово в 3-х регистрах: нижний, верхний, первая буква в верхнем регистре и добавлены цифры от 0 до 999. Удалены все совпадения с russian_family_1.txt. Т.е. содержимое russian_family_2.txt не включает файл russian_family_1.txt.
Цифры от 0000 до 9999 не добавлял, нет свободного места. Если надо, используйте правила digit4.rule.
Слова меньше 8ми символов удалены.
Все словари отсортированы по длине.
https://anonfile.com/1ap3A1ucod/russian_family_7z
https://drive.google.com/file/d/1rKjvCdTI0SxcFiwwop5X5crqM-sde1VP/view?usp=sharing