
09.04.2017, 14:38
|
|
Постоянный
Регистрация: 30.08.2011
Сообщений: 358
С нами:
7738166
Репутация:
11
|
|
- Как вариант - в SQL базе данных сделать таблицу (t1) из двух столбцов - исходный большой словарь, и он же, но с обрезанными цифрами в начале и конце. И вторую таблицу (t2) - маленький словарь фамилий. Далее sql запросом найти разность м.у. вторым столбцом t1 и соотв. t2 (вроде можно так?) Плюс такого решения - не используется программирование.
- Второй вариант - запомнить словарь фамилий (на самом деле не сами слова, а хеши, но не важно), далее - считывать каждое слово из большого словаря, откусывать цифры в начале и конце и искать это обрезанное слово в маленьком словаре. Если не нашлось, то распечатать.
С кодом я бы мог помочь, если бы не юникодные символы (1петров1).
- Возможно коллеги предложат более оптимальные варианты.
UPD:
- Еще вариант: Вы, когда будете применять ваш словарь фамилий, будете прикручивать к каждому слову цифры. Сделайте по этому алгоритму словарь - фамилии с цифрами, а далее - то, что вы уже делали при помощи comm (разность словарей, большого и 'фамилии с цифрами').
|
|
|