От Сибиряк Ответить на сообщение
К apple16 Ответить по почте
Дата 15.07.2021 07:36:17 Найти в дереве
Рубрики WWII; Версия для печати

Re: Список потерь

>CSV в 1251 с русским разделителем
>31 миллион записей
>дублей порядочно

Посмотрел по не слишком частой российской фамилии Юданов - всего 490 записей. После объединения записей, достаточно очевидно относящихся к одному и тому же человеку (в некоторых случаях даже несмотря на различия в написании имени, отчества, даты рождения), осталось 270 записей, их которых 23 записи после дальнейшей обработки скорее всего удастся объединить с другими. В итоге имеем не менее 247 человек, 50.4% от числа записей. Если распространить результат, полученный по этой выборке, на весь список, то в базе содержится информация о ~15.5 млн человек, из которых конечно не все погибли, т.к. нередко попадаются освобождённые из плена.


>отдельно по нодам сделал и их сортировку по ФИО

>Колонки следующие

>Номер;Фамилия;Имя;Отчество;Дата рождения;Место рождения;Место призыва;Дата призыва;Место службы;Воинское звание;Дата выбытия;История


> https://drive.google.com/file/d/1bebZJGCHqotLy7-g7afG1EndEw64_RnH/view?usp=sharing