|
От
|
Сибиряк
|
|
К
|
apple16
|
|
Дата
|
15.07.2021 07:36:17
|
|
Рубрики
|
WWII;
|
|
Re: Список потерь
>CSV в 1251 с русским разделителем
>31 миллион записей
>дублей порядочно
Посмотрел по не слишком частой российской фамилии Юданов - всего 490 записей. После объединения записей, достаточно очевидно относящихся к одному и тому же человеку (в некоторых случаях даже несмотря на различия в написании имени, отчества, даты рождения), осталось 270 записей, их которых 23 записи после дальнейшей обработки скорее всего удастся объединить с другими. В итоге имеем не менее 247 человек, 50.4% от числа записей. Если распространить результат, полученный по этой выборке, на весь список, то в базе содержится информация о ~15.5 млн человек, из которых конечно не все погибли, т.к. нередко попадаются освобождённые из плена.
>отдельно по нодам сделал и их сортировку по ФИО
>Колонки следующие
>Номер;Фамилия;Имя;Отчество;Дата рождения;Место рождения;Место призыва;Дата призыва;Место службы;Воинское звание;Дата выбытия;История
> https://drive.google.com/file/d/1bebZJGCHqotLy7-g7afG1EndEw64_RnH/view?usp=sharing