От apple16
К Samsv
Дата 19.04.2017 21:16:29
Рубрики WWII;

Там две работы

1. Первично отсканировать как есть и опубликовать
2. Построить на базе сканов базу данных с функциями коррекции

С первой справились неплохо (хотя ранние дела сканили почему-то в чб)
Со второй наоборот все плохо потому что тут нужны исследования.
Нет у ЭЛАР понимания задачи на сегоднящний день.
Они просто подняли метаданные со сканов и теперь строят какие-то на них запросы
В итоге дивизии как драного ежика по карте носит.

Качество данных это отдельное упражнение.
Рекомендаций тут куча
- форма приема заявок на коррекцию данных от неравнодушного населения
(это проще всего)
- создание справочника формирований
- создание справочника населенных пунктов с привязкой к листам карты

Надомник, который скан разбирает, не знает в какой дивизии какой полк был и без руля в этих деревнях в Воронежской области. 1944 с 1941 перепутать милое дело.

В результате конечно будет бомба
- хочу линию фронта в Мухосранском районе на 13 августа 1942 года - пожалуйста
- хочу список всех офицеров третьего батальона 190 сп за период - пожалуйста
из бытового
- хочу список всех однополчан деда
- хочу все, что вокруг поселка Х было

такого нет ни у кого пока

От Samsv
К apple16 (19.04.2017 21:16:29)
Дата 19.04.2017 22:10:03

Re: Там две...

>1. Первично отсканировать как есть и опубликовать
>2. Построить на базе сканов базу данных с функциями коррекции

Приветствую!

Но вот таких ошибок ввода, а не сканирования, когда в поле Даты рождения попадает, например, лагерный номер,
не должно быть изначально:

Дата рождения/Возраст 14.42.1902
Лагерный номер 144202

А в базах данных МО такого навалом. Это же легко лечится.

С уважением, Samsv,
http://samsv.narod.ru

От apple16
К Samsv (19.04.2017 22:10:03)
Дата 19.04.2017 22:35:14

Ошибки двух типов это правильно

Есть кривые глаза читателя сканов - им можно и нужно ловить
Часть автоматически через базу запросами
Часть просить людей с пониманием почитать (это будет всегда)

Есть ошибки в документах
(в донесениях медсанбатов сплощь и рядом левые номера полков и дивизий)
- это нужно с аргументами чинить чтобы было видно исходную версию и коррекцию