>>Напротив объем задач корпораций требует высокой их автоматизации.
> Функций по контролю, я имею в виду.
и функций по контролю - тоже.
>>У тебя какое то ограниченное воображение зачем нужно распознавание лиц. Я совершено о другом - я ровно о том, что даже небольшие объемы анализа уже существующие показывают технологическую предельность доступных ресурсов - а их требуется увеличивать не просто на порядки, а на многие порядки.
> "Объем анализа" чего?
Информации, собранной от детекторов.
>А то, извини, можно из того, что поиск оптимального решения задачи коммивояжера для жалких 50 городов - задача неподъемная, сделать вывод, что вообще все методы оптимизации - фу и бесполезны. Однако, это будет неправильно.
Я не понял к чему этот аргумент. У этой задачи минимальный набор входных данных. Хдесь весь вопрос только в ее алгоритмизации.
>>>Эффект масштаба он и в обратном направлении работает - Интернет - нечто качественно большее, чем "соединенные друг с другом компьютеры".
>>не понял существо этого аргумента.
>
> Это к возражениям в стиле: "А я спрячусь от камеры", "Иногда камеры бьют", "Телефон не всегда работает" и пр.
В упрощенном виде это действительно так. Естественое поведение людей - примеры которого приводятся препятсвует их достоверной верификации или (в соответсвии с твоими преждложениями) создает сврехпоток "инцидентов", по которым требуется принятие решения человеком.
>>ты опять не о том. В этом пункте я говорю о том, что прежде чем перейти к анализу - нужно обеспечить сбор и систематизацию (пригодность и доступность для анализа) хреналионного объема сырых данных.
>>Ты знаешь сколько занимает запись видео на единицу времени? в разрешении чтобы надежно распознавалось лицо (ну или фигура), чтобы не было пропусков за счет сокращения числа кадров?
> Как раз количество кадров не так важно, мы же не кино показываем. Достаточно нескольких в секунду максимум.
ага, сразу видно, что с видео с камер наблюдения ты не работал и с ситуациями "в этом кадре половина фигуры входит, а в следующем половина фигуры выходит" ты не сталкивался.
> Оценим так. Пусть 1 камера генерирует в сутки 1 гигабайт видео (с учетом малой частоты кадров).
я даже тебя обрадую - в 2-3 раза меньше.
>> А перемножить это на число камер работающих в режиме 24х7? А выстроит на все это дело индексы?
> Количество камер в Великобритании оценивается в 4-6 миллионов. Пусть 5 миллионов.
> Все камеры всей Великобритании генерируют 5 петабайт в сутки. Это много, да. 2.5 Рутрекера в день, 0.2 дневного потока данных через сервера гугла.
Это не "поток"! Его нужно не "пропустить", а записать, проиндексировать, закешировать! О чем и речь - нужен гугл на среднее административное образование (и это только по видео!) - хотя ты сам говоришь что камер надо больше, в разы если не на порядок.
> Однако:
>1) В первом приближении сырое видео можно хранить только на локальных серверах какое-то время (как оно сейчас, собственно, и делается). А "наверх" для анализа отсылать только уже обработанные и почищенные данные - лица людей, номера машин.
>2) Конкретно для сжатия видео камер наблюдения, которые большую часть времени показывают одно и то же, могут и должны использоваться специфические алгоритмы сжатия.
детекторы движения там используются - запись по факту изменения картинки, но это вырожденный случай - тебя же интересует тотальный контроль перемещений - значит в режиме 24х7 надо писать городские площади, переходы метро, с разных ракурсов чтобы видеть лица.
Кстати а в дождь оно работает? когда люди идут под зонтами :)))
>3) Ты сам сказал - экспонента.
ты сам сказал "удваивается каждый год", я принял на веру.
>>... работает на множестве десятков-сотен объектов.
> В день под камерами казино проходит отнюдь не сотня людей.
не думаю чт одаже крупные казино имеют больше сотЕН посетителей в день.
И потом тут то задача другая им надо сопоставить паттерну подозрительного со всеми входящими.
Явное несовпадение - отбрасывается, на сходство - сигнал охране. простейший алгортм.
В твоем случае надо _верифицировать_ _каждого_ попавшего в объектив. Т.е. записать лицо, запросить "ценральную базу данны" и решить задачу распознавание образов _над ВСЕЙ_ базой.
>>> Да, что немаловажно, реальность, данная нам в ощущениях, такова, что значительную долю информации, попадание которой в третьи руки может поставить под угрозу личную жизнь пользователей, контролируется негосударственными организациями - Майкрософт, Эппл, Гугл...
>>это не значительная доля информации.
> Значительная-значительная. Электронная переписка, разговоры по скайпу, контакты в социальных сетях.
Это не значительная доля информации. Хотя да, позволяет таргетировать рекламу.
> Еще раз, на пальцах. В отличие от принципиально нечетких и неформализуемых критериев, применяемых сейчас, для некоего паттерна поведения мы можем точно сказать, с какой надежностью следование ему характеризует пациента как нежелательный элемент. 1%, 30%, 90%... Последних не надо проверять, надо сразу арестовывать.
Если человек настолько глуп что своей сетевой деятельностью набрал себе на состав по УК то он сам себе злобный буратино.
Я же говорю как раз о тех случаях которые "требуют дополнительной проверки".
> Я предлагаю собирать эту статистику в автоматическом режиме и сразу с определением доверительной вероятности.
ее и сейчас можно собрать.
Ты говоришь на мой взгляд о другом.
Для попадания в аналитику органов - нужно сначала привлечь к себе внимание этих органов каким то явным криминалом "встать на учет".
ты же сейчас говоришь об обратном - о том что "тотальный контроль" позволит "ставить на учет" в автоматическом режиме - иначе все эти меры лишены смысла при неэпических затратах.