От Дмитрий Козырев Ответить на сообщение
К Dargot Ответить по почте
Дата 16.10.2013 18:04:13 Найти в дереве
Рубрики Суворов (В.Резун); Локальные конфликты; 1917-1939; Версия для печати

Re: Это деспотия

>>Напротив объем задач корпораций требует высокой их автоматизации.
> Функций по контролю, я имею в виду.

и функций по контролю - тоже.

>>У тебя какое то ограниченное воображение зачем нужно распознавание лиц. Я совершено о другом - я ровно о том, что даже небольшие объемы анализа уже существующие показывают технологическую предельность доступных ресурсов - а их требуется увеличивать не просто на порядки, а на многие порядки.
> "Объем анализа" чего?

Информации, собранной от детекторов.

>А то, извини, можно из того, что поиск оптимального решения задачи коммивояжера для жалких 50 городов - задача неподъемная, сделать вывод, что вообще все методы оптимизации - фу и бесполезны. Однако, это будет неправильно.

Я не понял к чему этот аргумент. У этой задачи минимальный набор входных данных. Хдесь весь вопрос только в ее алгоритмизации.

>>>Эффект масштаба он и в обратном направлении работает - Интернет - нечто качественно большее, чем "соединенные друг с другом компьютеры".
>>не понял существо этого аргумента.
>
> Это к возражениям в стиле: "А я спрячусь от камеры", "Иногда камеры бьют", "Телефон не всегда работает" и пр.

В упрощенном виде это действительно так. Естественое поведение людей - примеры которого приводятся препятсвует их достоверной верификации или (в соответсвии с твоими преждложениями) создает сврехпоток "инцидентов", по которым требуется принятие решения человеком.

>>ты опять не о том. В этом пункте я говорю о том, что прежде чем перейти к анализу - нужно обеспечить сбор и систематизацию (пригодность и доступность для анализа) хреналионного объема сырых данных.
>>Ты знаешь сколько занимает запись видео на единицу времени? в разрешении чтобы надежно распознавалось лицо (ну или фигура), чтобы не было пропусков за счет сокращения числа кадров?
> Как раз количество кадров не так важно, мы же не кино показываем. Достаточно нескольких в секунду максимум.

ага, сразу видно, что с видео с камер наблюдения ты не работал и с ситуациями "в этом кадре половина фигуры входит, а в следующем половина фигуры выходит" ты не сталкивался.

> Оценим так. Пусть 1 камера генерирует в сутки 1 гигабайт видео (с учетом малой частоты кадров).

я даже тебя обрадую - в 2-3 раза меньше.

>> А перемножить это на число камер работающих в режиме 24х7? А выстроит на все это дело индексы?
> Количество камер в Великобритании оценивается в 4-6 миллионов. Пусть 5 миллионов.
> Все камеры всей Великобритании генерируют 5 петабайт в сутки. Это много, да. 2.5 Рутрекера в день, 0.2 дневного потока данных через сервера гугла.

Это не "поток"! Его нужно не "пропустить", а записать, проиндексировать, закешировать! О чем и речь - нужен гугл на среднее административное образование (и это только по видео!) - хотя ты сам говоришь что камер надо больше, в разы если не на порядок.

> Однако:
>1) В первом приближении сырое видео можно хранить только на локальных серверах какое-то время (как оно сейчас, собственно, и делается). А "наверх" для анализа отсылать только уже обработанные и почищенные данные - лица людей, номера машин.

>2) Конкретно для сжатия видео камер наблюдения, которые большую часть времени показывают одно и то же, могут и должны использоваться специфические алгоритмы сжатия.

детекторы движения там используются - запись по факту изменения картинки, но это вырожденный случай - тебя же интересует тотальный контроль перемещений - значит в режиме 24х7 надо писать городские площади, переходы метро, с разных ракурсов чтобы видеть лица.
Кстати а в дождь оно работает? когда люди идут под зонтами :)))

>3) Ты сам сказал - экспонента.

ты сам сказал "удваивается каждый год", я принял на веру.

>>... работает на множестве десятков-сотен объектов.
> В день под камерами казино проходит отнюдь не сотня людей.

не думаю чт одаже крупные казино имеют больше сотЕН посетителей в день.
И потом тут то задача другая им надо сопоставить паттерну подозрительного со всеми входящими.
Явное несовпадение - отбрасывается, на сходство - сигнал охране. простейший алгортм.
В твоем случае надо _верифицировать_ _каждого_ попавшего в объектив. Т.е. записать лицо, запросить "ценральную базу данны" и решить задачу распознавание образов _над ВСЕЙ_ базой.

>>> Да, что немаловажно, реальность, данная нам в ощущениях, такова, что значительную долю информации, попадание которой в третьи руки может поставить под угрозу личную жизнь пользователей, контролируется негосударственными организациями - Майкрософт, Эппл, Гугл...
>>это не значительная доля информации.
> Значительная-значительная. Электронная переписка, разговоры по скайпу, контакты в социальных сетях.

Это не значительная доля информации. Хотя да, позволяет таргетировать рекламу.

> Еще раз, на пальцах. В отличие от принципиально нечетких и неформализуемых критериев, применяемых сейчас, для некоего паттерна поведения мы можем точно сказать, с какой надежностью следование ему характеризует пациента как нежелательный элемент. 1%, 30%, 90%... Последних не надо проверять, надо сразу арестовывать.

Если человек настолько глуп что своей сетевой деятельностью набрал себе на состав по УК то он сам себе злобный буратино.
Я же говорю как раз о тех случаях которые "требуют дополнительной проверки".

> Я предлагаю собирать эту статистику в автоматическом режиме и сразу с определением доверительной вероятности.

ее и сейчас можно собрать.
Ты говоришь на мой взгляд о другом.
Для попадания в аналитику органов - нужно сначала привлечь к себе внимание этих органов каким то явным криминалом "встать на учет".
ты же сейчас говоришь об обратном - о том что "тотальный контроль" позволит "ставить на учет" в автоматическом режиме - иначе все эти меры лишены смысла при неэпических затратах.