От Dargot Ответить на сообщение
К Дмитрий Козырев Ответить по почте
Дата 16.10.2013 17:35:22 Найти в дереве
Рубрики Суворов (В.Резун); Локальные конфликты; 1917-1939; Версия для печати

Re: Это деспотия

Приветствую!

>Фрилансер? :)
Отнюдь.

>Напротив объем задач корпораций требует высокой их автоматизации.
Функций по контролю, я имею в виду.

>>И два - внедрение многих новшеств, типа того же распознавания лиц, в масштабах корпорации не имеет смысла - проще осуществить пропуск работников по карточкам.
>
>У тебя какое то ограниченное воображение зачем нужно распознавание лиц. Я совершено о другом - я ровно о том, что даже небольшие объемы анализа уже существующие показывают технологическую предельность доступных ресурсов - а их требуется увеличивать не просто на порядки, а на многие порядки.
"Объем анализа" чего? А то, извини, можно из того, что поиск оптимального решения задачи коммивояжера для жалких 50 городов - задача неподъемная, сделать вывод, что вообще все методы оптимизации - фу и бесполезны. Однако, это будет неправильно.

>>Эффект масштаба он и в обратном направлении работает - Интернет - нечто качественно большее, чем "соединенные друг с другом компьютеры".
>не понял существо этого аргумента.

Это к возражениям в стиле: "А я спрячусь от камеры", "Иногда камеры бьют", "Телефон не всегда работает" и пр.

>> Распознавание всех лиц на всех камерах наблюдения даст качественно новые возможности по сравнению с распознаванием лиц на одной камере - например, выстраивание харакетрных маршрутов движения граждан и их статистический анализ.
>
>ты опять не о том. В этом пункте я говорю о том, что прежде чем перейти к анализу - нужно обеспечить сбор и систематизацию (пригодность и доступность для анализа) хреналионного объема сырых данных.
>Ты знаешь сколько занимает запись видео на единицу времени? в разрешении чтобы надежно распознавалось лицо (ну или фигура), чтобы не было пропусков за счет сокращения числа кадров?
Как раз количество кадров не так важно, мы же не кино показываем. Достаточно нескольких в секунду максимум.
Оценим так. Пусть 1 камера генерирует в сутки 1 гигабайт видео (с учетом малой частоты кадров).

> А перемножить это на число камер работающих в режиме 24х7? А выстроит на все это дело индексы?
Количество камер в Великобритании оценивается в 4-6 миллионов. Пусть 5 миллионов.
Все камеры всей Великобритании генерируют 5 петабайт в сутки. Это много, да. 2.5 Рутрекера в день, 0.2 дневного потока данных через сервера гугла.

Однако:
1) В первом приближении сырое видео можно хранить только на локальных серверах какое-то время (как оно сейчас, собственно, и делается). А "наверх" для анализа отсылать только уже обработанные и почищенные данные - лица людей, номера машин.

2) Конкретно для сжатия видео камер наблюдения, которые большую часть времени показывают одно и то же, могут и должны использоваться специфические алгоритмы сжатия. 24 часа видео камеры - это не 12 художественных фильмов.

3) Ты сам сказал - экспонента.

>>>2. Технологии. Они еще и близко не подошли к он-лайн распознаванию речи и видео. Да "теоретически это так" и существуют демонстраторы технологий. Практически это требует тонких индивидуальных настроек и работает на множестве десятков-сотен объектов.
>> Именно, что уже подошли близко. Системы распознавания лиц в толпе уже опробованы на тестовых случаях и готовятся к сугубо утилитарному использованию - например, для выщемления нежелательных посетителей в казино - и, по всей вероятности, будут внедрены в ближайшие годы.
>
>... работает на множестве десятков-сотен объектов.
В день под камерами казино проходит отнюдь не сотня людей.

>> Да, что немаловажно, реальность, данная нам в ощущениях, такова, что значительную долю информации, попадание которой в третьи руки может поставить под угрозу личную жизнь пользователей, контролируется негосударственными организациями - Майкрософт, Эппл, Гугл...
>это не значительная доля информации.
Значительная-значительная. Электронная переписка, разговоры по скайпу, контакты в социальных сетях.

>> То, что информация сразу представлена в цифровой форме дает возможность ее статистического анализа.
>
>Ты опять не понял. Ну дает и что? Что делать с результатом этого анализа?

>>Не "Ходит на Кавказ.орг, ездит в Египте и смотрел на ЮТубе инструкцию по изготовлению аммонала" - подозрителен! Проверить!",
>Ну да 10 тыс "подозрительных событий" ежедневно на 100 проверяльщиков работающих по 8 часов...
Я специально отмел этот пример как плохой - а ты мне его и приводишь. Это специально или по невнимательности?
Еще раз, на пальцах. В отличие от принципиально нечетких и неформализуемых критериев, применяемых сейчас, для некоего паттерна поведения мы можем точно сказать, с какой надежностью следование ему характеризует пациента как нежелательный элемент. 1%, 30%, 90%... Последних не надо проверять, надо сразу арестовывать.
Знаешь, это как сейчас в США маньяков ловят. Все вот эти: "Преступник, скорее всего, белый мужчина, безработный или на частичном заработке, ездит на большой черной машине и т.д. и т.п.". Немалая часть этих ориентировок - не умозаключения психологов, а банальная статистика, собранная вручную из накопившейся за десятки лет базы преступников. Начинались эти изыскания еще в докомпьютерные времена.
Я предлагаю собирать эту статистику в автоматическом режиме и сразу с определением доверительной вероятности.

С уважением, Dargot.