Литмир - Электронная Библиотека
A
A

Вот, к примеру, вы увидели в лесу зелёного ёжика и решили выяснить, что это за чудо такое. Первым слоем вам вывалится несколько тысяч предложений что-то купить – по большей части (но не обязательно) зелёное, и, возможно, местами как-то связанное с ёжиками. Кактусы, например.

Зелёные ёжики – 26 предложений на Маркете

market.yandex.ru › зелёные ёжики

10 магазинов. Выбор по параметрам. Доставка

Допустим, вы упорны и умелы в работе с поисковиками. Тогда вы при помощи встроенных фильтров (процентов 80 пользователей даже не знают, что они есть) отсечёте прямые предложения купить и провалитесь в слой сайтов, оптимизированных в выдаче по запросу «нечто зелёное» и «какие-нибудь ёжики». Рассуждения на тему «как ёжики ебутся» и «зелёные колючие анальные пробки» поглотят вас. Средний гуглопользователь на этом этапе утонет в мусорной выдаче, отчается, плюнет и вернётся на первый слой покупать кактус, но упорный и изобретательный непременно найдёт, как ему кажется, искомое: «настоящая правда о зелёных ёжиках», «всё, что вы хотели знать, о зелёных ёжиках, но боялись спросить», «как_найти_зелёного_ёжика.doc» и так далее. К радости неофита, это будут ссылки на малые тематические форумы, где уж точно настоящие живые люди и общение по теме, но… Буквально через пару страниц нейтрального трёпа он встретит нечто вроде такого диалога:

– Ребята, киньте реальную инфу о зелёных ёжиках!

– Лови ссылку!

– А там просят отправить смс, ничо?

– Не, нормально, отправляй, не ссы!

Разумеется, если отправить смс, то окажется, что вы подписаны на услугу «гей-порно-смс-онлайн», за которую у вас с баланса ушли все деньги за пять минут. Но это не так важно, как тот факт, что, если искать не зелёных ёжиков, а, к примеру, красных пыжиков, то через некоторое количество потраченного времени и трафика, человек оказывается на точно таком же, до запятой, форуме, но только про красных пыжиков. На самом деле, система в реальном времени генерирует их по шаблону прямо под запрос. Зачем? Ну, отчасти ради платных смс, но это только первый слой смыслов. На самом деле всё и сложнее, и проще одновременно, но об этом в другой раз как-нибудь. Если вы обычный пользователь, который ищет в интернете новости, анекдоты, рецепты, сиськи, котиков и секса без обязательств – вас это не касается вообще никак. Первый слой выдачи заточен под вас идеально, дальше и искать незачем.

В общем, человек, умеющий поймать в этой каше настоящего зелёного ёжика, а не наловить полную жопу кактусов, оказывается в какой-то момент весьма востребованным, причём, как бы это ни было смешно, как правило, теми же людьми, которые и выстроили всю эту систему многослойного зашумления информационного пространства. Если змея достаточно длинная и извилистая, она в какой-то момент неизбежно кусает свой хвост.

За несколько лет работы я вырос от рядового мониторщика-крафтера, который готовит сырые выборки по всяким запросам, до умеренно почтенного аналитика среднего звена, которому позволено объединять данные в кейсы и делать из них выводы. «Квалитатив ресёрч» на нашем волапюке.

Мне помог хороший письменный английский, не совсем выпавший из головы институтский курс статматематики, а также некоторые базовые навыки программирования, позволяющие строить собственные программные инструменты там, где не находится готовых. Поэтому я был отчасти допущен к таинственной бездне под названием «бигдата», которая может всё, но никто пока толком не понимает, что именно. Вдаваться в утомительные технические подробности не буду, скажу главное – все наши электронные следы на сегодняшний день заботливо собраны, рассортированы, учтены и проанализированы. Их гораздо больше, чем кажется среднестатистическому обывателю, это гигантские объёмы данных, но современные распределённые сети это прекрасно переваривают и добавки просят. Каждая оплата карточкой, каждая покупка через интернет, каждая регистрация телефона на новой соте, каждый билет на поезд, самолёт и автобус, каждый поисковый запрос, каждый твит и каждый чекин. Смартфон – окно в вашу прайвеси, смартфон с дефолтными настройками – широко распахнутая дверь, айфон – ворота, в которые грузовик проедет. Это, конечно, в первую голову рекламный таргетинг – стоит вашей жене купить в аптеке тест, а потом витамины для беременных – и реклама колясок удивительным образом возникнет в вашей ленте в «Фейсбуке». Но рекламой бигдата, разумеется, не ограничивается, она побочный приварок к главным задачам – немного самоокупаемости ещё никому не мешало.

Я не знаю всех применений бигдаты – подозреваю, их не знает никто. Но есть одна функция, которая ей, несомненно, присуща – автоматическое и моментальное выявление любых поведенческих аномалий. Потому все любители конспирологии, прячущиеся от Большого Брата путём использования анонимных мэйл-сервисов, стойкого шифрования и сетей Tor, общающиеся исключительно в даркнете через ретрошару и молящиеся на биткоин, на самом деле просто вешают на себя огромный плакат: «Эй, посмотрите, со мной что-то не так!!!» И, натурально, смотрят. Нет, никто не взламывает их защищённые емейлы, не читает их самостирающиеся торчаты и не расшифровывает их криптостойких посланий. Зачем? Это хлопотно, затратно, а главное – не нужно. Не нужно перехватывать распределённый питупи-трафик Тора, достаточно уверенно опознавать сигнатуру его использования, чтобы где-то зажглась первая красная лампочка – эй, этот парень пользуется Тором! А ну-ка давайте посмотрим – он просто торренты с порнухой ищет, или, к примеру, рецепт гексогена? Опять же, для этого не нужно ничего криптостойкого ломать, и никакие суперхакеры кэйджиби с красными глазами под фуражкой не встанут на ваш виртуальный след. Просто внимание системы к вашим поисковым запросам будет чуть повышено, и, если, например, вы недавно интересовались у гугля, как сделать электронный таймер из будильника – где-то зажжётся вторая лампочка, чуть ярче первой. А если вы вскоре заказали с алиэкспресса копеечный электронный модуль, на котором есть красный и синий провод и бегущие к нулю циферки, то после лампочки может пискнуть первый зуммер. А если среди ваших подписок во «ВКонтактике» окажутся при этом некие совершенно безобидные на первый взгляд сообщества любителей арабского языка или поговорить за ислам, то вы вполне можете заслужить первое персональное повышение статуса – вас переведут на контроль. Пока не персональный, просто вы попадёте в раздел базы данных «на общем мониторинге». Теперь на ваши лампочки и зуммеры будут реагировать уже не только эвристические алгоритмы распределённых вычислительных сетей, но и некий неравнодушный умный человек, который умеет сделать вывод о существовании океана по капле воды. Следующую стадию – персональный мониторинг, – надо заслужить, но, если вам это удалось, то, скорее всего, дело рано или поздно кончится совершено невиртуальным визитом серьёзно настроенных людей, которым, опять же, и в голову не придёт взламывать шифрование ваших труекрипт-дисков. Зачем? Вы сами всё расшифруете, покажете и расскажете. Даже не сомневайтесь в этом.

«Ха-ха, ну мне-то это не грозит, – подумает наивный пользователь, прочитавший этот абзац. – Я-то не дурак искать в гугле рецепт динамита и схемы минирования мостов!» Отчасти он будет прав – но только отчасти. Даже если вы перестали покупать в ближнем магазине пиво и стали покупать водку – на это уже сработает какой-то триггер. Ваше потребительское поведение изменилось. Почему? Может, вы становитесь алкоголиком, и вас следует внести в группы повышенного контроля по этому параметру? Скорее всего, ничего не произойдёт. Но не исключено, что вы нарвётесь на неожиданно жёсткую проверку при попытке получить оружейную лицензию, кто знает? Я не знаю, кстати, это не моя область компетенции.

На самом деле никто не знает, как формируются триггеры, потому что задаёт их, как ни странно, тоже машина. Как? Ну вот знаем мы, к примеру, что этот мутный поц относится к исламским террористам. Или, наоборот, к буддийским похуистам, неважно. Машина считывает всё, что по нему есть, и сравнивает с такими же террористами/похуистами и с контрольной группой. Совпадения суммируются, расхождения учитываются, и выводится какой-то общий по группе набор ключевых определяющих паттернов. Какой, из чего он состоит – опухнешь вникать, это может быть тысяча триггеров или больше. Жизни человеческой не хватит проверить всё, поэтому в то, что работает, – не лезут. Система умеет самокорректироваться, так что ошибки бывают редко. С одной стороны, немного странно, что фактически людей контролирует машина, да ещё и по созданному ею же алгоритму – отдаёт какой-то дурной фантастикой про порабощение человечества тостерами. А с другой – в этом вся бигдата. Она принципиально оперирует слишком большими объёмами данных, чтобы человек мог контролировать процессы в деталях.

8
{"b":"720932","o":1}