Литмир - Электронная Библиотека
Содержание  
A
A

Источники данных

Автор данной книги является предпринимателем в области информационных технологий с многолетним опытом создания и продвижения собственных проектов (более 10 штук). Поэтому иногда в тексте вы будете встречать цифры и факты без пояснительной сноски на исследовательские статьи-источники. Эта информация была получена из личного опыта автора этой книги, что нисколько не умаляет ее значимость и даже напротив: ее стоит воспринимать как актуальное и реальное положение дел в IT-бизнесе на территории России в 2023 году.

Порядок и план изложения материала

В разных главах этой книги десятки раз будет возникать одна и та же цепочка из трех элементов: «цифровизация» – «большие данные» – «машинное обучение». Но структуру изложения правильнее назвать «спиралевидной». Потому что на каждом последующем витке обсуждения будут рассматриваться новые вопросы, тонкости и особенности всех трех составляющих. Таким образом, читатель сможет последовательно, по нарастающей вникнуть в различные аспекты и без лишнего напряжения овладеть этими темами на хорошем уровне. Главную же мысль данного руководства, которая и описывает вышеуказанную спираль, можно сформулировать так: «Машинное обучение позволяет заработать больше. Но чтобы обучить машину, нужны большие данные. А чтобы собрать большие данные, нужна единая информационная система компании и цифровизация всего трудового процесса».

В первой части книги мы поговорим о цифровизации некоторых процессов компании, а точнее разных ее отделений. Затем разберем способ объединения разрозненных систем. Все эти шаги позволят собирать и накапливать большие данные, о которых речь пойдет в середине руководства.

Если же читатель уже провел цифровизацию всех отделений своей компании, создал единую информационную систему и начал накапливать большие данные, ему стоит сразу обратить внимание на последнюю треть этой книги. Начиная с глав «Примеры успеха» и «Примеры неудач» и далее описаны разнообразные способы использования больших данных и машинного обучения. Приведенные истории взяты из совершенно разных отраслей предпринимательской деятельности: от свинофермы до аэропорта. В них обязательно найдутся идеи и для вашего бизнеса.

Почему машинное обучение стало полезным

С момента появления людей на планете и до двадцатого века нашей эры человечество накопило примерно два терабайта информации в виде печатных книг, рукописных свитков, скрижалей, изображений на стенах пещер и т. п. Но в настоящее время (2023 год) мы создаем подобный объем информации за долю секунды (более 300 экзобайт в день). При этом с каждым днем скорость накопления данных резко увеличивается. Почти 90 % всей существующей информации появилось за последние 2 года. А общее количество данных, накопленных человечеством, достигает уже 120 зетабайт[1].

Весь этот объем надо не только хранить, но и обрабатывать. А алгоритмы классической математики плохо работают в подобных масштабах. Предвосхищая текущее положение дел, еще в период между 1943 и 1965 годом у человечества начали появляться новые методы обработки данных, основанные на машинном обучении. Тогда же были сформулированы основные положения, описывающие, что собой представляют нейронные сети, глубокое обучение и искусственный интеллект в целом. Но путь от теории к практике оказался долгим и тернистым, потому что вычислительная электроника на момент появления первых идей находилась в зачаточном состоянии и была неспособна потягаться даже с современным калькулятором. В результате в области прикладных исследований возникла небольшая пауза.

Через пару десятков лет, в период между 1970 и 1989 годами произошел качественный скачок в развитии баз данных и электроники. Что позволило систематизировать и обрабатывать информацию в той форме, объемах и с такой скоростью, которые требовались для начала использования машинного обучения в промышленных масштабах.

Современный вычислительный сервер (производства 2023 года) из верхнего ценового сегмента, который стоит как автомобиль, легко займет первую строчку в рейтинге 500 самых мощных суперкомпьютеров мира 2000 года. При этом его энергопотребление в три раза ниже, чем у обычного чайника или пылесоса. Благодаря этому любая компания, даже не имеющая большого штата системных администраторов, электриков и программистов, может создавать свои модели машинного обучения, обрабатывая огромные массивы данных. Более того, энтузиасты уже умудряются использовать вычислительные мощности кофеварок, микроволновок и роботов-полотеров для непрерывного анализа информации.

Можно смело сказать, что машинное обучение плотно вошло в нашу жизнь и никуда теперь не исчезнет. С каждым годом все больше компаний будут пользоваться его плодами, обгоняя конкурентов. Поэтому читателю лучше отвергнуть все мысли о том, что это лишь временное явление и не стоит торопиться приступать к изучению новой науки. Прочитав эту книгу, каждый может выйти на достойный уровень понимания всех причин, последствий и способов применения машинного обучения и больших данных в бизнесе.

Битва за хлебные крошки

С начала века бизнес претерпел существенные изменения, вызванные третьей промышленной революцией (информатизацией), развитием каналов продаж и рекламы. При этом доходы его непрерывно падают из-за растущей конкуренции на рынке. Если раньше наценка 50 % считалась вполне привычным делом, то сейчас 3–5 % – это уже большая удача. И если получается сохранить часть пирога выручки после оплаты себестоимости, бизнес выходит на самоокупаемость. А в некоторых случаях даже становится успешным. И, как это ни парадоксально, чем крупнее компания и сложнее ее бизнес-процессы, тем точнее выражение «битва за хлебные крошки» описывает процесс увеличения выручки. Справедливости ради отметим, что у состоявшегося бизнеса доли процента от прибыли могут составлять десятки или даже сотни миллионов рублей. Поэтому, если не бороться буквально за каждую копейку себестоимости, считая ее мелочью, недостойной внимания, потери прибыли могут быть колоссальными.

Итак, сегодня битва идет за проценты прибыли, которые могут решить судьбу всей компании. Эта борьба ведется с помощью автоматизации всех рабочих процессов и за счет снижения издержек в каждом отделении. Ввиду этого набор сотрудников уже давно проводится с пристрастием. Сегодня никто не нанимает «девочку для продаж по телефону» – разумнее отдать ее зарплату программисту, который автоматизирует весь процесс и принесет компании во много раз больше пользы. Поэтому можно без преувеличения сказать, что основными солдатами в бою за повышение прибыли являются специалисты, которые, жонглируя большими данными, позволяют эффективно повышать рентабельность бизнеса за счет обработки огромных массивов информации, их анализа и внедрения следующих из этого процедур, способствующих улучшению работы компании.

Спрос на таких специалистов появляется не только из-за потребностей бизнеса, но и вследствие роста информационной грамотности населения. Для примера сравним розничную торговлю, осуществляемую через интернет-магазины в начале века и сейчас. Если раньше достаточно было продавать товары на одном собственном сайте компании, то теперь необходимо размещать их еще и на «чужих» площадках («Яндекс.Маркет», Ozon, Wildberries и т. п.), использовать агрегаторы и даже социальные сети, которые тоже стали точками продаж. Некоторые сервисы предлагают бизнесменам услуги по созданию таких автоматических выгрузок, однако они не могут удовлетворить индивидуальные запросы клиентов с помощью имеющихся функций. Ведь между компаниями царит жесткая конкуренция в погоне за увеличением процента прибыли. То есть за максимальное привлечение клиентов. Поэтому бизнесу приходится брать дело в свои руки, нанимать штатных программистов и специалистов по большим данным. Их работа с торговыми площадками и соцсетями в «ручном режиме» позволяет достичь более тонкой настройки, а также снизить издержки на доработку стандартного программного обеспечения, что в конечном итоге приводит к увеличению прибыли.

вернуться

1

F. Duarte (2023) Amount of Data Created Daily (https://explodingtopics.com/blog/data-generated-per-day).

2
{"b":"866500","o":1}