Литмир - Электронная Библиотека
Использование больших данных и прогнозного анализа

Эффективность форсайта во многом зависит от того, насколько правительство способно использовать «большие данные» и прогнозный анализ. Новейшие системы хранения данных позволяют накапливать информацию в различных форматах и во все увеличивающихся объемах. Предполагается, что с 2013 по 2020 год «цифровая вселенная» вырастет в десять раз – с 4,4 трлн до 44 трлн гигабайт. Международная консалтинговая компания International Data Corporation (IDC) предполагает, что объем хранимых данных к 2016 году вырастет до 3,77 зеттабайт[18]. Согласно IDC, сегодня только 5 % данных являются «ценными или многоцелевыми», однако эта цифра к 2020 году увеличится более чем вдвое благодаря большим данным и другим технологиям[19].

Создание данных – постоянный и повсеместный процесс. Что бы мы ни делали, будь то управление автомобилем, включение домашних приборов или использование мобильного телефона, – мы производим данные. С помощью датчиков, пронизывающих ткань нашего физического мира, и портативных устройств доступа в интернет – мы производим данные. Добавьте сюда компании, производящие и хранящие данные всех видов, фиксирующие мельчайшие детали миллиардов контактов между участниками рынка, и правительства, собирающие информацию о своих гражданах – об их здоровье, поездках, домашнем хозяйстве и финансовых делах. Такие массивы данных порождают возможности, но и создают проблемы, связанные с их организацией, хранением, поиском, анализом и отображением. Эти задачи решаются средствами больших данных.

Точное происхождение термина «большие данные» неизвестно. Многие считают, что впервые его употребил еще в 1990-х годах Джон Мэши, главный научный сотрудник компании Silicon Graphics[20]. Но какова бы ни была этимология этого термина, большие данные приобретают все большую важность и для государственного, и для частного сектора.

Большие данные – серия подходов, инструментов и методов обработки огромных объемов структурированных и неструктурированных данных, с которыми не могут эффективно справляться стандартные инструменты. Одним из способов описания больших данных является модель 3V, разработанная фирмой Gartner, ведущей исследования в области информационных технологий. Эти три V–Volume (объем), Velocity (скорость), Variety (многообразие), то есть физический объем, скорость прироста и обработки, а также диапазон типов и источников данных. В большие данные входят и те данные, которые хранятся в памяти, и те, которые создаются с использованием других данных.

Большие данные не только порождают проблемы, но и создают беспрецедентные возможности и для государственного, и для частного сектора. Наряду с новейшими, передовыми инструментами управления базами данных и методами прогнозного анализа, большие данные открывают доступ к ценной информации о множественных взаимосвязях, закономерностях и воздействиях.

Конец ознакомительного фрагмента.

Текст предоставлен ООО «ЛитРес».

Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес.

Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.

вернуться

18

www.computerworld.com/slideshow/detail/143723

вернуться

19

www.emc.com/leadership/digital-universe/2014iview/executive-summary.htm

вернуться

20

www.bits.blogs.nytimes.com/2013/02/01/the-origins-of-big-data-anetymo-logical-detective-story/?_r=0

6
{"b":"571987","o":1}