Настоящую книгу как «углублённое научно-популярное» произведение отличают три особенности. Во-первых, это активное стремление к балансу между теорией и историями. Мы попытались посредством реальных кейсов и подлинных историй продемонстрировать широкому читателю те огромные изменения, которые большие данные в Китае привнесли в самые разные отрасли, в надежде тем самым расширить его кругозор и побудить к размышлениям. Однако кейсы и истории неотделимы от научных достижений и теоретических рамок китайской и зарубежной науки о данных, от компьютерной науки, теории управления информацией и государственного управления.
Во-вторых, это активное стремление к балансу между технической и гуманитарной сторонами. Несмотря на то, что фокус нашей книги сосредоточен на рассказе о научно-технических достижениях, мы считаем, что развитие науки и техники должно освобожать, а не связывать человечество. Исследуя технические возможности, мы не должны забывать о тепле человеческой цивилизации, нам следует призывать к уменьшению разрыва в данных, сохранению их конфиденциальности и противостоять связанным с ними предрассудкам. В центре развития больших данных должен быть человек, важно сохранять его права и авторитет, стимулировать его всестороннее развитие, удовлетворять его устремления к лучшей жизни, а не двигаться в противоположном направлении.
И наконец, это активное стремление к балансу между популяризацией, продвижением и переосмыслением. Несмотря на то что развитие больших данных в Китае переживает стремительный подъём и показывает блестящие успехи, мы всегда должны сохранять ясную голову и ни в коем случае не успокаиваться на достигнутом. Между реальным положением и идеалом всё ещё существует разрыв, и в текущем положении есть как достоинства, так и недостатки. На протяжении всей книги мы рассказываем о примерах успешного применения больших данных, но при этом рефлексируем и в отношении недостатков, проясняем возможные проблемы. Стимулирующая роль развития науки и техники для прогресса общества – это не бег на короткую дистанцию, но марафон. И чтобы ожидать устойчивости и долгосрочности, хватаясь за возможности и принимая вызовы, будем помнить, что следует заранее принимать меры предосторожности.
Надеемся, что уважаемый читатель получит наглядное и глубокое представление о тех огромных изменениях, которые произошли в Китае благодаря большим данным, будет всесторонне подготовлен к возможностям и вызовам, которые принесут нам большие данные в будущем, сможет поразмышлять о том, как должны изменяться и эволюционировать отношения между наукой и техникой, с одной стороны, и человеком – с другой.
Мы хотели бы в первую очередь поблагодарить коллектив авторов за тяжёлый труд, который они вели в течение полугода, поблагодарить главного редактора серии «Технологии меняют Китай» Академика Ни Гуаннаня за его внимательное наставничество. Без вас книга не состоялась бы.
Авторы книги живут в разных местах: Гуанчжоу, Шанхае, Сянтане, Наньнине. По причине удалённости мест проживания на этапе создания рукописи еженедельно проводились конференции в WeChat, на которых авторы обменивались своими достижениями, обсуждали спорные вопросы, делились мнениями. Членам авторского коллектива зачастую доводилось править и шлифовать текст сверхурочно, по ночам, в выходные и праздники. Все члены команды прилагали максимум усилий во время подготовки текста, тщательно его дорабатывали.
В настоящей книге одиннадцать глав. Первая и шестая главы написаны Ту Цзыпэем, вторая глава написана Ван Сяном (докторант Фуданьского университета), третья глава – Чжу Сяотин (Фуданьский университет), четвёртая глава – Вэнь Цзюйцином (Фуданьский университет), пятая глава – Ту Сыцзин (Университет китайской традиционной медицины Гуанси-Чжуанского автономного района), седьмая – Доктором наук Е Цзюньцзе (компания «Шу вэньмин кэчжи»), восьмая – Чжу Сяотин и Ту Сыцзин, девятая – Ду Вэйси и Ли Нанем (компания «Шу вэньмин кэчжи»), десятая – Чжан Бинцзянем и Ши Даи (компания «Шу вэньмин кэчжи»), одиннадцатая – Ван Сяном и Чжэн Лэем. Общая рукопись всей книги была подготовлена Ту Цзыпэем и Чжэн Лэем.
Выражаем благодарность компании «Шу вэньмин кэчжи», а также сотрудникам и коллегам лаборатории цифрового и мобильного управления Фуданьского университета и коллегам из профессиональной сферы за их поддержку в создании настоящей книги. Ли Нань содействовал редактуре и подготовке текста к печати, контролировал план-график проекта; Дэн Чжисинь внёс ценные замечания касательно редактуры некоторых глав. Огромную поддержку для проведения опроса в процессе создания книги оказал председатель правления компании «Чжухай исыцзя» Ван Дэю. Также особо благодарим Ван Вэя, Хэ Жуйцзюня и других редакторов издательства «Жэньминь Юдянь чубаньшэ» за высказанные ими конструктивные предложения при подготовке рукописи. Они проделали предельно кропотливую работу, для того чтобы эта книга увидела свет.
Мы также благодарны за предоставленную нам честь и возложенную на нас ответственность внести данной книгой свой вклад в чествование семидесятой годовщины со дня основания Китайской Народной Республики. Мы прекрасно понимаем, что данная книга даёт лишь небольшое, промежуточное, представление о развитии больших данных в Китае. Наши знания и способности, безусловно, ограничены, истории и теоретические положения, представленные в книге, едва ли являются полными, поэтому мы с радостью примем замечания и поправки от уважаемых читателей.
ГЛАВА 1. ПРОШЛОЕ И НАСТОЯЩЕЕ БОЛЬШИХ ДАННЫХ
В эпоху интернет-экономики данные являются новым производственным фактором, основополагающим и имеющим стратегический характер ресурсом и важной производительной силой.
Научное суждение, сделанное Председателем Си Цзиньпином во время второй коллективной учебной сессии Политбюро ЦК КПК
1.1. Правильное понимание больших данных: в реальном мире чисел не существует
1
[2]
В традиционном понимании «численные данные» – это «обоснованные числа». Числа появились потому, что человек в своей практической деятельности обнаружил: описание существующей реальности с помощью только устного и письменного языка и изображений не является точным и средств этих недостаточно. Так, если на вопрос: «Насколько Яо Мин высокий?» – ответить: «Очень высокий», «Необыкновенно высокий» или «Самый высокий», – спрашивающий о росте баскетболиста сможет составить лишь абстрактное представление, ведь каждый по-разному понимает «очень», да и понятия «необыкновенно» и «самый» тоже являются относительными. При этом ответ «2,26 метра» ни малейшей неопределённости не оставит. Числа не только описывают реальность, но и являются важным инструментом её изменения. Можно сказать, что вся производственная и обменная деятельность человека базируется на численных данных: именно они лежат в основе системы измерения и денежной системы, изобретение и возникновение которых в значительной мере содействовало прогрессу человеческой цивилизации.
Как показано на рисунке 1.1, выделяют такие источники численных данных, как измерение, регистрация и вычисление. Первоначально численные данные получают в ходе измерений, и так называемые «обоснованные числа» – это регистрация результатов измерений объективной реальности, а не что-то произвольным образом возникшее. С древности и до наших дней измерение является ведущим методом научного исследования. Без измерений не было бы науки; можно также сказать, что сущностью науки в целом являются измерения. В этом отношении значение численных Три основные источника численных данных Измерение Регистрация Вычисление данных для науки сопоставимо со значением языка для литературы, нот для музыки, формы и цвета для изобразительного искусства, – в отрыве от численных данных наука невозможна.