Литмир - Электронная Библиотека
A
A
Теория и практика общественно-научной информации. Выпуск 22 - b00000315.jpg

Рис. 1. Сетевое взаимодействие подсистем РИС

Практическая реализация сервисов SRW/SRU даст существенно новое качество информационной системы – возможность включения ее ресурсов в глобальные поисковые системы на более высоком уровне, нежели уровень внешней индексации статических веб-страниц другими системами. Иные возможные типы поиска связаны с поиском по заданным шаблонам и поиском с привлечением онтологии. Последний является более интеллектуальным типом поиска. Для его реализации требуется дополнительная информация о предметной области, включающая определения терминов, сущностей и связей. Следует отметить, что представление этой дополнительной информации должно соответствовать глобальным договоренностям и международным стандартам. Иначе поиск с привлечением словарей, тезаурусов и онтологии всегда будет ограничен текущей системой, а интероперабельность не будет реализована.

В настоящее время существуют достаточно мощные информационные системы, в той или иной степени удовлетворяющие потребности научных работников в информации. Однако основной недостаток большинства систем – ограниченность возможностей обеспечения интеграции ресурсов как внутри каждой из систем, так и вовне. Отметим, что основу разработки ИС составляют, прежде всего, стандарты и международные рекомендации, формирующие профиль ИС. Под ним понимается набор из одного или нескольких базовых нормативно-технических документов (стандартов и спецификаций), ориентированных на решение определенной задачи (реализацию заданной функции либо группы функций приложения или среды) с указанием при необходимости выбранных классов, подмножеств, опций базовых стандартов, требуемых для выполнения конкретной функции. Наиболее важным являются профили метаданных циркулирующей в системе информации. Выбор профиля должен основываться на выполнении следующих требований:

• включать в себя основные типы информации, требующейся для поддержки научной работы;

• быть открытыми, т.е. обеспечивать доступ к соответствующей информации по этим описаниям;

• быть расширяемыми, т.е. обеспечивать возможность детализации описаний;

• обеспечивать возможности интеграции информации;

• обеспечивать возможности уникальной идентификации информации;

• обеспечивать возможности размещения и поиска информации в распределенной среде;

• быть ориентированными на современные и перспективные технологии описания и использования информации;

• обеспечивать возможности интероперабельности с внешней средой.

Собственно реализация каждой подсистемы при стандартизованных внешних интерфейсах не очень существенна. Однако базовые технологии их реализации вытекают естественным образом из их общей функциональности (см. пример на рис. 2).

Теория и практика общественно-научной информации. Выпуск 22 - b00000328.jpg

Рис. 2. Базовые технологии компонент РИС

Теория и практика общественно-научной информации. Выпуск 22 - b00000331.jpg

Рис. 3. Инфраструктура РИС библиотек СО РАН

В качестве иллюстрации РИС на основе перечисленных правил может выступать создаваемая РИС библиотек СО РАН, инфраструктура которой изображена на рисунке 3.

Другой иллюстрацией описываемого подхода может служить платформа массовой интеграции данных ZooSPACE, разрабатываемой в рамках Проекта ФЦП «Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007–2013 годы» по теме «Разработка принципов и программных средств виртуальной интеграции распределенных источников данных на основе международных стандартов для создания масштабных информационных инфраструктур» (контракт № 07.514.11.4130), заказчиком которого является Министерство образования и науки Российской Федерации.

Платформа массовой интеграции предназначена для создания и поддержки функционирования масштабных, динамически формирующихся информационных инфраструктур из большого числа автономных баз данных. ZooSPACE должна обеспечивать функциональные характеристики:

1) поддержку унифицированного по информационной инфраструктуре представления данных, которое позволяет выполнять поисковые запросы, не зависящие от физического расположения данных;

2) предоставление прикладных программных интерфейсов для выполнения массовых поисковых запросов и управления информационной инфраструктурой;

3) обработку массовых запросов к совокупности баз данных реляционного и иерархического типов;

4) выбор поискового пространства запроса по метаданным, описывающим характеристики баз данных информационной инфраструктуры;

5) синтаксический контроль запроса с соответствующей диагностикой до начала его выполнения;

6) подключение / отключение баз данных и вычислительных ресурсов по инициативе их администраторов в процессе функционирования инфраструктуры;

7) защиту хранимых в информационной инфраструктуре данных от несанкционированного доступа.

Предполагается, что система ZooSPACE будет состоять из произвольного количества слабосвязанных самодостаточных узлов, функционирующих в соответствии с единой политикой. Взаимодействие узлов между собой осуществляется посредством сетевых протоколов прикладного уровня на основе транспортного протокола TCP / IP, как показано на рисунке 1.

Количество узлов в ZooSPACE не нормируется и может быть любым. Система ZooSPACE может состоять из одного-единственного узла.

Такой выбор инфраструктуры узлов позволяет обеспечить достаточно гибкую распределенную информационную систему и реализовать всю необходимую функциональность, которая обеспечивается подсистемами ZooSPACE. В качестве подсистем ZooSPACE должны выступать следующие (см. рис. 4):

Теория и практика общественно-научной информации. Выпуск 22 - b00000348.jpg

Рис. 4. Основные подсистемы ZooSPACE

• ZooSPACE-L – обеспечение функционирования справочной и административной подсистемы ZooSPACE;

• ZooSPACE-Z – обеспечение функционирования подсистемы доступа к базам данных системы ZooSPACE;

• ZooSPACE-M – обеспечение функционирования системы мониторинга всех компонент ZooSPACE;

• ZooSPACE-S – обеспечение функционирования подсистемы сбора статистики работы всех компонент ZooSPACE;

• ZooSPACE-W – обеспечение реализации пользовательских и административных веб-интерфейсов доступа к другим подсистемам ZooSPACE.

Система ZooSPACE в настоящее время находится на уровне предварительных испытаний.

В заключение отметим, что разрабатываемый в ИВТ СО РАН подход к построению распределенных информационных систем позволяет обеспечить возможность интеграции разнородных и разнотипных информационных ресурсов в единую информационную среду и унифицированного поиска благодаря использованию унифицированной модели работы с данными (в идеологии протокола Z39.50). Созданная система сервисов предоставляет широкому кругу потенциальных пользователей стандартизированный доступ к данным и алгоритмам их обработки. Такой подход позволяет обеспечить высокую степень информационной поддержки междисциплинарных научных исследований.

Литература

1. Жижимов О.Л., Мазов Н.А. Принципы построения распределенных информационных систем на основе протокола Z39.50 / ОИГГМ СО РАН. – Новосибирск: ИВТ СО РАН. – 2004. – 361 с.

2. Жижимов О.Л., Мазов Н.А., Федотов А.М. Некоторые заметки об эволюции цифровых репозитариев традиционных библиотек к полнофункциональным электронным библиотекам // Вестник Владивостокского гос. ун‐та экономики и сервиса. Территория новых возможностей. – Владивосток, 2010. – Т. 3. – № 7. – С. 55–63.

3. Жижимов О.Л., Пестунов И.А., Федотов А.М. Структура сервисов управления метаданными для разнородных информационных систем [Электронный ресурс] // Электронные библиотеки: рос. науч. электр. журнал. – 2012. – Т. 15. – № 5. – http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2012/part6/ZPF

6
{"b":"629032","o":1}