Итак, в основу моделирования процессов восприятия и распознавания в интересах построения технических устройств широкого назначения должен быть положен «детерминированно-эвристический» подход с реализацией основных принципов функционирования содержательных психологических моделей, «структурной» детерминированности, взаимодействия моделей разного характера и уровня, эвристичности перцептивно-опознавательной деятельности. Детерминированность рассматривается с содержательно-психологических позиций, а эвристичность – в широком смысле слова, не исключая вероятностные аспекты. Из указанных принципов вытекают как следствие все перечисленные преимущества психического управления и восприятия, включая иерархичность, взаимную корреляцию функциональной и лингвистической структур, кольцеобразность (замкнутость) функциональной структуры в целом и ее элементов и т. д.
Возможные пути построения эффективно действующих непримитивных автоматов на принципах психики:
а) анализ характера психофизиологических и психологических моделей, описывающих в естественном языке деятельность человека;
б) формальное описание психофизиологических функций человека при решении соответствующих задач и построение математических моделей (цифровых, аналитических);
в) создание физических моделей из специализированных (например, оптико-электронных) конструкций и экспериментальная проверка их в различных условиях;
г) формирование интегральной системы, содержащей совокупность физических и математических моделей.
Основными задачами построения формальных моделей являются:
обеспечение универсальности функционирования рецепторных устройств, производящих обработку любой входной информации; воспроизведение функциональной структуры психического управления с реализацией соответствующих эвристик и алгоритмов выделения, преобразования и фиксации информации как при построении психологических моделей, так и их функционировании; разработка иерархического языка для адекватного описания объектов среды и отражающих их текущих образов;
разработка принципов построения внутренней модели проблемной ситуации в ходе ее решения на перцептивно-опознавательном уровне. В настоящее время эти задачи являются центральными в области кибернетической психологии.
При построении моделей восприятия и распознавания необходимо учитывать следующие основные требования:
а) модель должна быть непротиворечивой в рамках моделируемых процессов, способной «вписываться» в более общую модель, быть основой для детализации частных моделей;
б) модель должна выполнять определенные информационные функции, нести новые знания о структуре моделируемых процессов, обеспечивать прогнозирование их функционирования;
в) модель должна быть реализуемой на современных технических средствах, обладать практической полезностью и представлять собой новое средство автоматического выполнения всей системы операций, реализуемых в моделируемых ею психофизиологических структурах.
Полная модель, учитывающая все свойства зрительного анализатора, до настоящего времени не разработана, поэтому при составлении и оценке алгоритмов аналого-цифрового преобразования основные особенности зрительного анализатора учитываются раздельно, а не в совокупности. Особенности зрения выявляются при этом с помощью относительно простых тестовых изображений (штрихов, резких перепадов яркости и т. п.). Полученные результаты затем распространяются на изображения с более сложной структурой.
Сетчатка, которая содержит сложную сеть нейронов, связывающих перекрестно фоторецепторы и соединяющихся с ганглиозными клетками, аксоны которых образуют зрительный нерв, а также связывающих друг с другом ганглиозные клетки, осуществляет преобразование оптического изображения в нейронное, представляющее собой распределение интенсивности возбуждения нейронов, образующих сетчатку. Это преобразование является нелинейным и определяется химическими процессами в фоторецепторах и в системе взаимосвязанных клеток сетчатки, расположенных сразу после фоторецепторов. Изменения, происходящие при этом с изображением, моделируются путем его поэлементного преобразования нелинейной функцией, обычно логарифмической или степенной, с показателем степени 1/3. Использование логарифмической функции удобнее с методической точки зрения, т. к. она согласуется с законом Вебера-Фехнера, который сам является приближенным, применение же степенной функции позволяет получить несколько более точные результаты.
Существует три типа колбочек, входящих в сетчатку, называемых «красные», «синие», «зеленые», которые различаются по чувствительности к различным участкам длины волн λ светового излучения. На рисунке 1.1 приведены кривые спектральных чувствительностей трех типов колбочек, выраженных в процентах, поглощенных зрительными пигментами квантов.
При построении функциональной модели зрительной системы это обстоятельство учитывается включением в нее трех звеньев, «сигналы» с которых соответственно вычисляются по формулам
ek(x,y) = ƒ L(x,y,λ)εk(λ)dλ,
eз(x,y) = ƒ L(x,y,λ)εз(λ)dλ, (1.1)
ec(x,y) = ƒ L(x,y,λ)εc(λ)dλ,
где L(x,y,λ) – распределение яркости (светового потока) по координатам x,y и длин волн света εk(λ),εз(λ),εc(λ) – спектральные чувствительности «красных», «зеленых» и «синих» колбочек, ek(x,y),eз(x,y),ec(x,y) – сигналы с «красных», «зеленых» и «синих» фоторецепторов (колбочек).
Рисунок 1.1 – Кривые спектральных чувствительностей колбочек
В сетчатке глаза происходит первичная обработка изображения, в результате которой формируется ахроматическая (черно-белая) и цветностные составляющие изображения, причем, последние не зависят от яркости наблюдаемого изображения. Сформированные таким образом составляющие изображения фильтруются сетчаткой. При фильтрации ахроматической (яркостной) составляющей имеет место ослабление нижних пространственных частот (ПЧ) за счет латерального торможения. Степень ослабления определяется условиями наблюдения. Если яркость изображения не меняется во времени, то это ослабление максимально. В случае наблюдения мелькающих изображений ослабление нижних ПЧ оказывается тем меньше, чем выше частота мелькания, а при частотах мелькания f ≥ 6 Гц ослабление вообще отсутствует.
Верхние ПЧ как ахроматической, так и цветностных составляющих изображений ослабляются в процессе фильтрации глазом. Процесс ослабления формализуется экспериментальными графиками передаточных функций, представляемых обычно в виде зависимостей контрастной чувствительности зрительной системы в децибелах от пространственной частоты пространственно-гармонического сигнала.
Таким образом, в процессе описанного преобразования оптического изображения в нейронное уменьшается зависимость зрительного ощущения от освещенности сцены, «срезаются» пространственные частоты, сужается спектр, что приводит к сокращению количества информации, поступающей в зрительный нерв за счет устранения всего несущественного. Это сокращение потока информации можно оценить, если учесть, что число колбочек равно 6,5–7 млн, а число волокон зрительного нерва 0,8–1 млн, т. е. оно составляет 6,5–8,75 раз.
Полная функциональная модель зрительной системы на уровне сетчатки, в которой были бы отражены все известные в настоящее время ее характеристики, хотя и может быть построена, но она оказывается слишком сложной и представляет скорее теоретический интерес. При построении модели, пригодной для практического использования, делается ряд упрощающих допущений. Основными из них являются допущения об инвариантности к сдвигу и повороту, а также допущение относительно непрерывности мозаики сетчатки.