Литмир - Электронная Библиотека
A
A

 

Математические модели в естественнонаучном образовании. Том II - _85.jpg

Рисунок 5.13. FM-алгоритм; завершение.

Обратите внимание, что одно ребро оказалось отрицательной длины. Поскольку этого не может быть, многие на практике предпочли бы просто переопределить длину в 0. Однако, если это произойдет, то должны будем по крайней мере проверить, что отрицательная длина была близка к 0, иначе придётся беспокоиться о качестве используемых данных.

Хотя на первый взгляд это может показаться странным, но как алгоритм Фитча-Марголиаша, так и UPGMA будут создавать точно такое же топологическое дерево при применении к набору данных. Причина этого заключается в следующем: при принятии решения о том, к каким таксонам или группам присоединиться на каждом шаге, оба метода учитывают точно такую же свернутую таблицу данных и оба выбирают пару, соответствующую наименьшей записи в таблице. Отличаться будут только метрические характеристики результирующих деревьев. Это немного подрывает надежду на то, что FM-алгоритм лучше, чем UPGMA. Хотя это может привести к лучшему метрическому дереву, но топологически оно никогда не отличается.

Фитч и Марголиаш в 1967 году фактически предложили свой алгоритм не как самоцель, а скорее, как эвристический метод получения дерева, которое, вероятно, будет иметь определенное свойство оптимальности, о чем еще поговорим в ходе решения связанных с этим задач. Рассматриваем его здесь, как и UPGMA, в качестве шага на пути к изложению алгоритма из следующего раздела. Знакомство с UPGMA и FM-алгоритмом поможет понять более сложный метод.

Конечно, и UPGMA, и FM-алгоритм лучше выполнять компьютерными программами, чем вручную. Тем не менее, несколько ручных расчетов необходимо выполнить, чтобы полностью понять, как функционируют методы и какие предположения в них входят.

Хотя алгоритм Фитча-Марголиаша позволил получить неравные длины ветвей в деревьях, за это заплатили высокую цену – построенные деревья оказываются некорневыми. Однако, поскольку поиск корня часто желателен, возникает необходимость обойти этот недостаток.

При применении любого метода филогенетического дерева, который дает некорневое дерево, может быть включен дополнительный таксон. Этот дополнительный таксон выбран так, чтобы было известно, что он более отдаленно связан с каждым из представляющих интерес таксонов, чем они связаны друг с другом, и присоединяется как внешняя группа. Например, если пытаемся связать разные виды уток друг с другом, то можем включить другой тип птиц в качестве внешней группы. Как только дерево без корней построено, находим корень такой, чтобы ребро из внешней группы соединялось с остальной частью дерева. Информация о том, что внешняя группа должна была отделена от других таксонов до того, как они отделились друг от друга, помогает определить место корня на дереве общего предка.

Задачи для самостоятельного решения:

5.2.1. Для дерева на рисунке 5.8, построенного методом UPGMA, вычислите таблицу расстояний между таксонами вдоль дерева. Как это соотносится с исходной таблицей данных расстояний?

5.2.2. Предположим, что четыре последовательности

Математические модели в естественнонаучном образовании. Том II - _31.jpg
,
Математические модели в естественнонаучном образовании. Том II - _32.jpg
,
Математические модели в естественнонаучном образовании. Том II - _33.jpg
 и
Математические модели в естественнонаучном образовании. Том II - _34.jpg
 ДНК разделены филогенетическими расстояниями, как показано в таблице 5.9. Создайте корневое дерево, показывающее отношения между
Математические модели в естественнонаучном образовании. Том II - _31.jpg
,
Математические модели в естественнонаучном образовании. Том II - _32.jpg
,
Математические модели в естественнонаучном образовании. Том II - _33.jpg
 и
Математические модели в естественнонаучном образовании. Том II - _34.jpg
 с помощью UPGMA.

Таблица 5.9.  Данные о расстоянии для задач 5.2.2 и 5.2.5

Математические модели в естественнонаучном образовании. Том II - _31.jpg
Математические модели в естественнонаучном образовании. Том II - _32.jpg
Математические модели в естественнонаучном образовании. Том II - _33.jpg
Математические модели в естественнонаучном образовании. Том II - _34.jpg
Математические модели в естественнонаучном образовании. Том II - _31.jpg

           1.2         .9           1.7

Математические модели в естественнонаучном образовании. Том II - _32.jpg

                         1.1         1.9

Математические модели в естественнонаучном образовании. Том II - _33.jpg

                                        1.6

5.2.3. Выполните UPGMA для данных расстояния в таблице 5.4, которые были использованы в примере FM-алгоритма. Производит ли UPGMA топологически то же дерево, что и алгоритм FM? А метрически?

5.2.4. FM-алгоритм использует тот факт, что данные о расстоянии, относящиеся к трем терминальным таксонам, могут быть точно подогнаны по одному некорневому дереву, относящемуся к ним.

а. Выведите 3-точечных формулы, приведенные в разделе.

б. Если расстояния равны

Математические модели в естественнонаучном образовании. Том II - _86.jpg
,
Математические модели в естественнонаучном образовании. Том II - _87.jpg
 и
Математические модели в естественнонаучном образовании. Том II - _88.jpg
, то каковы длины
Математические модели в естественнонаучном образовании. Том II - _89.jpg
,
Математические модели в естественнонаучном образовании. Том II - _90.jpg
 и
Математические модели в естественнонаучном образовании. Том II - _91.jpg
?

5.2.5. Используйте FM- алгоритм для построения некорневого дерева на данных в таблице 5.9, которая также использовалась в задаче 5.2.2. Насколько отличается получившийся результат?

5.2.6. Предположим, что три терминальных таксона связаны некорневым метрическим деревом.

а. Если три длины ребер равны 0.1, 0.2 и 0.3, объясните, почему гипотеза молекулярных часов должна быть неверной, независимо от того, где находится корень.

б. Если длины трех ребер равны 0.1, 0.1 и 0.2, объясните, почему гипотеза о молекулярных часах может быть верной. В случае, когда гипотеза оказывается верна, где должен находиться корень?

в. Если три длины ребер равны 0.1, 0.2 и 0.2, объясните, почему гипотеза молекулярных часов должна быть неверной, независимо от того, где находится корень.

5.2.7. В то время как данные о расстоянии для 3 терминальных таксонов могут точно соответствовать дереву без корней, при наличии 4 (или более) таксонов это обычно невозможно.

а. Нарисуйте некорневое дерево с терминальными таксонами A, B, C и D. Обозначьте длины пяти ребер

Математические модели в естественнонаучном образовании. Том II - _92.jpg
.

б. Используя для расстояния между терминальными таксонами обозначения типа

Математические модели в естественнонаучном образовании. Том II - _52.jpg
, запишите уравнения для каждого из 6 таких расстояний выраженных через
Математические модели в естественнонаучном образовании. Том II - _92.jpg
. Объясните, почему, если даны числовые значения расстояний между терминальными таксонами, эти уравнения вряд ли будут иметь точное решение.

в. Приведите такой конкретный пример значений 6 расстояний между терминальными таксонами, чтобы уравнения в части (б) не могли иметь точного решения. Приведите еще один пример значений, для которых уравнения могут быть решены.

5.2.8. Известен ряд различных мер для оценки степени согласованности между данными о расстояниях и метрическими деревьями. Пусть

Математические модели в естественнонаучном образовании. Том II - _93.jpg
 обозначает расстояние между таксонами
Математические модели в естественнонаучном образовании. Том II - _94.jpg
 и
Математические модели в естественнонаучном образовании. Том II - _95.jpg
, полученное из экспериментальных данных, а
Математические модели в естественнонаучном образовании. Том II - _96.jpg
 обозначает расстояние, полученное при обходе от
Математические модели в естественнонаучном образовании. Том II - _94.jpg
 до
Математические модели в естественнонаучном образовании. Том II - _95.jpg
 вдоль дерева. Во второй половине прошлого века были предложены следующие три меры:

7
{"b":"788247","o":1}