Литмир - Электронная Библиотека
A
A

Определение. Информативный сайт – это сайт, на котором по крайней мере два разных основания встречаются как минимум по два раза каждое среди рассматриваемых последовательностей.

Прежде чем применять алгоритм экономии, можем исключить все неинформативные сайты из последовательностей, потому что они не повлияют на выбор самого экономного дерева. Обратите внимание, что в предыдущих примерах использовались только информативные сайты.

Метод максимальной экономии не использует ни модель молекулярной эволюции Джукса-Кантора, ни какую-либо другую явную модель мутации ДНК. Вместо этого метод подразумевает неявное предположение о том, что мутации случаются редко, а лучшее объяснение истории эволюции – это то, которое требует наименьшего количества мутаций. Между исследователями, выступающими за основанные на перечисленных моделях методы реконструкции эволюционных деревьев, и теми, кто выступает за метод экономии, велись ожесточенные, а иногда и жесткие споры. Вместо того, чтобы присоединяться к философскому спору, просто отметим, что, когда есть несколько мутаций, скрывающих предыдущие мутации, то и методы дистанцирования, и методы экономии, по-видимому, на практике работают достаточно хорошо. Предположения каждого из методов могут быть подвергнуты обоснованной критике, и многое еще предстоит сделать, чтобы найти лучшие решения.

Задачи для самостоятельного решения:

5.4.1. а. Вычислите минимальное количество базовых изменений, необходимых для деревьев на рисунке 5.21.

Математические модели в естественнонаучном образовании. Том II - _159.jpg

Рисунок 5.21.  Деревья для задачи 5.4.1.

б. Дайте по крайней мере три дерева, которые связывают наиболее экономные последовательности с одним основанием, используемые в части (a). Помните: можно перечислять таксоны в другом порядке.

в. Среди деревьев, прослеживающих эволюцию только на одном участке, как в частях (а) и (б), почему всегда можно найти дерево, требующее не более трех замен, независимо от того, сколько таксонов присутствует?

5.4.2. а. Найдите оценку экономии деревьев, изображенных на рисунке 5.22, где показаны только информативные сайты в последовательностях ДНК.

б. Нарисуйте третье возможное (некорневое) топологическое дерево, относящееся к этим последовательностям, и найдите для него оценку экономии. Какое из трех деревьев является наиболее скупым?

Математические модели в естественнонаучном образовании. Том II - _160.jpg

Рисунок 5.22. Деревья для задачи 5.4.2.

5.4.3. Рассмотрим следующие последовательности из четырех таксонов.

              

Математические модели в естественнонаучном образовании. Том II - _31.jpg
:         AATCG CTGCT CGACC

              

Математические модели в естественнонаучном образовании. Том II - _32.jpg
:         AAATG CTACT GGACC

              

Математические модели в естественнонаучном образовании. Том II - _33.jpg
:         AAACG TTACT GGAGC

              

Математические модели в естественнонаучном образовании. Том II - _34.jpg
:         AATCG TGGCT CGATC

а. Какие сайты являются информативными?

б. Используйте информативные сайты, чтобы определить наиболее скупое некорневое дерево, относящееся к этим последовательностям.

в. Если известно, что

Математические модели в естественнонаучном образовании. Том II - _34.jpg
 является внешней группой, используйте свой ответ на часть (б), чтобы создать корневое дерево, относящееся к
Математические модели в естественнонаучном образовании. Том II - _31.jpg
,
Математические модели в естественнонаучном образовании. Том II - _32.jpg
 и
Математические модели в естественнонаучном образовании. Том II - _33.jpg
.

5.4.4. Хотя неинформативные сайты не влияют на то, какое дерево считается наиболее экономным, они влияют на показатель экономии. Объясните, почему, если

Математические модели в естественнонаучном образовании. Том II - _161.jpg
 и
Математические модели в естественнонаучном образовании. Том II - _162.jpg
 являются скупыми оценками для дерева, использующего все сайты и использующего только информативные сайты соответственно, то
Математические модели в естественнонаучном образовании. Том II - _163.jpg
, где, для
Математические модели в естественнонаучном образовании. Том II - _164.jpg
, за
Математические модели в естественнонаучном образовании. Том II - _165.jpg
 обозначаем количество сайтов со всеми таксонами в согласии, за исключением
Математические модели в естественнонаучном образовании. Том II - _94.jpg
 таксонов, которые все различны. Примечание: Принимая во внимание, что
Математические модели в естественнонаучном образовании. Том II - _161.jpg
 и
Математические модели в естественнонаучном образовании. Том II - _162.jpg
 могут быть различаться для разной топологии, значение
Математические модели в естественнонаучном образовании. Том II - _166.jpg
 не зависит от топологии.

5.4.5. Для первого дерева на рисунке 5.23 рассчитайте минимальное количество требуемых изменений базы, разметив внутренние вершины по алгоритму из предыдущего раздела. Затем покажите, что второе дерево требует точно такого же количества изменений основания, даже если это не согласуется с тем, как обозначили внутренние вершины на первом дереве. Основной вывод, к которому нужно прийти после решения этой задачи заключается в том, что алгоритм, который используется для подсчета минимального количества изменений базы, необходимых для дерева, не обязательно покажет все способы, которыми можно достигнуть минимума.

Математические модели в естественнонаучном образовании. Том II - _167.jpg

Рисунок 5.23.  Деревья для задачи 5.4.5.

5.4.6. Если приведены последовательности для 3 терминальных таксонов, то информативных сайтов быть не может. Объясните, почему это так, и почему это не имеет значения.

5.4.7. Основания на определенном участке в выровненных последовательностях из разных таксонов образуют закономерность. Например, при сравнении

Математические модели в естественнонаучном образовании. Том II - _168.jpg
 последовательностей на участке шаблонная запись (ATTGA) означает, что A появляется на этом участке в последовательности первого таксона, T во второй, T в третьей, G в четвертой и A в пятой.

а. Объясните, почему при сравнении последовательностей для

Математические модели в естественнонаучном образовании. Том II - _12.jpg
 таксонов может появиться
Математические модели в естественнонаучном образовании. Том II - _169.jpg
 возможных шаблона.

б. Некоторые шаблоны неинформативны. Простыми примерами являются четыре паттерна, показывающие одно и то же основание во всех последовательностях. Объясните, почему существуют

Математические модели в естественнонаучном образовании. Том II - _170.jpg
 неинформативных паттернов, все последовательности которых совпадают, кроме одной.

в. Сколько всего существует неинформативных шаблонов, в которых 2 основания появляются один раз, а все остальные совпадают?

г. Сколько существует неинформативных шаблонов, в которых 3 основания появляется один раз, а все остальные согласованы?

д. Объедините свои ответы, чтобы рассчитать количество информативных шаблонов для

Математические модели в естественнонаучном образовании. Том II - _12.jpg
 таксонов.  Являются ли большинство шаблонов информативными для больших
Математические модели в естественнонаучном образовании. Том II - _12.jpg
?

5.4.8. Компьютерная программа, вычисляющая оценки экономии, может работать следующим образом: сначала сравните последовательности и подсчитайте количество сайтов

Математические модели в естественнонаучном образовании. Том II - _171.jpg
 для каждого появляющегося информативного шаблона. Затем для данного дерева вычислите оценки экономии
Математические модели в естественнонаучном образовании. Том II - _172.jpg
 каждого из этих шаблонов. Наконец, используйте эту информацию для вычисления оценки экономии дерева, используя все последовательности. Какая формула необходима для выполнения заключительного шага? Другими словами, выразите оценку экономии дерева через
Математические модели в естественнонаучном образовании. Том II - _171.jpg
 и
Математические модели в естественнонаучном образовании. Том II - _173.jpg
.

13
{"b":"788247","o":1}