о проблеме сольтационных реорганизаций генома-А.В. Еремеев.

Формат документа: pdf
Размер документа: 0.33 Мб





Прямая ссылка будет доступна
примерно через: 45 сек.



  • Сообщить о нарушении / Abuse
    Все документы на сайте взяты из открытых источников, которые размещаются пользователями. Приносим свои глубочайшие извинения, если Ваш документ был опубликован без Вашего на то согласия.

О проблеме сальтационных реорганизаций генетического материала
в генетике популяций и эhexpbhgguo uqbke_gbyo

257








А.В. Еремеев
1
О ПРОБЛЕМЕ САЛЬТАЦИОННЫХ РЕОРГАНИЗАЦИЙ
ГЕНЕТИЧЕСКОГО МАТЕРИАЛА В ГЕНЕТИКЕ
ПОПУЛЯЦИЙ И ЭВОЛЮЦИОННЫХ ВЫЧИСЛЕНИЯХ
2


Генетическая инZjbZglghklv b^Z
и сальтационная теория b^hh[jZahания

В настоящей работе рассматриZ_lky проблема сальтационных из-
менений генотипа с биологической точки зрения, в том b^_ как она ha-
никает в эволюционной генетике популяций, и с точки зрения эhexpbhg-
ных вычислений, в b^_ скачков между областями притяжения локальных
оптимумов функции приспособленности.
Анализ генотипов в популяциях различных b^h\
жиhlguo пока-
зыZ_l неоднородность в их структурной организации: наряду с поли-
морфными локусами имеются и такие, в которых отсутстm_l как индиви-
дуальная, так и географическая изменчиhklv (мономорфные локусы). При
этом межb^hые различия наиболее четко прослежиZxlky именно по
мономорфным локусам [Алтухов, 2003].
Важная эволюционная роль сальтационных реорганизаций генетиче-
ского материала отмечается в
соj_f_gghc генетике при анализе hagbdgh-
_gby многих таксономических групп, в том числе таких, которые демонст-
рируют качест_ggu_ различия процессов эhexpbb в мире жиhlguo и
мире растений. Биологический смысл этих перестроек состоит в том, что
они скачком переh^yl k_ гены в мономорфных локусах или определенную
их часть в гетерозиготное состояние, тем самым
создавая качест_ggh но-
u_ hafh`ghklb адаптации популяции. Однако в схеме b^hh[jZahания
через крупные реорганизации мономорфной части генома имеется «узкое
1 ИсследоZgb_ uiheg_gh за счет гранта Российского научного фонда (проект
№ 17-18-01536).
2 В основу статьи легли материалы доклада, представленного на семинаре Центра
перспектиguo методологий социально-гуманитарных исследоZgbc ИНИОН РАН.

А.В. Еремеев

258 место»: такого рода изменчивость находится под постоянным контролем
отсекающего отбора, и неясно, как в таком случае может осущестblvky
b^hh[jZah\Zgb_.
Для решения указанной проблемы, как праbeh, необходимо особое
состояние окружающей среды, в котором макромутация может оказаться
нейтральной или получить определенные селектиgu_ преимущестZ.
Ю.П. Алтухов [Алтухов, 2003, с. 233–284] предполагает, что соот_lkl-
mxsb_
реорганизации генома постоянно происходят у различных b^h\,
однако праh на жизнь они заh_\u\Zxl лишь при сдb]Zo природной
среды, в ходе которых могут осущестeylvky такие комбинации генов, ка-
кие в предшестhаr_c фазе стабильного сущестhания b^Z следовало
бы рассматриZlv как «не_jhylgu_» [Алтухов, 1974; Hewitt, 2001].
Близкие a]ey^u на b^hh[jZahание разb\Z_l Х. Карсон [Carson,
1975]. По Карсону, у
бисексуальных b^h\ следует различать д_ системы
генетической изменчиhklb: «открытую» и «закрытую». Открытая пред-
стаe_gZ участками ДНК, не ebyxsbfb сущест_ggh на жизнеспособ-
ность. Закрытая предстаe_gZ gmlj_gg_ сбалансироZggufb, aZbfgh
адаптироZggufb блоками генов, настолько сильно ebyxsbfb на при-
способленность, что любая их реорганизация отметается естест_gguf
отбором. ВидообразоZgb_ осущестey_lky через реорганизацию закрытой
системы генома, и
ноu_ b^u берут сh_ начало от одной или немногих
особей с ноufb сhcklами. Таким образом, макроэhexpby и b^hh[jZ-
зоZgb_ – яe_gby, лежащие g_ фаз длительной стабильности b^Z и со-
пряженные с крупными сдb]Zfb природной среды и соот_lklующими
реорганизациями геномов. Этот uод, сделанный в работе [Алтухов,
Рычков, 1972], перекликается с концепцией «прерыbklh]h раghесия»,
пояbшейся примерно в то же j_fy [Eldredge, Gould, 1972].
Для оценки сложности реорганизации мономорфной части генома
рассмотрим гипотетическую ситуацию, когда уже имеется популяция
жизнеспособных организмов со k_f необходимым набором действующих
молекулярных комплексов, обеспечивающих хранение, hkijhbaедение и
трансляцию информации (синтез белка). Предположим, что для адаптации
к ноuf условиям окружающей среды требуется со_jr_ggh ноuc бе-
лок
, состоящий из 150 аминокислот (сраgbl_evgh небольшой для белка
размер). Для упрощения будем считать, что между указанными аминокис-
лотами и кодирующими их триплетами нуклеотидов сущестm_l aZbfgh
однозначное соот_lklие. Тогда 150 аминокислотам по генетическому
коду должна соот_lklоZlv последоZl_evghklv из 450 нуклеотидов (ка-
ждая аминокислота кодируется триплетом нуклеотидов, которых k_]h
четыре типа). При случайном раghероятном u[hj_
последоZl_evghklb
из 450 нуклеотидов _jhylghklv пояe_gby ноh]h гена с заданной после-
доZl_evghklvx нуклеотидов состаey_l 1/4
450 ≈ 10 –270 . Для сравнения заме-
тим, что по соj_f_gguf оценкам число частиц h Вселенной – порядка 10 80.
С другой стороны, из принципа неопределенности Гейзенберга и общей

О проблеме сальтационных реорганизаций генетического материала
в генетике популяций и эhexpbhgguo uqbke_gbyo

259 теории относительности ul_dZ_l, что минимальный промежуток j_f_-
ни, имеющий физический смысл, должен быть не менее 10
–44 с (см., напр.:
[Halliday, Resnick, 1988]). Возраст Вселенной, по теории большого ajuа
состаey_l не более 20⋅10
9 лет ≈ 6⋅10 17 с. В таком случае число элементар-
ных событий в истории Вселенной не превышает _ebqbgu порядка
10
80⋅10 44⋅10 18=10 142 . Даже предполагая, что в каждом таком событии про-
исходит незаbkbfh_ испытание случайно aylhc последоZl_evghklb
нуклеотидов, _jhylghklv пояe_gby искомой последовательности после
10
142 испытаний оценивается с_jom чрезuqZcgh малой _ebqbghc
10 142 ⋅10 –270 = 10 –128 .
При оценивании _jhylghklb получения белка с требуемыми сhc-
стZfb, кроме предположения о aZbfgh однозначном соот_lklии между
аминокислотами и нуклеотидными триплетами, неяgh были сделаны еще
дZ упрощающих предположения: раghероятность k_o четырех типов
нуклеотидов и единст_gghklv последовательности аминокислот, состав-
ляющих белок с требуемыми свойстZfb. Предположение о единст_ggh-
сти последоZl_evghklb аминокислот сyaZgh с
анализом мономорфной
части генома, где полиморфизм белков не наблюдается. Предположение о
раghероятности нуклеотидов может быть нарушено, в случае если ин-
тересующий нас участок ДНК ранее кодироZe некоторый другой белок,
имеющий аналогичные мотиu (генетические информационные блоки) с
требуемым белком [Золян, 2016].
В работах В.А. Ратнера (см., напр.: [Ратнер, 1992]), разbающих
идеи С. Оно
[Ohno, 1970], предложен блочно-модульный принцип орга-
низации и эhexpbb молекулярно-генетических систем упраe_gby,
дающий более пра^hih^h[gu_ сценарии hagbdghения ноuo белков.
Согласно этому принципу, эhexpby генов, РНК, белков, геномов и мо-
лекулярных систем упраe_gby на их осно_ шла путем комбинироZgby
блоков (модулей), причем модулями, из которых состаeyebkv ghь ha-
никающие молекулярно-генетические
системы, служили уже функциони-
рующие макромолекулярные компоненты.
Принцип модульности может быть использоZg в «сценариях» эh-
люционного hagbdghения таких сложных микробиологических систем,
как бактериальный жгутик [Pallen, Matzke, 2007; Bacterial flagellar
diversity, 2009], хотя полемика по hijhkm hagbdghения бактериальных
жгутиков в настоящее j_fy продолжается [Abby, Rocha, 2012]. В работах
[Pallen, Matzke, 2007; Snyder et al, 2009], в частности, подчеркиZ_lky, что
модули для построения жгутика имеются h многих бактериях, но
uihe-
няют другие функции. Для получения дейстmxs_]h бактериального жгу-
тика остается только осущестblv удачную рекомбинацию этих фрагмен-
тов. Насколько _jhylgh такое удачное событие – hijhk дальнейшего
изучения. Некоторые трудности uqbkebl_evgh]h характера, сyaZggu_ с
такого рода hijhkZfb, кратко рассматриZxlky в следующем разделе.

А.В. Еремеев

260Сложность анализа гипотез о b^hh[jZah\Zgbb

На сегодняшний день в синтетической теории эhexpbb до конца не
раскрыто яe_gb_ сальтационных изменений генетического материала.
Можно предположить, что причина состоит в том, что для изучения этого
яe_gby требуется соf_klblv анализ комбинаторных сhckl\ генома с
динамикой популяций. Однако, как следует из некоторых результатов тео-
рии
вычислительной сложности, такой анализ, hh[s_ гоhjy, представляет
собой чрезuqZcgh сложную проблему, и даже элементарные задачи, ha-
никающие на этом пути, достаeyxl серьезные трудности. Например, за-
дача нахождения _jhylghklb пояe_gby требуемого гена в процессе эh-
люции из_klghc популяции яey_lky алгоритмически неразрешимой
[Backofen, Clote, 1997]. Задача uqbke_gby трехмерной конфигурации
белка с заданной последоZl_evghklvx нуклеотидов не
имеет эффектив-
ных алгоритмов решения (т.е. алгоритмов, j_fy счета которых ограниче-
но полиномом от длины исходных данных) [Berger, Leighton, 1998], если
_jgZ из_klgZy гипотеза о нера_gkl\_ сложностных классов P и NP [Гэ-
ри, Джонсон, 1982]. Не менее сложен hijhk о hafh`ghklb экспрессии
интересующего нас гена в жизненном цикле особи с из_klguf геноти-
пом, что соот_lklует сущестhанию определенного аттрактора в
NK-модели Кауфмана [Inoue, 2011]. При_^_ggu_ примеры гоhjyl о не-
обходимости использоZgby эjbklbq_kdbo алгоритмов, в частности эh-
люционных алгоритмов, при анализе таких яe_gbc, как сальтационные
изменения генетического
материала. Краткий обзор таких алгоритмов и
некоторых их сhckl\ приh^blky в следующем разделе.


Эhexpbhggu_ алгоритмы

Эhexpbhggu_ алгоритмы (ЭА) беpут начало в pаботах Л. Фогеля,
А. Оуэнса и М. Уолша [Фогель, Оуэнс, Уолш, 1969], а также Дж. Холланда
[Holland, 1975], где было предложено моделироZlv процесс биологиче-
ской эhexpbb с целью синтеза эффектиguo в некотором смысле струк-
тур и создания систем искусст_ggh]h интеллекта.
Характерной особенностью ЭА яey_lky имитация процесса эhex-
ционной адаптации биологической популяции к условиям окружающей
среды, при этом особи соот_lklуют пробным точкам в пространст_
решений задачи оптимизации, а приспособленность особей определяется
значениями целеhc функции и штрафами за нарушение ограничений за-
дачи, если такие имеются.
Принципы наследст_gghklb, изменчиhklb и отбора в эhexpbhg-
ных алгоритмах реализуются при построении ноuo решений-потомков
посредстhf рандомизироZgguo процедур (операторов), модифицирую-
щих полученные ранее пробные точки подобно процессам мутации и

О проблеме сальтационных реорганизаций генетического материала
в генетике популяций и эhexpbhgguo uqbke_gbyo

261
кроссинго_jZ в живой природе. Отбор таких пробных точек произh^blky
с учетом значений функции приспособленности. Особям, имеющим пре-
имущестh по приспособленности, даются большие шансы быть u[jZg-
ными в качест_ родительских решений.
На каждой итерации генетического алгоритма (ГА) [Holland, 1975]
с помощью рандомизироZgguo операторов мутации и кроссинго_jZ
строится ноZy популяция (поколение). Численность популяции фиксиро-
ZgZ от начала работы алгоритма до конца. Операторы мутации и крос-
синго_jZ с некоторым упрощением моделируют процессы мутации и
скрещиZgby в жиhc природе, состоящие в hagbdghении случайных
изменений в молекулах ДНК.
Вb^m простоты адаптации uqbkebl_evguo схем эhexpbhgguo
алгоритмов эти методы актиgh применяются для решения задач оптими-
зации, hagbdZxsbo в упраe_gbb, планироZgbb, проектироZgbb, рас-
познаZgbb образов и других областях.
ГА зачастую относят к классу методов локального поиска [Aarts,
Lenstra, 1997]. В дейстbl_evghklb, h многих случаях работоспособность
ГА объясняется сходстhf его по_^_gby с алгоритмом локального поиска.
В частности, как показано в [Level-based analysis, 2016; Eremeev, 2017], с
ростом селектиgh]h даe_gby и численности популяции генетические
алгоритмы почти не уступают локальному поиску по j_f_gb перh]h
достижения локального оптимума функции приспособленности. Однако
достижение глобального оптимума функции приспособленности, hh[s_
гоhjy, яey_lky более сложной задачей и требует больших uqbkebl_ev-
ных затрат. По_^_gb_ эhexpbhgguo алгоритмов при поиске глобально-
го оптимума в случаях, когда функция приспособленности имеет не-
сколько локальных оптимумов, предстаey_l серьезную проблему,
решенную только в некоторых частных случаях. Теоретический анализ
ЭА показал, что в задачах, где нужно преодолеть «проZe» в ландшафте
приспособленности, ЭА сильно замедляются (j_fy поиска оптимума
hajZklZ_l экспоненциально) [Jansen, Wegener, 2002]. Переход из локаль-
ных оптимумов к глобальному (аналог эhexpbb одного биологического
b^Z в другой) h многих случаях требует чрезuqZcgh мало_jhylguo
мутационных переходов, если рассматриZlv практически значимые зада-
чи оптимизации.
Одна из наиболее актуальных проблем в теории ЭА состоит в де-
монстрации hafh`ghkl_c кроссинго_jZ качест_ggh ускорить эhex-
ционный поиск, например сократить экспоненциальную трудоемкость до
полиномиальной. ПерZy попытка построить задачу, где кроссинго_j
сущест_ggh облегчал бы работу эволюционного алгоритма благодаря
модульности, скрытой в функции приспособленности, принадлежит
M. Mитчелл с соаl. [Mitchel, Forrest, Holland, 1992]. Однако kdhj_ уда-
лось показать, что предложенные задачи (назZggu_ аlhjZfb Royal Road
Problems) легко решаются и ЭА без кроссинговера, схожими с методом

А.В. Еремеев

262
локального поиска. Позднее некоторые специально сконструироZggu_
примеры с требуемым сhcklом k_-таки удалось построить [Jansen,
Wegener, 2002], однако показать работоспособность этой идеи для широ-
кого класса задач до сих пор не удается. Как правило, максимум, что уда-
ется доказать в достаточно общих предположениях, – то, что кроссинго-
_j не будет сущест_ggh ухудшать j_fy отыскания оптимального
решения) [Level-based analysis, 2016; Eremeev, 2017].
Отсутстb_ результатов, сb^_l_evklующих о качест_gguo раз-
личиях между ЭА с кроссинго_jhf и без него, на широких классах задач
iheg_ объяснимо. Наиболее интересные с практической точки зрения
задачи яeyxlky NP-трудными, и для них не существует эффектиguo
алгоритмов решения, если _jgZ из_klgZy гипотеза о нера_gklе клас-
сов P и NP (см., напр.: [Гэри, Джонсон, 1982]). Эффектиgh]h оператора
оптимального кроссинго_jZ еще не достаточно для того, чтобы эффек-
тиgh решать такую сложную задачу. Даже оптимальный оператор крос-
синго_jZ не даст желаемого результата, пока не будет построена и u-
брана подходящая пара родительских особей. Таким образом, сложность
исходной задачи «перетекает» в сложность задачи построения подходя-
щих пар родительских генотипов.


Заключение

Подh^y итог, можно сделать uод о том, что постаe_ggZy в 70-е
годы ХХ в. в популяционной генетике проблема сальтационных перехо-
дов остается открытой и актуальной не только в рамках генетики, но и в
области эhexpbhgguo алгоритмов. Сальтационная теория b^hh[jZah-
Zgby и модульный принцип дают пра^hih^h[gu_ «
сценарии» hagbd-
но_gby ноuo функциональных структур, однако комбинаторные сhc-
стZ задач, сyaZgguo с биологической эhexpb_c и эволюционными
uqbke_gbyfb, создают значительные проблемы при их анализе.


Список литературы

Алтухов Ю.П. Популяционная генетика рыб. – М.: Пищ. пром-сть, 1974. – 245 с.
Алтухов Ю.П. Генетические процессы в популяциях. – М.: Академ. книга, 2003. – 431 c.
Алтухов Ю.П., Рычков Ю.Г. Генетический мономорфизм b^h\ и его hafh`gh_ биологи-
ческое значение // Журнал общей биологии. – М., 1972. – Т. 33, № 3. – С. 281–300.
Гэри М., Джонсон Д. Вычислительные машины и труднорешаемые задачи. – М.: Мир,
1982. – 416 c.
Золян C.Т., Жданов Р.И. Геном как (гипер) текст: От метафоры к теории // Критика и се-
миотика. – Новосибирск, 2016. – № 1. – С. 60–84.
Ратнер В.А. Блочно-модульный принцип организации и эhexpbb молекулярно-
генетических систем упраe_gby (МГСУ) // Генетика. – М., 1992. – Т. 28, № 2. – С. 5–23.

О проблеме сальтационных реорганизаций генетического материала
в генетике популяций и эhexpbhgguo uqbke_gbyo

263
Фогель Л., Оуэнс А., Уолш М. Искусст_gguc интеллект и эhexpbhggh_ моделироZgb_. –
М.: Мир, 1969. – 230 c.
Aarts E.H.L., Lenstra J.K. Introduction // Local Search in Combinatorial Optimization /
Aarts E.H.L., Lenstra J.K. (eds). – N.Y.: John Wiley & Sons Ltd., 1997. – P. 1–19.
Abby S., Rocha E. The non-flagellar type III secretion system evolved from the bacterial flagel-
lum and diversified into host-cell adapted systems // PLoS Genetics. – 2012. – Vol. 8, N 9. –
Mode of access: https://doi.org/10.1371/journal.pgen.1002983 (Дата посещения: 28.06.2017.)
Backofen R., Clote P. Evolution as a computational engine // Proceedings of the Annual Confer-
ence of the European Association for Computer Science Logic, Springer Lecture Notes in
Computer Science. – Berlin: Springer-Verlag., 1997. – Vol. 1414. – P. 35–55.
Berger B., Leighton T. Protein folding in the hydrophobic-hydrophilic (HP) model is
NP-complete // J. Comput. Biol. Mary Ann Liebert Inc. – New Rochelle, 1998. – Vol. 5, N 1. –
P. 27–40.
Carson H.L. The genetics of speciation at the diploid level // The American Naturalist. – Chicago:
The univ. of Chicago press, 1975. – Vol. 109, N 965. – P. 83–92.
Level-based analysis of genetic algorithms and other search processes / Corus D., Dang D.-C.,
Eremeev A.V., Lehre P.K.; $ arXiv:1407.7663 v2 [cs.NE]. – 2016. – 21 p. – Mode of access:
http://arxiv.org/abs/1407.7663 (Дата посещения: 28.06.2017.)
Eldredge N., Gould S.J. Punctuated equilibria: an alternative to phyletic gradualism // Models in
paleobiology / Schopf T.J.M. (ed.). – San Francisco: Freeman: Cooper & Co, 1972. – P. 82–115.
Eremeev A.V. Hitting times of local and global optima in genetic algorithms with very high selec-
tion pressure // Yugoslav Journal of Operations Research. – 2017. – Mode of access:
http://dx.doi.org/10.2298/YJOR160318016E (Дата посещения: 28.06.2017.)
Hewitt G.M. Speciation, hybrid zones and phylogeography – or seeing genes in space and time //
Molecular Ecology. – N.Y.: John Wiley & Sons Ltd, 2001. – Vol. 10, N 3. – P. 537–549.
Holland J. Adaptation in natural and artificial systems. – Ann Arbor: Univ. of Michigan press,
1975. – 183 p.
Inoue K. Logic programming for Boolean networks // Proceedings of the Twenty-Second Interna-
tional Joint Conference on Artificial Intelligence. – Barcelona: AAAI Press, 2011. – Vol. 2. –
P. 924–930.
Jansen T., Wegener I. On the analysis of evolutionary algorithms – a proof that crossover really
can help // Algorithmica. – N.Y., 2002. – Vol. 34, N 1. – P. 47–66.
Halliday D., Resnick R. Fundamentals of Physics. – N.Y.: Wiley, 1988. – 544 p.
Mitchell M., Forrest S., Holland J. The royal road for genetic algorithms: Fitness landscapes and
GA performance // Proceedings of 1 st Eur. Conf. Artif. Life / Varela F.J., Bourgine P. (eds). –
Cambridge: MIT Press., 1992. – P. 245–254.
Ohno S. Evolution by gene duplication. – N.Y.: Springer-Verlag, 1970. – 160 p.
Pallen M.J., Matzke N.J. From the Origin of Species to the origin of bacterial flagella // Nature
Reviews Microbiology. – L., 2007. – Vol. 4. – P. 784–790.
Bacterial flagellar diversity and evolution: seek simplicity and distrust it? Trends in Microbiology /
Snyder L.A.S., Loman N.J., Futterer K., Pallen M.J. // Trends in Microbiology. – Cambridge,
2009. – Vol. 17, Issue 1. – P. 1–5.