Х). В некоторых случаях эти повторы гомологичны двум разным хромосомам (9 и 15, 13 и 21, 18 и Х) ( Willard,Waye, 1987).
Хромосом-специфические последовательности сателлитной альфо- идной ДНК нашли широкое применение в молекулярной цитогене- тике в качестве ДНК-зондов, удобных для маркирования индиви- дуальных хромосом в метафазных и интерфазных клетках челове- ка (Юров, 1987). Предполагается, что сателлитные ДНК играют важную роль в поддержании структур хромосом и, возможно, в их спаривании в процессе мейоза (Charlesworth et al., 1994).
Особое место среди сателлитных ДНК занимают микро- и минисателлитные последовательности, представляющие собой многочисленную группу рассеянных по всему геному относитель- но коротких тандемных повторов. Микросателлиты - это класс динуклеотидных повторов. Размер повторяющихся единиц в ми- нисателитных последовательностях может меняться от 3 - 4 до
10 - 15 нуклеотидов. Отличительной особенностью микро- и ми- нисателлитов является наличие среди них большого количества участков, вариабильных по числу копий в кластере.
Инвертированные или обращенные повторы составляют до 5% генома. Они состоят из двух тождественных копий длиной около
300 п.о., ориентированных в противоположных направлениях на одной нити ДНК и лежащих на расстоянии от нуля до десятка тысяч пар нуклеотидов друг от друга (в среднем - 1,6 кб).
Около 1/3 обращенных повторов не разделены промежуточными последовательностями и носят название палиндромов. Среднее расстояние между двумя различными парами инвертированных повторов около 12 кб, и их распределение по геному носит случайный характер. Комплементарные пары легко ассоциируют при отжиге, образуя шпилечные структуры с дуплексной ножкой и однонитевой петлей, длина которой соответствует расстоянию между парой обращенных повторов. Вследствие этого оказыва- ются приблеженными достаточно удаленные друг от друга участ- ки ДНК, что важно для работы ряда ферментов, обеспечивающих процессы репликации и транскрипции. Важно отметить и то, что однонитевой участок ДНК, образующий петлю, становится доступным для действя нуклеазы S1, специфически разрушающей однонитевую ДНК.
Группа умеренно повторяющихся последовательностей очень гетерогенна по длине и числу копий и составляет около 20% генома человека. Как правило, они распределены дисперсно по всем хромосомам, причем относительно короткие последователь- ности ДНК до 500 п.о., так называемые короткие диспергиро- ванные повторы - Sine, повторяются более 100 000 раз, в среднем, через каждые 2.2 кб. Число копий более длинных диспергированных последовательностей - Line, не превышает 10
000. Умеренные повторы найдены во всех структурных компонен- тах генома за исключением кодирующих областей генов. Два главных семейства умеренных повторов, Alu и Kpn1, занимают, по крайней мере, 10% генома и практически столько же занято несколькими сотнями других семейств повторов этого класса.
Основной единицей Alu семейства является короткая последовательность из 300 п.о., повторенная в геноме челове- ка несколько сот тысяч раз, в среднем, через каждые 5 кб или через каждые 2 - 3 диспергированных повтора, принадлежащих другим семействам (Kao, 1985; Льюин, 1987). При этом, кластеры Alu-повторов, как правило, лежат внутри R-дисков метафазных хромосом - Гимза отрицательных (G- дисков). Расп- ределение Alu-повторов по геному весьма неравномерно как между хромосомами, так и по их длине. Так, в хромосомах 14,
16, 21 Alu-последовательности концентрируются в области центромеры, а в хромосомах 4, 19, 20, Х и У выраженные кластеры Alu повторов не найдены. Члены Alu семейства не полностью идентичны друг другу. Однако, все они содержат сайт рестрикции для фермента AluI и имеют димерную структу- ру, то есть состоят из двух прямых повторов длиной около 130 п.о. с богатой аденином вставкой из 31 нуклеотида во втором мономере. Каждая Alu последовательность фланкирована прямыми повторами длиной от 7 до 20 п.о., различными для разных чле- нов семейства и имеющими большую степень гомологии с транспозоноподобными элементами про- и эукариот. Некоторые члены Alu семейства могут транскрибироваться с помощью фер- мента РНК-полимеразы 111. Предпологается, что при определен- ных условиях образующиеся при этом молекулы РНК могут обрат- но транскрибироваться, что в свою очередь, может привести к появлению в клетках Alu-содержащих кДНК, обладающих свойствами ретропазонов, то есть способных инсертироваться в геномную ДНК. В литературе описаны случаи инсерционного му- тагенеза Alu повторов, приводящие к гемофилии В и нейрофиб- роматозу типа 1. Однако, частота таких событий, по-видимому, невелика. Предполагается, что короткие умеренные повторы, подобные Alu семейству, участвуют в регуляции транскрипции, в процессинге РНК и в инициации репликации ДНК. Кроме того, обнаружена высокая степень гомологии Alu последовательностей с одним из видов низкомолекулярной РНК (7 S РНК), участвую- щей в секреции белков.
К числу Line повторов относится Kpn1 семейство, которое состоит из более длинных и значительно более гетерогенных последовательностей, рассеянных по всему геному. В ряде слу- чаев члены Kpn1 семейства группирются в кластеры, образуя более длинные структуры, повторяющиеся несколько тысяч раз.
Для некоторых членов этого семейства также доказана возмож- ность инсерции кДНК-овых копий Kpn1- РНК-транскриптов в ге- номную ДНК и возникновение мутаций. Такое явление было обна- ружено в одном случае гемофилии А. Некоторые Kpn1- последо- вательности не только транскрибируются, но и способны транслироваться (Charlesworth et al.,1994).
Раздел 2.3 Мультигенные семейства, псевдогены, онкоге- ны.
Многие гены человека повторены в геноме от нескольких единиц до нескольких сотен раз и образуют мультигенные се- мейства (Газарян, Тарантул, 1983; Босток, Самнер, 1981; Kao,
1985; Льюин, 1987). Эти гены обычно сгруппированы в кластеры в определенных районах одной, либо нескольких хромосом. Во многих мультигенных семействах наряду с функционально актив- ными генами содержатся псевдогены - мутационно измененные последовательности, не способные транскрибироваться или про- дуцирующие функционально неактивный генный продукт. Примера- ми мультигенных семейств могут служить гены рибосомальных, транспортных и ядерных РНК, гены альфа- и бета-глобинов, ту- булинов, миоглобина, актина, интерферона и многих других. В ряде случаев, возможна избирательная амплификация некоторых семейств генов в процессе их экспрессии, как, например, ге- нов рибосомальных РНК. При этом число способных транскриби- роваться копий генов увеличивается за счет их избирательной амплификации в сотни и даже тысячи раз, что сопровождается лавинообразным нарастанием доли соответствующего генопродук- та в клетках. Особое место среди мультигенных семейств зани- мают супергены - очень большие кластеры из сотен функцио- нально и структурно родственных генов, расположенных в сег- ментах отдельных хромосом. Классическим примером супергена может служить HLA комплекс, контролируюший главные антигены гистосовместимости. Он занимает район более 6000 кб на ко- ротком плече хромосомы 6р21 и состоит из серии тесно сцеп- ленных генов, ответственных за синтез множества белков, включающих клеточные поверхностные антигены, молекулы иммун- ного ответа и некоторые компоненты комплемента. К суперген- ным семействам относятся три комлекса расположенных на раз- ных хромосомах мультигенов, контролирующих синтез тяжелых и легких цепей иммуноглобулинов. Интересно, что в процессе диффиренцировки B лимфоцитов, продуцирующих иммуноглобулины, происходит структурная перестройка этих семейств. При этом отдельные последовательности ДНК элиминируются, тогда как другие сливаются, так что структура генов иммуноглобулинов в зрелых B лимфоцитах значительно отличается от исходной, то есть от той, которая наблюдается в зародышевых клетках.
Одной из важных структурных особенностей генома челове- ка является наличие так называемых псевдогенов, уникальных последовательностей, очень сходных по своей структуре с оп- ределенными нормальными генами, но в силу присутствия в ко- дирующих последовательностях целого ряда мутаций не способ- ных транскрибироваться или правильно транслироваться с обра- зованием структурно и функционально активного продукта.
Псевдогены обнаружены для многих генов. Их количество варь- ирует от одной до нескольких десятков копий на геном и в этом случае они, как правило расположены тандемно. Иногда псевдогены тесно сцеплены с нормальными генами, во многих случаях псевдогены и гены локализованы в разных хромосомах.
Для некоторых моногенных заболеваний идентифицированы му- тантные аллели, сходные с мутациями в соответствующих псев- догенах. В этих случаях обсуждаеся возможная роль псевдоге- нов в спнтанном мутационном процессе.
В геноме человека присутствуют также нуклеотидные последовательности, гомологичные генам некоторых вирусов.
Впервые эти последовательности были идентифицированы в гено- ме вирусов, индуцирующих развитие опухолей у животных и че- ловека, и потому они были названы онкогенами. Гомологичные последовательностям в геноме человека носят название прото- онкогенов. В настоящее время уже идентифицировано более 100 протоонкогенов. Белковые продукты протоонкогенов, по-видимо- му, играют важную роль в нормальной пролиферации клеток осо- бенно на ранних стадиях эмбрионального развития, контролируя клеточный цикл и выбор геномной программы развития клетки.
При возникновении специфических мутаций в протоонкогенах, а также при нарушениях регуляции их работы, выражающихся в ги- перпродукции или в зкспрессии в нетипичномном месте или в несвойственный момент жизнедеятельности клетки, они начинают вести себя как онкогены, стимулируя неконтролируемое размно- жение и пролиферацию определенных клеточных клонов, что и может, в конечном счете, привести к формированию опухоли.
Раздел 2.4 Современное определение понятия "ген", транскрипция, регуляторные элементы генов.
Около 10-15% генома человека представлено уникальными транскрибируемыми последовательностями, составляющими основу структурных генов (Льюин, 1987). В настоящее время в понятие
"ген" включается не только его транскрибируемая область - экзоны + интроны, но также фланкирующие последовательности - лидерная, предшествующая началу гена, и хвостовая нетрансли- руемая область, раположенная на 3' конце гена (Рис.2.1 ). В отличие от генов прокариот гены человека редко представлены одной непрерывной последовательностью и в подавляющем боль- шинстве имеют прерывистую структуру. Относительно короткие кодирующие участки - зкзоны, чередуются с длинными интрона- ми, которые транскрибируются и входят в состав первичного
РНК-продукта, но затем при процессинге первичного РНК
-транскрипта они вырезаются и не участвуют в трансляции.
Процесс вырезания интронов из первичных транскриптов получил название сплайсинга. Таким образом, в зрелой мРНК интронные области отсутствуют, а экзоны составляют непрерывную кодиру- ющую последовательность. Размеры зрелых мРНК нередко в десятки раз меньше первичных РНК-транскрипов и, соот- ветственно, размеров самого гена.
Согласно классическим представлениям ген - это локус, на хромосоме, мутации в котором реализуются на уровне фено- типа. В молекулярной биологии ген трактуется как ассоцииро- ванный с регуляторными последовательностями фрагмент ДНК, соответствующий определенной единице транскрипции. Следова- тельно, представления о гене формальных генетиков далеко не полностью тождественны его физической единице и соотношения между этими двумя понятиями достаточно запутанные. Отметим некоторые причины этих противоречий. Известно, что мутации одного гена могут приводить к совершенно разным и даже в ря- де случаев к комплементарным фенотипам. Результаты прямого секвенирования генома свидетельствуют о присутствии в нем значительного большего числа генов, чем можно ожидать от ре- зультатов мутационного анализа. Одна и та же последователь- ность ДНК в геноме может кодировать несколько различных бел- ков, что достигается за счет так называемого альтернативного сплайсинга (образование разных мРНК из одного первичного
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49