Кодоновый состав генетических конструкций
Параметр «CAI» – индекс адаптации кодонов рассчитывается как произведение отношений частоты встречаемости в геноме каждого присутствующего в последовательности кодона к частоте встречаемости в геноме наиболее частого синонимичного кодона, кодирующего ту же аминокислоту, т.е. показывает адаптацию белок-кодирующей последовательности по частотам синонимических кодонов. CAI близкий к 1 говорит об использовании наиболее оптимальных кодонов и отсутствию редких кодонов, что приводит к увеличению экспрессии целевого гена.
Под редкими кодонами понимаются кодоны, используемые клетками c частотой менее 1%. Частота встречаемости кодонов (кодоновое предпочтение) напрямую влияет на размер пула тРНК, который связан с эффективностью, скоростью и правильностью трансляции целевого гена. Исследования показывают, что даже 3% уровень содержания редких кодонов, кодирующих аргинин (AGA/AGG), негативно сказывается на уровне синтеза целевого рекомбинантного белка, а присутствие таких кодонов в тандеме может приводить к сдвигу рамки считывания, преждевременной терминации и низкой эффективности трансляции.
Тем не менее, не всегда искусственное доведение CAI до единицы позволяет достичь более высоких степеней экспрессии. Это связано, во-первых, с тем, что сильно транскрибируемые мРНК будет высокая концентрация кодонов для ограниченного набора тРНК, что приведет к несбалансированному пулу тРНК, дисбалансу использования паттерна кодонов и потенциалу для ошибок трансляци. Во-вторых, отсуствует гибкость в выборе кодонов, что неизбежно приведет к появлению повторяющихся элементов, вторичных структур в мРНК и как следствие нестабильности конструкции, ингибированию связывания мРНК с рибосомами. Кроме того, повторяющиеся элементы могут представлять затруднения при их синтезе.
Термодинамическая и ферментативная стабилизация структуры мРНК
GC-состав, количество CpG последовательностей и их распределение напрямую влияет на термодинамическую стабильность мРНК целевого гена. У дрожжей была установлена строгая корреляция между пониженной термодинамической стабильностью мРНК и количеством редких кодонов. Увеличенное количество CpG последовательностей и высокий GC-состав целевого гена приводят к увеличению термодинамической стабильности мРНК и увеличению уровня экспрессии гена. В то же время повышенное количество UpA-динуклеотидов, являющихся предпочтительной целью для рибонуклеазы Е, негативно влияет на стабильность мРНК. И хотя CpG динуклеотиды легко подвергаются мутациям [86] и участвуют в сайленсинге генов на уровне ДНК, количество внутригенных CpG прямо коррелирует с частотой транскрипции de novo.
Во многих вирусных генах наблюдается повышенное содержание нуклеотидов АТ по сравнению с предпочтением клеток млекопитающих к GC-богатым кодонам. Замена кодонов на синонимичные, более GC-богатые, повышало стабильность некоторых мРНК ВИЧ на несколько порядков.
Идеальные значения GC состава составляют 30-70%, пики, сильно выходящие за эти пределы, могут негативно влиять на транскрипционную и трансляционную эффективность.
Удаление криптических внутригенных сайтов сплайсинга
Эукариотический геном содержит большое количество так называемых криптических сайтов сплайсинга. Криптические сайты сплайсинга не работают либо работают на низком уровне до тех пор, пока существующие сайты сплайсинга не будут нарушены мутациями (Padgett et al., 1986; Green, 1986). При активации они могут быть весьма эффективными, что является причиной многих генетических заболеваний (Buratti et al., 2011; Wang & Cooper, 2007). Таким образом, криптические сайты подавляются близлежащими сильными сайтами сплайсинга. Этот факт приводит нас к выводу о существовании конкуренции за факторы сплайсинга между различными сайтами (Padgett et al., 1986; Green, 1986).
Исходя из вышесказанного, существующие программы распознавания сайтов сплайсинга можно использовать для распознавания криптических сайтов. При этом последние будут иметь меньшую достоверность, чем канонические сайты сплайсинга.
Удаление предварительных поли(А) сайтов
Полиаденилирование – это добавление поли(А) хвоста к матричной РНК. Поли(А) хвост состоит из множества аденозин монофосфатов. В эукариотах, полиаденилирование является частью созревания зрелой мРНК и необходимо для ее трансляции.
33конец вновь синтезированной пре-мРНК первоначально нарезается комплексом белков. Далее эти белки добавляют остатки аденозина к 3’концу мРНК. В некоторых генах, например, PGC-1α, один ген содержит несколько сайтов полиаденилирования. В результате этого с одного гена возможна транскрипция сразу нескольких транскриптов, как и в результате альтернативного сплайсинга.
Поли(А) хвост необходим для экспорта мРНК из ядра, трансляции и стабильности мРНК. С течением времени хвост укорачивается, и, когда он становится чересчур коротким, мРНК энзиматически расщепляется.
Полиаденилирование мРНК осуществляется и в бактериях, однако при этом поли(А) хвосты короче, меньшее количество РНК подвергается полиаденилируется, и это способствует деградации мРНК.
При существовании альтернативных сайтов полиаденилирования мРНК различаются по 3’концу, в том числе 3’нетранслируемому району (UTR), который часто содержит сайты связывания миРНК. Иногда альтернативные сайты сплайсинга изменяют содержание кодирующего района мРНК, но гораздо чаще они приводят к укорочению UTR.
Преждевременное полиаденилирование мРНК ослабляет экспансию человеческих ретратранспозонов LINE-1s. Появление непредусмотренных альтернативных сайтов полиаденилирования приводит к появлению абберантных мРНК и, как следствие, уменьшению или даже полному отсутствию экспрессии целевого белка в генноинженерных экспериментах. К примеру, присутствие преждевременного сайта полиаденилирования приводит к низкой экспрессии гена cry3Ca1 Bacillus thuringiensis в растениях трансгенного картофеля, гликозид-гидролазы Reticulitermes speratus (эндосимбионта термитов) в Aspergillus oryzae, химерного белка CAB-2 в линии клеток CHO-K1.
Удаление внутренних сайтов связывания для рибосом
При трансляции, мРНК служит, во-первых, платформой для сборки рибосомы (инициация), затем как матрица для синтеза белка (элонгация), и наконец, как конец белок-кодирующей последовательности и диссоциации рибосомы (терминации). В эукариотах, большинство инициаций трансляций осуществляется комплексом, сборка которого требует модифицированного нуклеотида – кэпа – на 5’конце мРНК. Распознование кэпа ведет к связыванию эукариотического фактора инициации (eIF) и малой (40S) субъединицы рибосомы, которые затем сканируют мРНК в поисках подходящего стартового кодона. Далее рекрутируется большя (60S) субъеденица рибосомы. Этот каноничекий кэп-зависимый и скан-зависимый процесс инициации не соблюдается для всех белков в эукариотической клетке – инициация трансляции может происходить и кэп-независимым путем. При этом сама последовательность мРНК рекрутирует трансляционный комплекс, часто не требуя многих eIF. Такой, кэп-независимый путь называется «внутренней инициацией трансляции», а отвечающая за него последовательность называется «сайтом вхождения рибосом», или IRES.
IRES встречается у многих РНК-вирусов, например вируса гепатита С, вируса гепатита А, ВИЧ, пикарновирусов, вируса саркомы Рауса и т.д. Также, некоторые клеточные белки также содержат IRES: инсулиноподобный ростовой фактор 2, FGF-1, HIF-1α, Bcl-2, Apaf-1, c-myc, p53, eIF4G и т.д. Вторичная структура некоторых IRES представлена на рисунке 9.
Нахождение в составе генотерапевтических конструкций непредусмотренных последовательностей IRES может привести к инициации транскрипции с некорректного стратового кодона, что приведет к экспрессии укороченного с N-конца белкового продукта, либо к сдвигу рамки считывания. Все это вместе может привести к уменьшению экспрессии целевого белка и потому нежелательно.
Добавление регуляторных и прочих элементов
Сайты рестриктаз, Промоторы, сайты посадки транскрипционных факторов, Последовательность Козак, Cигнал полиаденилиирования, интроны.