Детальное изучение геномов растений, животных и человека открывает широчайшие возможности применения полученных знаний в биотехнологии и медицине. Однако только данных о нуклеотидных последовательностях геномов недостаточно для понимания функциональных взаимосвязей отдельных элементов геномов и их роли в формировании фенотипических признаков и патогенезе отдельных заболеваний.

В постгеномную эпоху ( с 2003 по настоящее время) активно развиваются методы, позволяющие манипулировать с ДНК в геномах, а также визуализировать и управлять экспрессией генов и работой регуляторных элементов. Тем не менее далеко не все методы отвечают высоким требованиям к их эффективности, безопасности и доступности для широкого круга исследователей.

В последние несколько лет появились новейшие методы редактирования геномов это системы TALEN  (Transcription Activator-Like Effector Nucleases) и CRISPR (Clustered Regulatory Interspaced Short Palindromic Repeats)/Cas9. Эти появившиеся относительно недавно системы уже зарекомендовали себя как эффективные и надежные инструменты геномной инженерии.

С 1990 по 2003 год в рамках Международного проекта «Геном человека» была определена последовательность нуклеотидов ядерной ДНК человека и идентифицировано около 20.5 тысяч генов. 

В 2003 году Национальный исследовательский институт генома человека организовал новый международный проект ENCODE (Encyclopedia Of DNA Elements), целью которого стало объединение усилий ученых с целью получения полного списка функциональных элементов генома человека, включая элементы, которые действуют на уровне белков и РНК, а также регуляторные элементы, контролирующие фундаментальные генетические процессы (транскрипцию, трансляцию и репликацию).

Для установления подобных функциональных взаимоотношений используют две стратегии: выключение гена (нокаут или нокдаун) и усиление работы гена либо его эктопическую экспрессию. 

В последние годы эти поиски привели к созданию новых инструментов редактирования геномов — системы TALEN (Transcription Activator-Like Effector Nucleases; эффекторные нуклеазы, подобные активаторам транскрипции) и CRISPR/Cas (Clustered Regulatory Interspaced Short Palindromic Repeats; короткие палиндромные повторы, расположенные группами, равномерно удаленными друг от друга).

Эти системы отличаются относительной простотой конструирования и высокой эффективностью работы в клетках человека, животных и растений. Такие системы, активно применяемые для различных манипуляций с геномами, позволяют решать сложные задачи, включая получение мутантных и трансгенных растений и животных, создание и исследование моделей заболеваний на основе культивируемых плюри-потентных клеток человека.

Кроме того, химерные белки на основе ДНК-связывающих доменов TALE и инактивированной нуклеазы Cas9 использовали в экспериментах по регуляции транскрипции генов, для изучения эпигеномов и поведения хромосомных локусов в клеточном цикле.

CRISPR (дословно переводится как «короткие палиндромные повторы, регулярно расположенные группами» от англ. Clustered Regularly Interspaced Short Palindromic Repeats ) представляют собой особым образом устроенные локусы генома, в которых короткие палиндромные (то есть одинаково читающиеся в обоих направлениях) повторы разделяются небольшими уникальными последовательностями — спейсерами.

В 2011 году методы высокоточного редактирования геномов, среди которых была и система TALEN, названы журналом Nature Methods методом года [9]. История разработки этой системы связана с изучением бактерий рода Xanthomonas. Эти бактерии являются патогенами таких культурных растений, как рис, перец, томат, они наносят экономически значимый вред сельскому хозяйству, что стало причиной их тщательного изучения.

Оказалось, что бактерии секретируют в цитоплазму растительных клеток эффекторные белки (Transcription Activator-Like Effectors, TALE), которые влияют на процессы в растительной клетке и увеличивают ее восприимчивость к патогену. При дальнейшем изучении механизмов действия эффекторных белков было обнаружено, что они способны связываться с ДНК и активировать экспрессию своих генов-мишеней, имитируя факторы транскрипции эукариот.

Белки TALE состоят из центрального домена, ответственного за связывание ДНК, сигнала ядерной локализации и домена, активирующего транскрипцию целевого гена.

После расшифровки кода узнавания ДНК белками TALE, который привлек внимание ученых всего мира благодаря своей простоте (один мономер — один нуклеотид), были проведены первые работы по созданию химерных нуклеаз TALENs. С этой целью последовательность, кодирующая ДНК-связывающий домен TALE, встроили в плазмидный вектор, использованный ранее при создании ZFN.

В результате были получены генетические конструкции, экспрессирующие искусственные химерные нуклеазы, которые содержат ДНК-связывающий домен и каталитический домен эндонуклеазы рестрикции FokI. Данная система позволяет, комбинируя мономеры ДНК-связывающего домена с разными RVD, создать искусственные нуклеазы, мишенью которых будет любая нуклеотидная последовательность.

Теоретически с помощью искусственных нуклеаз TALENs двухцепочечный разрыв можно внести в любой участок генома, с известными сайтами узнавания ДНК-связывающих доменов. Единственное ограничение по выбору сайтов нуклеаз TALEN заключается в необходимости присутствия T перед 5′-концом целевой последовательности. Тем не менее, варьируя длину спейсерной последовательности, в подавляющем большинстве случаев можно осуществить выбор сайтов. 

 

CRISPR/Cas

Примерно через два года после открытия системы химерных белков TALEN получила развитие и стала активно применяться другая система редактирования геномов — CRISPR, элементами которой являются некодирующие РНК и белки Cas (CRISPR-as-sociated). В отличие от химерных белков TALENs, узнавание системой CRISPR/Cas осуществляется за счет комплементарного взаимодействия между некодирующей РНК и ДНК целевых сайтов. При этом образуется комплекс из некодирующих РНК и белков типа

  • Целевой локус генома
  • ДНК-связывающий домен
  • Каталитический домен Fokl
  • ДНК-связывающий домен
  • Пара химерных белков TALEN

На первой стадии — адаптации — небольшой фрагмент чужеродной ДНК, проникшей в бактериальную клетку, встраивается в CRISPR-локус генома хозяина, формируя новый спейсер. В вирусном геноме этот фрагмент присутствует в качестве про-тоспейсера, комплементарного спейсеру и фланкированного короткой (2-5 п.н.) консервативной последовательностью, называемой PAM (Protospacer Adjacent Motif; мотив, прилежащий к протоспейсе-ру) [28, 29]. Новый спейсер всегда встраивается со стороны АТ-богатой лидерной последовательности, находящейся перед CRISPR-кассетой, в ней же находятся промоторные элементы и сайты посадки регуляторных белков [30, 31]. По всей видимости, именно таким образом формируются мишени большинства CRISPR / Cas-систем.

На второй стадии — транскрипции — весь CRISPR-локус транскрибируется в длинную pre-crRNA

(poly-spacer precursor crRNA; полиспейсерный предшественник CRISPR РНК) . Процессинг незрелого транскрипта в зрелые crRNA в большинстве CRISPR/Cas-систем осуществляет эндонуклеаза Cas6. Короткие crRNA (CRISPR РНК) длиной 39-45 нуклеотидов содержат одну спейсерную последовательность, а на концах находятся повторы, которые участвуют в образовании структуры стержень-петля: восемь последних нуклеотидов повтора с гидроксильной группой на 5′-конце образуют стержень, а шпилечная структура с 2′,3′-цикли-ческим фосфатом формирует петлю на З’-конце.

Третья стадия — интерференция чужеродной ДНК или РНК — обеспечивается за счет взаимодействия crRNA и комплекса Cas-белков; crRNA комплементарно узнает последовательность протоспейсера, а Cas-белки обеспечивают ее разрушение.

TALENs И CRISPR/Cas9

Общая стратегия геномной инженерии с помощью сайт-специфических нуклеаз включает четыре основных этапа:

  • Выбор целевой нуклеотидной последовательности в геноме.
  • Создание нуклеазной конструкции, направленной на выбранную мишень.
  • Доставка этой конструкции в клеточное ядро.
  • Анализ полученных мутаций.
  • Биоинформатический анализ

Создание генетических конструкций, экспрессирующих CRISPR и TALEN

TALEN. ДНК-связывающий домен состоит из практически идентичных повторов, поэтому при создании генетических конструкций, экспрессирующих TALENs, существуют определенные трудности технического характера. Предложен ряд методов, которые позволяют создавать ДНК-связывающие домены TALE, состоящие из 20-30 и даже более мономеров. Одна из стратегий основана на стандартном клонировании ДНК с использованием гидролиза ДНК эндонуклеазами рестрикции типа II и лигирования — REAL (REstriction and Ligation).

На первом этапе подготавливают библиотеку мономеров, в которые с 5′- и 3′-концов внесены сайты эндонуклеаз рестрикции. После гидролиза ДНК проводят попарное лигирование, в результате чего образуются димеры (N1N2, N3N4, N2k-1N2k), которые затем объединяют в тетрамеры и так далее.

Правильная последовательность при этом достигается использованием различных эндонуклеаз рестрикции. Эта методика весьма трудна и длительна, поскольку на каждом этапе необходимо очищать продукты реакции, а также подтверждать правильность ориентации. 

С целью сокращения времени создания генетических конструкций, экспрессирующих TALEN, предложен метод, позволяющий избежать лигирования ДНК и соответственно этапов, связанных с проверкой его результатов. Выбранный ДНК-связывающий домен собирается из мономеров с длинными специфичными одноцепочечными концами (10-30 нуклеотидов). При смешивании нескольких мономеров происходит отжиг комплементарных одноцепочечных концов, в результате чего мономеры выстраиваются в нужной последовательности. Затем клетки E. coli трансформируют полученной смесью, и лигирование происходит уже в бактериях с участием их собственных ферментов.

Также появились системы для автоматизированного высокоэффективного производства конструкций, экспрессирующих нуклеазы TALENs. Так, например, коммерческая платформа компании Celle^s Bioresearch позволяет создавать до 7200 таких конструкций в год. 

В научной литературе описаны три метода [72-74], основанные на использовании твердофазных поверхностей. Эти методы позволяют избежать анализа промежуточных конструкций, их очистки с помощью выделения из геля и других стадий, что делает эти методы пригодными для автоматизированного производства и ускоряет процесс. Суть этих методов заключается в использовании покрытых стрептавидином магнитных частиц, к которым присоединены биотинилированные двухцепочечные ДНК-адаптеры. В результате последовательного чередования этапов гидролиза ДНК эндонуклеазами рестрикции и лигирования наращивается последовательность мономеров, связанная через адаптер с магнитной частицей. Продукты реакций очищают с помощью отмывочных буферов на магнитной подложке. При этом побочные продукты и компоненты реакций вымываются, а целевой продукт, благодаря притяжению между магнитными частицами и подложкой, остается в пробирке (или лунке). В конце с помощью эндонуклеаз рестрикции расщепляют связи между биотинилированным адаптером и синтезированной последовательностью мономеров ДНК-связывающего домена TALEN, которую затем в результате лигирования ДНК клонируют в плазмидный вектор. С помощью такого метода можно быстро и эффективно параллельно синтезировать генетические конструкции в 96-луночных планшетах, используя мультиканальные автоматические пипетки или роботизированные раскапывающие станции.

Доставка конструкций, экспрессирующих компоненты системы CRISPR/Cas9

Для трансформации клеточных культур человека, мыши и других организмов чаще используют плазмиды, обеспечивающие активную продукцию ну-клеазы Cas9 и sgRNA in vitro. В случае трансформации целого организма разработан метод, основанный на микроинъекции мРНК сas9 и sgRNA в одноклеточные эмбрионы. Этот метод активно применяют у мышей, полосатого данио (Danio rerio) и дрозофилы.

Для широкомасштабного охватывающего геном нокаута с использованием больших библиотек sgRNA используют лентивирусные векторы.

Геномная инженерия с помощью TALEN и CRISP)/Cas

Объект Ген

Клетки человека (Homo sapiens) ccr5, akt2, e17k, angptl3, apob, atgl, c6orf106, celsr2, cftr, ciita, foxol, foxo3, glil, glut4, hbb, hdacl, hdac2, hdac6, hmga2, hoxa13, hoxa9, hoxc13, hprt, il2rg, jak2, kras, linc00116, maoa, map2k4, mdm2, met, mlhl, msh2, mutyh, myc, mycll, mycn, nbn, ncorl, ncor2, nlrc5, ntf3, pdgfra, pdgfrb, phf8, plinl, pms2, ppp1r12c (aavsl), ptchl, pten, rara, rbbp5, recql4, ret, runxl, sdhb, sdhc, sdhd, setdbl, sirt6, smad2, sortl, sox2, klf4ss18, suz12, tfe3, tp53, tribl, tsc2, ttn, vhl, xpa, xpc, abll, alk, apc, atm, axin2, bax, bcl6, bmprla, brcal, brca2, cbx3, cbx8, ccndl, cdc73, cdk4, cdh4, chd7, ctnnbl, cyld, ddb2, ercc2, ewsrl, extl, ext2, ezh2, fanca, fancc, fancf, fancg, fes, fgfrl, fh, flcn, flt4, mstn, aavs2, oct4, pitx3

CRISPR/ Cas Полосатый данио (Danio rerio) etsrp, gata5, etsrp, gsk3b, apoea, fh, fhl, thl, rgs4, tiall, tphla, drd3, egfp, tyr, gol, mitfa, ddxl9, sema3fb, dre-mir-l26a, dre-mir-l26b, dre-mir-l7a-l-dre-mir-92a-l, dre-mir-l7a-2-dre-mir-92a-2, fgd5, ensdarg00000070653, ensdarg00000076787, psmfl, dre-mir-l26a, dre-mir-l7a-2, dre-mir-92a-2, tardbp, tardbpl, cl3h9orf72 

Помимо создания моделей, необходимых для разработки подходов к лечению заболеваний, искусственные нуклеазы могут использоваться непосредственно в терапевтических целях.

Одно из таких направлений — терапия хронических вирусных инфекций. Могут быть сконструированы нуклеазы TALENs, позволяющие вносить мутации в открытые рамки считывания таких вирусов, как ВИЧ, вирус гепатита B, герпесвирус.

Поскольку Cas9 узнает конкретную мишень в геноме при участии короткой направляющей последовательности в sgRNA, то в современных условиях относительно просто создать достаточно большую библиотеку олигонуклеотидов и соответственно sgRNA, охватывающую масштабы целого генома. А использование в качестве вектора для доставки компонентов CRISPR/Cas9 лентивирусов, которые стабильно поддерживаются в геноме и реплицируются вместе с геномной ДНК, позволило разработать новую технологию GeCKO — CRISPR-Cas9-нокаут в масштабе генома (Genome-scale CRISPR/Cas9 knockout)/

Сочетанием двух крайне перспективных направлений современной биотехнологии — оптогенетики и геномной инженерии — стала разработанная недавно система индуцируемых светом эффекторов транскрипции (light-inducible transcriptional effectors, LITEs). Эта система состоит из двух частей. Первая представляет собой ДНК-связывающий домен TALE, соединенный со светочувствительным доменом -криптохромом 2 (CRY2), выделенным из Arabidopsis thaliana. Вторая — активатор транскрипции VP64, соединенный с CIB1, который способен взаимодействовать с CRY2. Под действием синего света CRY2 изменяет конформацию и связывается с CIB1, таким образом привлекая VP64 к целевому сайту /

Использование системы CRISPR/Cas9 имеет ряд преимуществ перед методами, основанными на ZFN и TALEN: ее значительно проще создать, она обладает более высокой эффективностью и подходит для высокопроизводительного и мультиплексного редактирования генома в самых разных клеточных линиях и живых организмах.

Для переориентации на новую мишень нужно только поменять 20-нуклеотидную направляющую последовательность sgRNA.

Причем Cas9 вносит разрыв строго между 17-м и 18-м нуклеотидами в целевой последовательности (считая от 5′-конца спейсера), т.е. на расстоянии трех нуклеотидов от РАМ.

А одновременное редактирование нескольких генов значительно упрощается введением комбинации sgRNA

Лентивирусы (Lentivirus, от lentus — медленный) — род вирусов из семейства  ретровирусов  (Retroviridae) с длительным  инкубационным периодом.

Лентивирусы способны доставлять значительное количество генетического материала в клетку хозяина и обладают уникальной среди ретровирусов способностью реплицироваться в неделящихся клетках, что делает лентивирусы удобным вектором для доставки генетического материала в молекулярной биологии. Ярким представителем этого рода является вирус иммунодефицита человека.

Вот такие теперь факторы эволюции существуют в нашей жизни… VZV+HIV=EBOV