CRISPR-Cas system
前略
CRISPR-Cas9でノックアウトの実験をやったとのこと,学部学生も扱える程,Cas9によるゲノム編集は広く使われるようになっているのだと驚き,そして次には少し不安になりました。現像液から緩衝液まで,すべて自分で調製し実験をしていた時代の人間からすると,キット化された実験への不安をどうしても拭えません。つまり,原理を本当に理解しているのか,キットを信用していいのかと。余計な心配ですね。
あなたからCRISPR-Casの話があったからというわけではありませんが,最近,CRISPR-Casシステムについての総説をいくつか読み,疑問が湧いてきましたので,今日はそれを書くことにしました。ちょうど,Natureにも"CRISPR'S MYSTERIES"という記事が載っていましたので,それも参考にしながら書いてみます。
CRISPR-Casシステムとは,あらためて言うまでもなく "Clustered Regularly Interspaced Short Palindromic Repeats" と "CRISPR associated proteins" の頭文字から作った略語(acronym)ですね。私なりの定義を書きます。
CRISPR-Casシステムは,真正細菌類や古細菌類が保有する適応的免疫システムで,侵入外来核酸を認識し,その一部をホスト自身のゲノム内に組込み免疫記憶とする一方,その免疫記憶をもとに再侵入する外来核酸を監視し,切断・無効化を行う一連の処理系。
もっと簡単に言えば,
バクテリアが持っている警察のしくみで,忍び込んできた悪者(外来核酸)を見つけ,その写真(スペーサー)を取って指名手配リスト(CRISPR配列)を作成,指名手配写真(crRNA)からまたもや忍び込んできた悪者を手早く見つけて(分解酵素で)撃退する方法。
ということになります。
CRISPR-Casが面白いのは,ゲノムに記録された免疫記憶が子孫に受け継がれるということです。これは,ヒトの免疫などでは見られない「離れ業」です。
話の都合上,CRISPR配列とCRISPR-Casシステムの型について先に書きます。
1. CRISPR 配列
CRISPRは,免疫記憶に相当するスペーサーと呼ばれる外来核酸由来の塩基配列とリピートと呼ばれる回文配列が交互に並んだゲノム上(あるいはプラスミド上)の構造です。上流側(5'-側)から,
リーダー,リピート(1),スペーサー(1),リピート(2),・・・,スペーサー(n),リピート(n)
という順で並んいます。リーダー部はATが多く,プロモーターを含んでいます。リピート部は名前の元になっているように回文配列で,そのために十文字状の構造をつくることができ,21から48塩基対の長さです。スペーサー部は26から72塩基対の長さで,侵入してきた外来核酸の塩基配列を切り出したものになります。スペーサーは侵入核酸を分解する際のガイド役であるcrRNA(CRISPR RNA)として利用されます。種によっては複数の(型の)CRISPR配列を持つものもいます。そして,リピート部の長さと配列,スペーサーの長さは1つのCRSPR配列内では統一されているようですが,型のよって様々です。
CRISPR配列の近隣部位には,cas遺伝子群が配置されており,基本的には1つのオペロンを構成しています。cas遺伝子から生成されたCasタンパク質は,CRISPR-Casシステムを支える複合体や酵素としてはたらきます。
2. CRISPR-Casシステムの型
crRNAの生成とターゲット切断の方法の違いにより,通常,3つの型に分類されています。
  • I型 ... crRNA生成・ターゲット切断にCascade(CRISPR-associated complex for antiviral defence,ウイルス防御のためのCRISPR関連複合体)と呼ばれる複合体を使います。エンドヌクレアーゼ,ヘリカーゼ活性を持つCas3が標徴(シグネチャー)タンパク質で,最終段階の外来DNAを切断します。サブタイプとしてI-A,I-B,I-C,I-D,I-E,I-F型があり,お馴染みの大腸菌Escherichia coli はI-E型です。
  • II型 ... I型・III型と異なり,crRNAに加えて別の短鎖ノンコーディングRNAであるtracrRNAと標徴タンパク質のCas9を使います。また,crRNA生成では通常のRNaseIIIが使われるのも特徴です。Cas9はターゲット切断だけでなくスペーサー獲得にも関係します。II型を持っているのは真正細菌だけで,古細菌では見つかっていません。II-A型,II-B型,II-C型の3つのサブタイプがあります。
  • III型 ... I型Cascadeと類似した構造・機能のCsm,Cmr複合体を使用します。標徴タンパク質はCas10で,ターゲット切断のための複合体の土台となります。III-A型,III-B型の2つのサブタイプに分けられ,一本鎖RNAを標的にしますが,DNAも標的にできます。
この他に,IV型,V型,VI型も提案されており,上位分類として,I型,III型,IV型をクラス1,II型,V型,VI型をクラス2に区分されますが,今回は取り上げません。
CRISPR-Casのはらたきは3つの段階,adaptation,expression,interferenceに分けて説明されます。以前の手紙に書いたようにこれらの用語にはわかりにくいところがありますので,私なりに,スペーサー獲得,crRNA生成,ターゲット切断と勝手に呼ぶことにします。それぞれの過程を少しだけ詳しく見てみましょう。
3. CRISPR-Casの3つのステップ
3-1. Adaptation - スペーサー獲得 -
Adaptationは,外来核酸を見つけ,それをスペーサーとして切り出し,CRISPR配列に組込む過程です。
ここで中心的な役割を果たすのがCas1・Cas2複合体です。Cas2ダイマーの両脇にCas1ダイマーがくっついた蝶ネクタイ型をしています(形状イメージは個人的なものです)。このCas1・Cas2複合体だけはすべてのCRISPR-Casで共通です。外来核酸は,この「蝶ネクタイ」の上に載せられ,蝶ネクタイの両側にあるCas1ダイマーによって適切な長さに切断され,新規獲得スペーサーとしてやはりCas1・Cas2複合体によってCRISPR配列に組み込まれます。
新規獲得スペーサーは,まず片側の鎖が第1リピートと第1スペーサーの間に入り,続いて対向鎖はリーダー配列と第1リピートの接続部に入ります。つまり,第1リピートは二本鎖が解消され,新規スペーサーの両側に一本鎖の状態で位置することになります。この後,何らかの酵素によって新規スペーサーの両側の一本鎖となった第1リピート部は二本鎖に復元されます。なかなか凝った作業ですが,スペーサー獲得ではリピート部も複製される必要があるわけですから,実は効率的な方法と言えるでしょう。実はこの組込み方法はレトロウイルスのものに類似しています。
この結果,CRISPR配列は,新しいスペーサーが常に先頭に入るという時系列配列を見せることになります。
I型,II型での外来核酸の認識には,PAM(protospacer adjacent motif,プロトスペーサー隣接モチーフ)と呼ばれる短い塩基配列(2-5塩基対)が使われます。このPAMをCas1・Cas2が(II型ではCas9が)認識し,これに続く塩基配列をスペーサー候補(プロトスペーサー)として捕らます。ただ,スペーサーとして切り出す時には,このPAMは分断されてしまい,スペーサー内には含まれません。
スペーサー獲得には,すでに獲得しているスペーサーと同じ起源の核酸を獲得する場合もあるようで,これをプライム型といいます。これはI型CascadeとCas3によるターゲット切断機構が関係しています。同じ外来遺伝要素からのスペーサー獲得は無駄のようにも思われますが,相手が対抗的に頻繁な変異を起こすような場合,類似塩基配列の外来DNAをいち早く獲得できるという点で有効なのかもしれません。一方,初めての外来核酸の獲得はナイーブ型といいます。
3-2. Expression - crRNA生成 -
Expressionは,CRISPR配列から免疫記憶の実体であるスペーサー配列をcrRNAとして生成する過程です。
この過程はI型・III型とII型では大きな違いが見られます。まずI型・III型です。
基本的にはcrRNAはCRISPR配列から丸ごと一括転写されます。この転写はリーダー配列内にあるプロモーターから行われるもので,通常の酵素,つまりハウスキーピング酵素が使われます。長いままのcrRNAはpre-crRNAと呼ばれますが,リピート部で切断され短い個々のcrRNAが生成されます。この後型によってはさらに5'-,3'-末端の処理が行われます。
crRNAの切り出しを行うのは,I型ではCas5ないしはCas6,III型ではCas6です。I型ではcrRNAはCas7を中心としたCascade集積のベースとなります。III型でもCascadeに似た構造のCsmやCmrと呼ばれる複合体にcrRNAは結合します。Casタンパク質が数珠のようにつながり,そこにcrRNAが横たわるといったイメージです。
II型の場合,crRNA生成にはcas遺伝子近隣(II-A型では上流の対向鎖)にコードされた小さなRNAが関係します。これをtracrRNAと言います(trans-actingなcrRNA,という意味ですが,化学で習ったtrans,cisとは随分意味が違います)。このtracrRNAとCas9がpre-crRNAに結合し,RNaseIIIによって切断されることで,ターゲット切断のための複合体,crRNP複合体(CRISPR ribonucleoprotein complex)を生成します。変わり種はII-C型です。この型は,CRISPR配列の各リピートにプロモーターを持っているので,長いpre-crRNAなど生成せず,それぞれのスペーサーごとに転写されcrRNAを生成します。
科学者は目聡く,こういう少ないパーツで塩基配列特異的にDNAを切断する現象に注目するんですね。さっそくこのtracrRNAとcrRNAを人工的に1つのRNA(single guide RNA,sgRNA)として合成し,Cas9と組み合わせ,ゲノム編集ツールを作り上げたというわけです。
3-3. Interference - ターゲット切断 -
Interferenceは,crRNAをもとに,再度侵入してきた外来核酸を見つけ切断・分解する過程です。
I型,II型では,crRNPが外来核酸をスキャンし,PAMをチェックします。PAM認識が行われると,外来DNAは二本鎖が解かれ,ターゲットとなる配列がcrRNAと相補的塩基対形成をします。そして,I型ではCas3,II型ではCas9がターゲットの切断を行います。
III型ではターゲットとなる外来RNAはcrRNAと塩基対を形成しますが,さらにcrRNAのリピート由来部分が塩基対形成をするかどうかで自己・非自己の識別を行っているようです。ターゲットを切断するのはCsm3,Cmr4です。
4. 疑問
それで,疑問です。
4-1. どのようにして外来核酸を見つけるのか。
外来核酸の認識にPAMが関係するとしても,塩基配列は二本鎖を解いてみないことには判別できませんし,PAMはとても短いです。それで外来核酸と判断できるのでしょうか。今回読んだレヴューの中で,このことについて記載している事例は1つ,E. coli のものです。
関係するのはRecBCDというエンドヌクレアーゼです。RecBCDは二本鎖切断DNAを見つけると直ちに二本鎖を解き,その末端からChi配列という8塩基対からなる特異的配列に至るまでDNAを切断して行きます。その時の断片が外来DNAとしてCas1・Cas2複合体に捕捉されるのではないかというものです。バクテリアのゲノムにはそもそも二本鎖切断点がありません。発生するのは複製時に失敗が起こった時で,RecBCDはその補修に関わる酵素複合体ですが,ウイルスなどのDNAは直鎖状で侵入してきますし,仮にプラスミドのように環状であっても複製機会も多いのでこのRecBCDに処理される機会が多いというのです。また,E. coli ゲノムにはこのChi配列が多いので,自己DNAを処理する際にはRecBCDがゲノムを大きく分解してしまう危険性も少ない,つまり自己・非自己認識にも一役買っているというわけです。
これが実際にCRISPR-Casにおける外来核酸の認識に関係するなら,RecBCDもCIRSPR-Casシステムの中に含めて考えないといけないくらい重要なしくみと言えるでしょう。しかし,RecBCDの話はI-E型の大腸菌でのもので,他はよくわかりません。
Cas1・Cas2複合体は,四六時中細胞質内を探査しているのでしょうか。フラフラ漂っている核酸を見つけると手当たり次第に塩基配列をスキャンしているのでしょうか。自己・非自己の識別率,外来核酸の発見精度が気になります。
"CRISPR'S MYSTERIES"を参考にするなら,自分のDNAを間違ってスペーサーにしてしまっても想定内,バクテリア集団内でわずかな個体でも防御に成功できれば種として生き残れる,ということでしょうか。
原核生物の獲得免疫システム,という「ふれこみ」が問題で,案外大雑把なものなのかもしれません。
4-2. スペーサーの管理はどのようにしているのか。
CRISPR-Casの記憶容量はどれほどなのでしょうか。種によってスペーサーの数に違いがありますが,確かなのは,記憶できるスペーサーの数には限りがあるということです。
新規にスペーサーを獲得する一方で,古いスペーサーを廃棄するしくみも必要になりますが,それはどのようにして行っているのでしょうか。CRISPR配列の先頭ほど新しいのであれば,末尾から廃棄されるといったルールがあるのでしょうか。
先頭スペーサーほど発現量が多いという報告もあるようですが,一括してpre-crRNAが転写されるはずなのに不思議です。
4-3. CRISPR-Casシステムの費用対効果はどれほどか。
CRISPR-Casシステムは,84% の古細菌,45% の真正細菌で見つかっているといいます。この差は調査の偏りによるものという考えもあるようですが,少なくともすべての菌がこのCRISPR-Casシステムを保有しているわけではないようです。なぜ一部の細菌はCRISPR-Casを持っていないのでしょうか。
"CRISPR'S MYSTERIES"には,ホストが変わるとCRISPR-Casシステムを捨ててしまう病原菌がいることが紹介されています。また,スペーサーの塩基配列を人間の持つウイルスデータベースと比較すると,3% しか見つからないという話も紹介されています。それだけ,我々はウイルスの世界を知らない,とも言えますが,一方で,それだけCRISPRーCasは「ゴミ」情報を抱えているのかもしれません。ウイルス・ゲノムが変異することで,スペーサーは「ゴースト」情報になっているかもしれない,というわけです。
crRNAを生成するためには長いpre-crRNAの転写が必要です。Casタンパク質の生合成も必要です。CRISPR-Casシステムを運用するにはそれなりに物質とエネルギーが必要です。そのコストに見合うだけのはたらきをCRISPR-Casはしているということなのでしょうか。
4-4. CRISPR-Casシステムの起源は何か,どのように進化してきたのか。
CRISPR-Casシステムには水平伝搬が関係しているようで,CRISPR-Casの起源や進化の道筋を追うのは難しいかもしれません。実際,CRISPR-Casシステムにはcasposonと呼ばれるトランポゾンが関係しているという報告があるようです。スペーサー獲得手順やリピートの回文配列など,確かにレトロウイルスやトランスポゾンを想起させます。脊椎動物の免疫システムにもトランスポゾンが関係しているという考えもあるそうで,今後の研究が楽しみです。
4-5. CRISPR-Casは他にどのようなはたらきをしているのか
免疫は本業なのでしょうか。どうやらCRISPR-Casシステムにはいろいろ副業があるようです。DNA修復,欠陥タンパク質処理,新規遺伝子獲得,病原性制御,遺伝子制御,いろいろ関係しているようです。ヒトがゲノム編集に使うくらいだから,当の細菌類だって利用するでしょうね。これも今後の研究が楽しみなところです。
さて,長い手紙になってしましました。いかがでしたか。CRISPR-Cas9によるゲノム編集が広く使われてきているのに対し,そもそものCRISPR-Casシステムについては本質的な部分で不明なことが余りに多いことに気付くと思います。
大学で勉強したことで私の知識を書き換えるものがあればぜひ教えて下さい。では,体を大切にして下さい。
草々
2017年3月 1日
今回読んだ総説は以下の通りです。
  1. Rath D, et al. The CRISPR-Cas immune system : Biology, mechanisms and applications. Biochimie. 2015; 117:119-128. doi: 10.1016/j.biochi.2015.03.025 [PubMed: 25868999]
  2. Amitai G, et al. CRISPR–Cas adaptation: insights into the mechanism of action. Nat Rev Microbiol. 2016; Feb;14(2):67-76. doi: 10.1038/nrmicro.2015.14 [PubMed: 26751509]
  3. Plagens A, et al. DNA and RNA interference mechanisms by CRISPR-Cas surveillance complexes. FEMS Microbiology Reviews. 2015; 39(3). doi: 10.1093/femsre/fuv019 [PubMed: 25934119]
  4. Charpentier E, et al. Biogenesis pathways of RNA guides in archaeal and bacterial CRISPR-Cas adaptive immunity. FEMS Microbiology Reviews. 2015; fuv023, 39, 2015, 428–441. doi: 10.1093/femsre/fuv023 [PubMed: 25994611]
Natureの記事は以下のものです。