Refmac/cootでrefinement (finish編)
180423 S. Fushinobu
Cootを初めて使った時にこれを書いてからずっと書こうと思って書けなかった項目。精密化を終わらせる時に気をつけること、構造の間違いを見つける方法など。1.6 ~ 2.5 Åくらいの分解能を想定して書いています。
Softwares
- CCP4(i) 7.0.055, Refmac5.8.0222, Coot0.8.9.1 on macOS High Sierra (10.13.4)
Cootの準備とFit Protein
- まず、Draw -> Cell & SymmetryでShow Symmetry Atoms?をYesにすることと、Measures -> Environment DistancesでShow Residue Environment?にチェックを入れておくのは、protein crystallographerのたしなみ。
- Emsleyのcoot key bindingの設定は必須。これなしで精密化するなんて苦行以外の何物でもない。私は、r, t, j, w, q, yあたりを多用しています。ただしw(水を加える)は、一度は右の柱メニューのPlace Atom At Pointerを使って自分のmoleculeに水を加えておかないと、New Moleculeに加わってしまうので注意。
- CootのExtensions -> All Molecules -> Fit Protein、は結構いいです。
- ただしある程度の分解能があって、電子密度が比較的よい部分に有効。最初は怖かったけど、今では改良もされているのか、そんなに問題ないと思う。
- Validate -> Geometry Analysisでウィンドウを出しておくと、進行具合が分かって便利。
- Density Fit + Geometryなので、R/Rfreeは少し上がるかもしれないけど、マップが良ければ、早めの段階で一度はやっておくべきだと思う。小さいタンパク質/速めのPCならばコーヒー入れている間に終わったりする。眺めてるだけでも楽しいし。
- ちなみにReal space fitの時のgeometryとmapのweightは、右の柱メニューのRefine/Regularize ControlのWeight Matrixで変えられる。最適値のEstimateもできるみたい。
BUCCANNERが作り損ねた側鎖を見落とさない (2022.6.5追記)
BUCCANNERが側鎖をbuildしないでCβまでしか作らないで放置していることがあります。Calculate - Modelling - Residues with Missing Atomsでチェックしておきましょう。
水の拾い方/削り方
- ARP/wARPやPHENIXのmodel buildingなどで自動的に拾ってくれる水はとてもクオリティがいい(変な水を拾わない)ですが他にも方法あります。以下2つ挙げます。
- 1. RefmacのRun Coot:findwaters to ... のチェックボックスを入れると(ccp4iの場合)、精密化と同時に拾ってくれます。結構積極的に拾ってくれる印象。以前、これは近い水を拾いすぎる(し、チェインをバラバラに拾い散らかすし、結構時間もかかる)のが嫌だったけど最近は改善されているみたい。
- 2. CootのCaltulate -> Other Modeling Toolsのウィンドウの中からFind Waters。こっちは少し慎重に拾う印象。後々のために、タンパク質にあまり近い水は拾わないほうがいいと思う。Minimum distance to protein atomsを2.3から2.4にするとよい。
- CootのValidate -> Check/Delete Watersでチェック。PDB登録時にあまりに近い所にある水があると問題になるので、それを減らす(無くす)。水に中ボタンでセンタリングしてrボタンを押すと自動的にpeak maximumに動く。消すかどうか判断するのはその後でも遅くない。
- ActionをCheckにして一つ一つ見て/直していくのが基本だが、あまりに多い場合には距離を厳し目にしてActionをDeleteにして一気に消すのもよい。
- 電子密度があまりに弱い水も削っておいた方がよい。そんな水は沢山拾ってもそんなにRは下がらないので。シグマ値で1にして見えない(もしくはちょっとしか見えない)のは削る、のが大体の目安でしょうか。
- 近くにある2つの水でどっちを消すか迷った時、中ホイールでシグマを上げていって、電子密度が強い方を残すのが基本だが、周囲の水素結合パターンも参考にするとよい。
- 水の位置がSymmetryの向こう側にあって変だなと思ったら、まずはExtensions -> Modelling -> Arrange Waters Around Proteinをかけてみる。それでも直らない場合には手で直すしかない。(Symmetryの暗い側の水に中クリックでセンタリングして、その水をDeleteして、そこにPlace Atom At Pointer or wボタンで再び水を置く)
MolprobityでHis/Asn/Glnフリップのチェック
- 周囲の水素結合パターンを見ながら逆に入っていると思われる残基をリストアップしてくれる。
- 確信的なものから微妙なものまで色々出てきますが、構造を見ながら直していって下さい。私は基本的には従っていますし、一度はチェックしておくべきだと思います。公開された構造のHisの向きが明らかに逆だと少しイラつくでしょ?
- MolProbity -> Evaluate X-ray structure -> Choose a structure -> PDB fileを選択してUpload this file -> (Job is running.. finished) -> Continue -> Add hydrogens -> デフォルト(Asn/Gln/His flipsにチェックが入った状態)でおもむろにStart adding H。
- Cootの右の柱メニューのSidechain 180° Flipが便利。
CootのValidationメニュー
- 必ずやるのは以下
- Ramachandran plot。外れた所をクリックして見に行く。まずtを押して改善するかどうか見る。
- Kleywegt Plot(非対称単位に複数分子がある場合)。別のチェインの同じ場所(同じ向き)に行くのはCtrl + O。
- Unmodelled blobs。リガンドや拾いきれていないタンパク質(ペプチド)フラグメントが見つかる。
- テトラポッドみたいなのが見つかったら、結晶化条件に硫安(sodium sulfate)を使ってないか再チェック。
- 低分子量PEGはヘビみたいに見える。
- 金属の配位の様子や(CheckMyMetalが参考になる)、Tris、MES、HEPESなどよく使うバッファーの形、なども調べておくようにしよう。
- ただしリガンドなどをおく時は周囲の状況に注意して。水素結合パターン、静電的相互作用(陰イオンのそばには普通ArgかLysか主鎖のNH(ヘリックスダイポールのN末側も)がある)、疎水相互作用、スタッキング(π-π)相互作用、π-カチオン相互作用など。これはタンパク質部分をモデル構築するときも共通の話ですが。
- Difference Map Peaks。精密化サイクルの終わり頃にやるとよい。側鎖や主鎖のカルボニルがはまってなかったり、拾いきれなかった水があったり、結構発見があるので、できるだけ下の方まで見るのをおススメします。
- Geometry Analysis。飛び出してる赤っぽい所に動いておもむろにtやrを押すとぐんと下がることがあるのでやってみるべし。
- Density fit analysis。少し感度が悪いけど、必ずやっておいた方がよい。ただし分子表面で側鎖が泳いでるようなところはどうしても高く出るので無視。
- Probe Clashes。何も出てこないこともあるけど、クラッシュは敵なので。
- Highly coordinated waters。ガセ(偽陽性)も多いけど、金属の拾いそこねはイヤですよね。
- Alignment vs PIR。.pirファイル(一行目を>とタンパク名(コメント)、2行目は空、3行目から1文字のアミノ酸配列、にしたテキストファイル)を読み込む。色々いじくってるうちにうっかりアミノ酸を変えちゃったりすることもあるので、終わり頃に一度はやっておいた方がいいでしょう。
- やっておくといいかなと思うものたち
- Incorrect Chiral Volumes。あんまり何も出てこない。
- GLN and ASN B-factor outliers。あんまり出てこないけどまぁ一度くらいやってみては。
- NCS differences。Kleywegt plotじゃわからない側鎖の差も見せてくれる。元々そうなってる場所もあるけど、修正箇所を発見するきっかけになることもたまにある。
- あんま意味ないかも、と思うものたち
- Peptide omega analysis。ペプチド結合が平面からズレてる場所が赤くなるけど、そもそも直せない(マップがそうなってる)ことも多い。
- Temp. fact. variance analysis。意味があんましよく分からない。ごくたまに、側鎖が外れてれる場所を引き当てることもある。
- Rotamer analysis。PDB上でマイナーなロタマーには赤が出るが、マイナーだろうが構造上そうなることはあるので、別に無理に下げなくても良い。見た目正しいように見えて赤いのは、j -> r (t)とか押したら改善するかも。
- Pukka puckers .. ? 核酸のリボースとかなのかな。あまり使ったことないです。
- 最後に、Extensions -> Modelling -> Renumber Watersをかけておくと水の残基番号がそろう。
Refmacのかけかたについて
- 特にこれといったコツはないですが、思いついたことをいくつか。
- 標準的でないリガンドが入っている場合には、JLigand、Sketcher、PRODRGなどで作ったcifファイルを読み込む。
- ScalingはSimpleよりBabinetの方がいいと思う。Babinetの原理に基づいたexponentialなscaling modelによるbulk solvent correctionをやってくれる(らしいぞ)。少し時間が多めにかかるけど、結果的にちょっとRが下がることが多い。
- R-work/R-freeを必ずチェックする。あんまりサイクル回数を多くかけるといわゆるover refinementになり、Rfreeがズルズル上がってくるのでほどほどに。
- どうしてもRが下がらないな―、と思ったら、一度くらいは、twin refinementを試してみる(上の方のタブで選べば簡単にできる)といいでしょう。とくに効果がなければ普通の方法にもどすべし。
Validation by servers
では、グッドラック。