精密化の最後に

010905 S. Fushinobu

CNSで精密化するとき、bindividual.inpをよく使うと思いますが、この中のrweightという値は、ちゃんと入力した方がRが下がります。ちなみに、デフォルトだと、-1で、自動的に計算してくれるようになっています。精密化の一番最後の段階では、必ず行うようにしましょう。

optimize_rweight.inpを使って、rweightを決めてから入力すべし。mtf/pdb/.cvなどの入力ファイルやパラメータは、もちろん、その後に行うbindividual.inpに入れるものと同じものを使う。

minimize.inpなどに使われるwaというパラメータも、optimize_wa.inpで最適化できます。こちらもRを下げるのに有効。 040123追加

その後、xtal_pdbsubmission.inpを通すのが普通と思われます。

ここによると、溶媒分子や、共有結合(2.2 Å以内)していないリガンドには原則chain IDをつけないが、非対称単位中のタンパク質との相互作用を表すために、chain IDをつけることも認める、とあります。

なお、共有結合していないリガンドの場合でも、多糖やペプチドなどの"chain"になっている分子(例えばマルトースなど)には、chain IDを割り振るんだそうです。(PDB編集者の方に教えていただきました。ありがとうございます。)

反射ファイル(mtz)は、以下の例のようなスクリプトを使ってmmCIFに変換する。(ccp4iのConvert from MTZでもできる。データに入れるのは、H, K, L, F, sigF, freeRのみ。)

#!/bin/sh
mtz2various HKLIN yourdata.mtz HKLOUT yourdata.mmCIF << EOF
OUTPUT CIF data_sf
LABIN FP=FP SIGFP=SIGFP FREE=FreeR_flag
END
EOF

重要:PDBへの登録の前には、必ずここに目を通すようにして下さい。

PDBへの登録の最初の段階(precheck)で出てくるモデル分子の配列と、ORFのアミノ酸配列をCulstalなどでアラインメントしてみて、側鎖の置き方に間違いがなかったかチェックする。

PDBへの登録時に書くアミノ酸配列は、「実際に、結晶化に使った蛋白質の配列」を書く必要があります。例えば、His-tagや、cloning artifactで入ったり抜けたり置換したりしたアミノ酸もきっちり書くこと。

PF構造生物学ビームラインの性能表 PDB登録の時に必要な事項(光学系など)が含まれています。


Back