scaleit : データ間のスケーリング

CCP4の使い方に戻る

目次に戻る


 ここら辺からデータ処理らしくなってきます。Scaleitでは、一回にいくつもの誘導体データをNativeデータに対しスケーリングできます。プログラムを走らすのは簡単なはずなので、注意事項、出力の見方を次にあげていきます。

データの質について

 このプログラムは、データの質が悪いと上手く走りません。もちろん結果は出ますが、すっきりしない結果になります。データの精度、completenessを出来るだけ上げるように努力して下さい(Rmergeは悪くても10%、completenessは90%以上が望ましい(重原子同型置換体は80%以上あれば、まあ許そう。))。結晶が悪い場合は仕方ないですが、上に書いた程度のデータは普通にやれば集まるはずです。また、最初から、高分解能にこだわる必要はなく、重原子位置を探して、精密化するだけなら3.0Aれば取りあえずは十分です。

スケール因子(グラフ)の読み方

 scaleitを流すと、最後に*印で書いたグラフが出てくるので、まず始めにこれを見ます。scaleitは、overall scale factorとB-factor(等方性、異方性両方のoptionがある)の2つのパラメータを用いて(異方性の温度因子の時は2つじゃないけど。問題:いくつでしょう?)スケーリングを行います。測定が必ず上手く行くという前提があれば、すっきりしています。これに対しshell scalingという方法があります。これは、分解能別に反射データを幾つかのshellに分けて、shellごとにスケーリングをする方法です(温度因子のアジャストも当然行う)。最後に出てくるグラフは、scaleitでスケーリングしたデータをshellに区切り、各shell内でのスケール因子を計算し分解能に沿ってプロットしたものです。全てが理想的になっていれば、スケール因子は全て1.0となり、水平な線に成るはずですが、測定が悪かったりすると、なかなかこうなりません(図を見よ)。もちろんデータが良ければ水平な直線になります(きちんと測定が出来ていれば、普通はこうなる。Nativeデータの測定では、測定したデータ間でscalingした時に、全ての組み合わせで、水平なscale因子の線が描けるようなデータの組み合わせ(出来れば3つ以上)が得られるまで、データ測定を繰り返すべきです。)。この直線(曲線!?)が水平な直線から離れていけば行くほど、スケーリングが上手く行われていないということになります。これを改善する手だては、1)あまりひどくなければ、fhscaleを使って、shell-scalingをするという方法がありますが、2)良い結晶を使ってデータ測定をやり直す、というのが、最も根本的な解決法です。もちろん、重原子誘導体の結晶は、Nativeの結晶ほど質が良くないのが一般的ですので、なかなかきれいな水平線に成りづらいのも確かなようです(反射強度も変化しているので、完全な水平線にはならない。またRFがあまりに大きいときは当然水平線には成らない)。あまり、水平にばかりこだわるのも考え物ですが、あまりにひどいものは、原因を考えてもう一度集め直すべきです(この様な場合は、当然正しいRF値が計算されません。理由を考えよ!)。ここまでの話は、当然Nativeのデータがきちんと集まっていることを前提としています。この保証が無いと、スケーリングが上手く行かない場合、何が原因かはっきり言って特定不可能です。にグラフの例をあげておきます。

RF値の読み方

 重原子同型置換法では同型置換体のRFは15-25%程度が望ましいと思われます。あまり大きすぎても問題ですが、むちゃくちゃに大きくなることはありません。ときどき、RF=50%などと言って玉砕している人がいますが、これは別の問題です。反射の指数の付け方が2通りある場合があり(例えば、P3121, P61 etc)、NativeとDerivativeの間で、指数の付け方がconsistentになっていないだけの話です。自分の空間群を良く理解して大騒ぎしないようにしましょう。また、RFが小さすぎてもダメです。10%以下では、例え入っていたとしても、良い位相をつけるのは困難です。

 アウトプットでもう一カ所見るべきところがあります。R-factor(RF)の少し右の方にweighted Rという値があります。良いデータの場合は、この二つの値が極めて近くなります。RFは大きいのに、weighted Rは小さいという時は、測定のエラーが大きいなどの問題が考えられます(この様な時は、Fの大きい反射は良く一致しているが、小さい反射はあまり一致が良くないということを意味しています)。