ブックタイトル日本結晶学会誌Vol56No4

ページ
33/116

このページは 日本結晶学会誌Vol56No4 の電子ブックに掲載されている33ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。

日本結晶学会誌Vol56No4

ブックを読む

Flash版でブックを開く

このブックはこの環境からは閲覧できません。

概要

日本結晶学会誌Vol56No4

X線自由電子レーザーを用いたタンパク質の構造解析図5SFX回折強度データの処理の流れ.(Data processingsystem.)得られる.結晶の対称性や密度などの条件にもよるが,おおよそ数時間の測定でデータセットを得ることが可能である. 8個のCCDユニットのデータは,それぞれ,ストレージに保存される. 1単位の測定セット(Run)の枚数は自由に決められる.通常,バックグラウンド補正用に150枚(X線なし)と5000枚のSFXイメージという組み合わせを用いている.このRunを複数回測定してデータセットを作成する.データ収集が完了したのち, 8個のCCDのデータを1枚のイメージにマージする.このときCCD間のゲイン調整,位置補正が行われる.位置補正には最近接法が用いられている.この結果作製されるデータは, CCD検出器の隙間も含めて2399×2399ピクセルで, 1ピクセルデータは4バイトデータとなり, 5000枚のイメージが梱包された1つのファイルサイズは約110 GBにもなる.データ形式はHDF5(米国NCSAで開発された)であり,衛星データの一般的な表現型である.これは大容量のデータを取り扱うのに適しており,優れたポータビリティを特徴とする.このデータ変換が一番時間のかかる過程である.そこで測定が終了すると即座に1つのRunを複数に分けてデータ変換するスクリプトが施設から提供されている.これにより,測定しているサンプルがデータセットをコンプリートできる品質か否かを評価し,コンプリートするにはどれだけの時間が必要かを見積もることもできる.通常の放射光実験と同様に,回折反射の指数付けと積分を行うが,それに先立ち,大量の画像データの中で,回折点が含まれる画像を抽出する. LCLSではCheetah 7)というソフトがこれを担う.われわれはpythonでコードした独自ソフトにより中心付近の限られた領域の最高強度を指標として選別し,個々のイメージファイルとして出力している.中心付近の領域を使うのは水や高粘度剤からの散乱の影響を避けるためである.これ以降はCrystFEL 8)による処理になる. CrystFELはSFXデータの処理を行うためにThomas A. Whiteらによ日本結晶学会誌第56巻第4号(2014)り開発されたソフトで, 12種のプログラムからなる.数万枚から数十万枚に及ぶ収集イメージの指数付けと積分をindexamajiが担う.膨大な回折イメージを実験期間中に自動で処理するためにindexamajigは並列計算が可能なようにコードされている(SACLAでは12コア×80ノードのクラスターマシンが利用可能).指数付けに使用するピーク位置の情報はあらかじめHDF5ファイルに書き込んでおく(cheetah使用時),あるいはindexamajigでピークサーチを行う. Indexamajigを用いる場合は,ピークサーチ条件の設定を注意深くしないと,指数付けできるイメージの枚数が少なくなる.ピークはさらに検出器の端かどうかなどの評価を受け,クリアーしたものが指数付けプログラムに渡される.指数付けには現在, DirAx, MOSFLM, XDSが利用できる.振動法の実験と大きく異なるのは, 1ショットごとに結晶サイズ,方位,ビーム強度,スペクトルさえも異なることである.さらにイメージはすべて静止写真である.部分反射のデータを完全な強度データにするにはprocess_hkl(モンテカルロ積分アルゴリズム)を用いる.これはショットごとに違うビーム強度,エネルギープロファイル,結晶サイズのばらつきをすべて加味して(無視して),平均して強度を算出する.結晶の対称性にもよるが3000枚以上のイメージの指数付けができれば,電子密度が得られる.すべて部分反射であるため,通常用いられるR mergeをデータ評価に使うことができない.そこで積分できたイメージ集団を2分割して,それぞれを独立にマージして強度データを作成し, 2つのデータ間のR値(R split)や相関係数(CC1/2)を指標として用いる(compare_hklで計算).指標はどの分解能まで使えるのかの目安にはなるが,最終的には電子密度を確認して分解能を決めるのが現時点での最良の方法である.すべて部分反射の回折データであるために,高いデータ精度が必要なde novo phasingにはredundancyが重要となる. 9)ただし,差フーリエで異常分散シグナルを見るだけなら,それほど多くのRedundancyは必要ない.強度データはその後,放射光で測定したときと同様にCCP4形式データに変換し,分子置換,精密化に使われる.SFX特有の問題として, P3, P4, P6系統の空間群では,処理した結果は擬似的な双晶状態(indexing ambiguity)になってしまう.これは, 1イメージごとに指数付けを行うため,同じ長さの軸の取り扱いが2種類生じてしまうからであり,現在では避けようがない.その他の空間群,例えば単斜晶系においても,格子の取り方により軸長や角度があまり変わらない(振動法では容易に判別可能)場合には,見かけ上双晶となる. K. Diederichsらにより,クラスタリングを用いたアルゴリズムが開発され, 10) CrystFELやcctbx.xfel 11)に実装されている.このアルゴリズム処理前後で電子密度の様相は大きく変化するので,この擬似双晶問題の解決は今後も重要な課題となろう.245