ブックタイトル日本結晶学会誌Vol61No3

ページ
15/60

このページは 日本結晶学会誌Vol61No3 の電子ブックに掲載されている15ページの概要です。
秒後に電子ブックの対象ページへ移動します。
「ブックを開く」ボタンをクリックすると今すぐブックを開きます。

概要

日本結晶学会誌Vol61No3

日本結晶学会誌61,159-160(2019)最近の研究動向Protein Data Bankで利用するPDBx/mmCIF形式について大阪大学蛋白質研究所Gert-Jan BEKKER,工藤高裕,池川恭代,山下鈴子,栗栖源嗣Gert-Jan BEKKER, Takahiro KUDOU, Yasuyo IKEGAWA, Reiko YAMASHITA andGenji KURISU: PDBx/mmCIF Format Mandatory for Protein Data Bank Deposition2018年11月2日,英国CambridgeのMadingleyHallにおいて開催されたWorldwide Protein Data Bank(wwPDB)諮問委員会において,「2019年7月1日より蛋白質構造データベース(Protein Data Bank; PDB)に結晶構造をデータ登録する際に,PDBx/mmCIFフォーマットを必須とする」という方針決定がありました.アジア・中東地区からのデータ登録に責任をもつ立場として,新しい方針を決めるに至った経緯をご説明し,より快適で効率的にPDBx/mmCIFフォーマットを活用して頂くための情報を提供いたします.われわれに馴染みの深い80列固定のPDBフォーマットは,登録フォーマットとして1976年春から必須化されました.1)本誌19号(1977年)に,安岡則武先生(大阪大学工学部),角戸正夫先生(大阪大学蛋白質研究所)によるPDBフォーマットでのデータ登録についての解説記事が掲載されています.2)古いパンチカードの制限に適合するよう,以下のとおり実際には1行70カラムでPDBフォーマットは記述されています(図1).このフォーマットは人が判読するのには便利ですが,40年前には想定されていなかった構造解析技術の向上と情報量の増加により,大きな問題に直面しました.まず,62を超えるChain IDまたは99,999個を超える原子数をもつ大きな構造を記述できないというサイズの問題です.1994年に初めて,エントリーを2つのPDB IDに分割して記述しなければならない事態が発生し(βガラクトシダーゼPDB ID:1BGL,1BGM)その後も分割が必要な構造が登録されています(現在は,mmCIFフォーマットで記述し直しているため分割は解消しています).また,化合物IDは3文字以内という前提で設計されているため,IDが枯渇し4文字以上に拡張しないと記述できなくなります.現在の最大3文字IDが枯渇するのは2021年頃とみられており,その頃にはPDBフォーマットを廃止せざるを得なくなります.3)さらに,X線結晶構造解析の過程で計算される統計値をPDBフォーマットのREMARK欄ではすべてを記述することはできず,データ検証を十分行えないという点も問題です.そこでwwPDBでは,主な構造解析ソフトの開発者やIUCrの生体高分子委員会委員などにWorking Groupに参加いただいて新フォーマット(PDBxフォーマット)について議論を重ね,CIFの辞書を拡張しNMRや電子顕微鏡の構造も記述できるよう拡張した「PDBx/mmCIF」(PDB Exchange/Macromolecular Crystallographic Information File)を新フォーマットとして採用することにしました.その後,2012年のwwPDB諮問委員会で承認され,2014年にwwPDBの正式なマスターフォーマットとなりました.(2014年以降も,PDBx/mmCIFから変換した古いPDBフォーマットのデータも提供を継続していますが,古いPDBフォーマットに変換できない巨大構造や2文字以上のChain IDを使っている構造はPDBx/mmCIF形式でのみ提供しています.)PDBx/mmCIFフォーマットは,STAR(Self-definingText Archive and Retrieval)文法で記述され,記述ルールはPDBx辞書(PDB exchange dictionary)で定義されています.機械処理にも向いていて,統計値なども完全に記図1古いPDBフォーマットで記載された座標の例(PDBID:1KUH).(Example of old PDB format(PDB ID:1KUH).)Chain IDは22カラム目に1文字で,化合物ID(残基ID)は18~20カラムに3文字以内で表記される.図2 PDBx/mmCIFフォーマットで記載された例.(Examplesof PDBx/mmCIF format.)(A)cellカテゴリ:keyvalue,(B)entityカテゴリ:loop(PDB ID:1KUH)日本結晶学会誌第61巻第3号(2019)159