放牧37日目-1「Pubchemの使い方を学ぶ-4」

120223 09:00~12:30
120224 09:00~16:00

おはようございます。3日連続で更新です。
今日は、PubChemを調べるにあたり、chalkless氏からの金言で
「まずは、Helpとか読むのではなくて何か実行してみろ!!」
との事だったのでまずは色々操作をおこなってみることにしました。
(これまでは常に説明を読みきってから実行に移る生活でした・・・これは
ウエット系の実験をする際に身に付いてしまった習慣です。実験(WSNブロッティングなり、ChIPなり)をする時のプロトコル中に、理解できていないことがある場合にはまだ始めないって感じで、今後は中庸を行けるようにします。)
それで、今回、色々さがすために利用する物質は
・Curcumin
 ウコンの根から生成された物質で、ヒストンアセチルトランスフェラーゼ(p300/CBP)の阻害剤として働きます。
 (Balasubramanyam K. el tal.,J. B. C., 279,51163-51171(2004))
・hydroxyurea
 リボヌクレオチドレダクターゼを阻害してDNA 複製を阻止する抗腫瘍物質です。
 細胞周期をS期で停止させます。(201006.039.ProNet(1))
・Methyl methanesulfonate(MMS)
 DNAのアルキル化剤でDNA損傷をもたらします。
の3種類にしました。

①全体として調べた場合

まず、PubChemのトップページを開くと
 BioAssay
 →実験系についてのキーワード(ex; Cancer cell line)を入力することで、そ
  れに相当する実験系やそこで利用されている化学物質を表示する
 Compound
 →キーワードを入力することで、目的の物質を検索することができます。
  ここではSubstanceに登録された物質のうち、重複を除いたものが表示
  されます。
 Substance
 →キーワードを入力することで、目的の物質を検索してくれるところまでは
  同じなのですが、こちらは登録されている全ての物質を検索します。
  すなわち、同じ物質が複数個ヒットすることも往々にしてあります。
の3つのカテゴリーがあります。

なお、これらについてAdvanced Searchが存在し。
 ・BioAssayでは
   検索分野/論文が発表された日付/利用された物質の濃度/アッセイの方法
  などで絞り込んで詳細検索できます。
 ・Compoundでは
   化学物質の特性(XLogPや水素結合の数など)/利用されている元素/ソース
  などで絞り込んで詳細検索できます。
 ・Substanceでは
   Compoundと同じ条件で絞込み検索を行うことができます。

また、その下には
 Chemical structure search
 →化学物質の名称や構造(どの元素を持っているか; C6H6と入れるとベンゼン
  を表示してくれる。)から物質を検索することができる。
 BioActivity analysis
 →化学物質の名称やIDを入力することで、目的の化合物が利用されている
  実験方法を検索することができる。
があります。

また、その下にはTTD(Therapeutic Target Database;病気の原因となっているタンパク質や核酸に働きかける化学物質についてのデータベース)に登録されている化学物質を検索することができるStructuresという機能も存在します。

更に、右側には
 Bioactivity summary
 Bioactivity database
 Bioactivity structure-activity
 Chemical structure search
 3D conformer viewer
 Chemical structure clustering
 Deposition gateway
 Structure download
 Bioassay download
 PubChem FTP
の各項目が存在し、それぞれで化学物質を名称や構造で検索すると上記した
カテゴリーの情報を表示してくれます。

②Compoundで検索を行った場合
 さて、それでは詳細な検索に移ります。まず、Compoundで検索した場合です。というのも、デフォルトではCompoundで検索されるようにPubChem上で設定されているからです。
 Compoundは登録されている化学物質にリダンダンシーは無いという点でSubstanceよりは利用しやすいし、PubChemを利用する層が「まずは化学物質を知りたい」というものでBioAssayは後でいいかなと考えるのではないでしょうか。
 
 それで、実際に「Curcumin」を検索してみると19個の構造が得られました。ページの使用はNCBIが作成しているので仕樣はPubmedなどと同じです。左上にはDisplay Settingsが存在し、Format、Item per page、Sort byで変更することができます。
 ・Format
  →Summaryだと2次元的に示された構造の図の他に化学式と分子量、別名
   (慣用名)が書かれています。
 ・Synonyms
  →Summaryで表示されていた化学式、分子式が無くなり、BioAssayにおい
   て有意に利用された件数、及びBioAssayに利用された件数(有意かは問わ
   ない)が表示されている。
 ・Properties
  →構造の図が無くなり、分子量、水素結合供与体となる原子数、水素結合受
   容体となる原子数などが表示されています。
 ・CID(Compound acession identifier:PubChem Compoundに登録された
  物質に振られる固有のID)
  →検索結果で表示されたCIDのみを表示します。
また、AID(PubChem's BioAssay identifier:PubChem BioAssayに登録された物質に振られる固有のID)や、分子量、発表された年度の順などで並び替えることもできます。更に、1ページあたりに表示する数も変更することができます。

そして、右上の「Send to」を押すと、File形式を選択して外部に送ったり(なお、Manage Filtersを押すとNCBIからメールが来るアドレスを登録することができます)、Clipboardとしてお気に入り登録したりすることもできます。

更に、右側の
 ・Actions on your results
  →BioActivity AnalysisやStructure Clusteringでは、得られた結果を条件に
   従ってまとめてくれます。
 ・Refine your results
  →リピンスキーの法則に合致するか、BioAssayが行われているものがいく
  つあるかなどの条件で結果を絞ってくれます。
 ・Find related data
  →NCBIが作成している他のサイトに今回調べた化学物質の使用例が存在す
   る場合には検索することができる。

また、名称をクリックすると詳細ページに飛びますが、そこでは化学物質の構造をASN、XML、SDFでダウンロードすることができます。

sdfでダウンロードしたものは、GLmolで確認することができます。
http://webglmol.sourceforge.jp/glmol/viewer.html

③BioAsaayで検索を行った場合
 次に、BioAssayで検索を行うと、結果が2170個でてきました。Assayの分類には
 ・Primary Screening
  →化学物質の濃度については1パターンのみ行っている場合。
 ・Confirmatory
  →化学物質の濃度を何種類も変化させて、EC50/IC50(50%阻害濃度 in
   vitro / in vivo)などを求めている場合。
 ・Summary
  →いくつかのアッセイ結果をまとめる形の実験を行なっている場合。また、
   実験結果より導き出される結果をサポートするような実験に利用されてい
   る場合。
 ・other
  →これらのカテゴリーに含まれない場合。
が存在します。また右側にはComponentの時と同様に
 ・Actions on your results
 ・Refine your results
が存在します。

Substanceで検索を行った場合
 最後に、Substanceで検索を行いました。結果の表示のされ方はComponentと同じです。しかし、重複を許すため115件の結果が得られました。