cleanUrl: "pisces"
description: "PDB 단백질 구조 데이터셋 구성을 쉽게 해주는 PISCES 서버 사용법을 정리합니다."

PISCES: a protein sequence culling server

PISCES 서버를 이용한 데이터셋 구성 방법

  1. https://dunbrack.fccc.edu/pisces/ 에 접속한다.
  2. 원하는 sequence identity cutoff과 resolution 기준을 선택한다.
  3. Download PDB file를 클릭하여 구성된 데이터셋을 다운받는다.

예시 1

Sequence percentage identity <= 30%
Sequence chain length 40 ~ 10000
Resolution 0.0 ~ 2.0
R-factor value 0.25
X-ray entries include
EM entries exclude
NMR entries exclude
Allow chain breaks yes
Allow disorder yes
Print seqids no

→ 결과: 11,415개의 chain을 얻는다.

예시 2)

Sequence percentage identity <= 30%
Sequence chain length 40 ~ 10000
Resolution 0.0 ~ 1.0
R-factor value 0.25
X-ray entries include
EM entries exclude
NMR entries exclude
Allow chain breaks yes
Allow disorder yes
Print seqids no

→ 결과: 351개의 chain을 얻는다.

예시 3)

Sequence percentage identity <= 30%
Sequence chain length 40 ~ 10000
Resolution 0.0 ~ 2.0
R-factor value 0.25
X-ray entries include
EM entries exclude
NMR entries exclude
Allow chain breaks no
Allow disorder yes
Print seqids no

→ 결과: 9471개의 chain을 얻는다.

예시 4)