얼마 전 논문을 내면서 시퀀싱 데이터를 ENA(European Nucleotide Archive)의 SRA(Sequence Read Archive)에 보낼 때 썼던 프로토콜이다. 처음에는 파일용량이 하나당 수십 GByte인지라 FTP는 불가능 할 것 같고 하드디스크를 구입해서 보내려고 했으나 ENA 쪽에서 Aspera라는 commercial 고속 파일 전송 프로토콜을 추천, 사용해봤는데 정말 빠르더라~
ENA-SRA에서 파일 전송에 대한 설명 페이지:
맨 아래에 보면 Aspera로 전송하는 방법에 대해 나와있다.
여기서 제공하는 링크에서 Aspera ascp command line client를 받아 사용했다.
(CLIENT SOFTWARE 중 aspera connect를 받아야 함)
Command line의 형태는 아래와 같다.
ascp -QT -l300M -L- <file to upload><era-drop-N>@fasp.sra.ebi.ac.uk:/.
-l300M: 업로드 속도를 30MB/s로 한정. 안정적 전송을 위해서 이 수치를 줄일 필요가 있을지도 모른다고 하지만 무시하고 그대로 씀.
-L-: 전송 중 logging. 이 옵션을 사용하면 전송 중에 수 많은 log line들이 나온다. 안 써도 상관은 없겠지만 그래도 전송되고 있는 것을 확인하고 싶으면 사용하는게 좋을 듯
<file to upload>: 말 그대로 전송할 파일. "*.txt.gz" 와 같은 형태로 써 줘도 된다.
<era-drop-N>: 이건 ENA-SRA에서 제공되는 Aspera login ID
이렇게 한 줄 써주면 파일이 쓩쓩쓩 전송되요~ 그것도 아주 빨리!
댓글 없음:
댓글 쓰기