Transcription factor footprinting analysis
이전 글에서 ATAC-seq을 높은 coverage로 읽게 되면, transcription factor들의 정보들까지 얻을 수 있다고 하였다.
그게 어떻게 가능한 걸까?
ATAC-seq으로 얻은 read들은 histone 단백질에 느슨하게 감싸져 있는 open chromatin region들로, 이 영역에 존재하는 motif 서열을 유전자 조절에 중요한 역할을 하는 단백질이 인식하여 binding 할 수 있게 된다. 이렇게 단백질이 binding 하면 이 영역은 open chromatin region에 비해 “상대적으로” tagmentation이 덜 일어나게 되고, 이는 sequencing alignment 결과에서 움푹 들어간 형태로 나타난다 (그래서 발자국이라는 표현을 사용한다). 이렇게 움푹 들어간 영역의 DNA 염기서열을 알려진 transcription factor binding database (e.g.JASPAR)와 비교하여 motif의 정보까지 얻을 수 있으며, 이를 바탕으로 open chromatin region에서 유전자 발현에 관여하고 있는 transcription factor들의 정보까지 알아낼 수 있다.
생물정보학은 현상을 더 큰 시각으로 바라보게 하는 것 같다.
이 overview에 압도되지 않고 functional 한 영역까지 채워나간다면 앞으로 더 재미있는 일들이 많이 벌어질 것 같다.
'실험실 > 실험(Experiments)' 카테고리의 다른 글
Chromatin accessibility (1) | 2024.02.02 |
---|---|
Higlass-Ensembl annotation (1) | 2024.01.30 |
Hi-C experiments_Bioinformatic analysis_#1 (0) | 2024.01.21 |
Higlass (0) | 2023.08.18 |
Hi-C experiments_library prep (0) | 2023.07.27 |