본문 바로가기

실험실88

Transcription factor footprinting analysis Transcription factor footprinting analysis 이전 글에서 ATAC-seq을 높은 coverage로 읽게 되면, transcription factor들의 정보들까지 얻을 수 있다고 하였다. 그게 어떻게 가능한 걸까? ATAC-seq으로 얻은 read들은 histone 단백질에 느슨하게 감싸져 있는 open chromatin region들로, 이 영역에 존재하는 motif 서열을 유전자 조절에 중요한 역할을 하는 단백질이 인식하여 binding 할 수 있게 된다. 이렇게 단백질이 binding 하면 이 영역은 open chromatin region에 비해 “상대적으로” tagmentation이 덜 일어나게 되고, 이는 sequencing alignment 결과에서 움푹 들어간.. 2024. 2. 5.
Chromatin accessibility Chromatin accessibility. DNA가 histone 단백질에 느슨하게 감싸져 있는 부분을 open chromatin region, 그리고 단단하게 감싸져 있는 closed chromatin region으로 나누어 생각할 수 있다. 이러한 DNA의 packaging 정도는 유전자 조절에서 중요한 역할을 하는 다양한 단백질들이 DNA motif 서열들과 binding 하는데 관여하며, 따라서 chromatin accessibility는 유전자 조절에서 중요한 역할을 한다. Genome 상에서 이러한 영역을 알아내기 위하여 DNase-seq, ATAC-seq과 같은 기술들이 발전해 왔으며 Chromatin accessibility는 특정 motif나 단백질에 대한 정보 없이 분석이 가능하기 때.. 2024. 2. 2.
Higlass-Ensembl annotation 몇 번 삽을 퍼다 해결하여 정리를 해본다. Genomics에서 gene annotation data는 크게 미국(NCBI)과 유럽(Ensembl)으로 나뉘는 것 같다. 이전에는 NCBI만 사용하지 않았는데, 몸이 유럽에 있어서 그런 걸까? Ensembl이 이제는 더 익숙해졌다. (그리고 Ensembl의 data update 속도가 NCBI refgene 보다 훨씬 빠르다.) 무엇이 익숙한가 보다 더 큰 숙제는 두 개의 annotation algorithm이 일치하지 않기 때문에 항상… 두 개를 같이 보는 습관을 두는 것이 좋다고 생각한다. (NCBI:Refseq / Ensembl: Genebuild) Hi-C data를 Higlss에 upload 하고 gene annotation track을 입히는데, .. 2024. 1. 30.
Hi-C experiments_Bioinformatic analysis_#1 최근 애플에서 비전프로라는 제품을 발표하면서, 공간 컴퓨팅 (spatial computing)이라는 단어를 강조하였다. 나는 그걸 들으면서, Hi-C가 떠올랐는데, 알다시피 DNA는 linear 한 것이 아니라 접혀있고, 구부러져 있고 하기 때문에 공간적으로 바라볼 필요가 있으며, Hi-C는 이러한 DNA를 평면상이 아닌 삼차원에서 보기 위한 하나의 분석 방법이라 보면 된다. Hi-c library를 제작하였으면 이를 sequencing 하여야 한다. 150bp short read pair-end로 읽을 것이며, 원하는 실험의 목적에 맞게 sequencing depth로 읽어 주면 된다. 더 높은 resolution의 정보를 얻고 싶다면, 더 많이 읽으면 된다 (돈을 더 쓰면 된다.) 실험 species.. 2024. 1. 21.