본문 바로가기

실험실88

Higlass Hi-C data를 처음 다룰 때 보면 너무나도 다양한 tool들이 있어 머리가 좀 복잡해지지만, 읽다 보면 Jucier를 이용하거나 또는 Hic-pro를 이용하는 크게 두 가지 갈래로 나누어지는 것 같다. 둘 다 reference genome의 여러 bin으로 표시한 다음, Bowtie2를 이용하여 PE(pari-end) read를 붙이고, 그 bin 내부 또는 bin과 bin 사이의 interaction을 counting 하고 visualization 하는 형식이다. 따라서 설정하는 bowtie2의 parameter에 따라 binding 정도가 달라지며 그 결과는 QC results에서 확인할 수 있다. Pipeline analysis가 끝났을 때 Jucier의 경우 contact map output.. 2023. 8. 18.
Hi-C experiments_library prep Hi-C experiments_library prep Hi-C 실험의 경우 library를 준비하는 과정과, 그것을 sequencing 하고 데이터를 분석하는 과정으로 나눌 수 있으며, 그 시작인 library prep 과정을 살펴보고자 한다. 교수님 께서 Arima Genomics의 Hi-C library kit를 Grant를 통해 제공받았다. 처음 Hi-C library를 제작하여 보았지만 established 된 protocol로 인해 전체 실험 과정에 있어서 솔직하게 어려운 부분은 없었고, 중간중간의 QC step으로 인해 제대로 가고 있는지에 대한 방향성을 확인할 수 있었다. 위는 전체적인 실험 과정의 그림이다. 우선은 순수한 DNA를 얻기 위해 조직을 liquified nitrogen에서 갈아.. 2023. 7. 27.
Orion High Performance Computing (OHPC) 연구원으로 있는 NMBU (Norwegian University of Life Sciences)에는 bioinformatic 분석을 위해 cluster를 구축하고 있으며, 현재 1680개의 CPU와 12T의 Ram 그리고 1 petabyte의 저장 공간을 가지고 있다. CIGENE computational unit | CIGENE Orion이라 부르는데 (data를 사냥하는 목적이라 그런가…? 이름의 기원은 모르겠다.), 거대 데이터 분석에 대한 전문 지식이 전혀 없는 상태에서 시작하다 보니 정말 복잡하였지만, 이제는 조금 편해진 이 Orion에 대해 이야기 해보고자 한다. Orion은 Linux 기반 서버로, 자신의 computer에서 secure shell (SSH)을 이용하거나 JupyterHub를.. 2023. 7. 24.
Chromosome conformation capture_#1 우선 데이터 분석에 앞서, Chromosome conformation capture이 무엇이고 왜 중요한지에 대해 이야기하고자 한다. 지난 수십여 년간 엄청난 발전을 거듭하고 있는 sequencing technology들로 인해 우리는 유전자 서열에 대한 정보를 높은 해상도로 이해하기 시작하였다. 그로 인해, 유전자 염기서열의 변이들이 미치는 영향들에 대해 많은 정보들 얻게 되었지만 더불어 염기 서열의 특성이나 후성유전학으로 설명하기 어려운 현상들 또한 발견하게 되었다. 특히 인간 전체 염기서열의 98%를 차지하는 non-coding region에서 일어나는 변이가 어떠한 원인으로 표현형에 영향을 미치는지에 대해 많은 노력을 기울이기 시작하였다. 그러면서 promoter, enhancer, motif 등.. 2023. 7. 23.