Introduction of researches

   Aims of my research are toward two directions, modifying protein structures for improvement of biological function and developing a theoretical model for prediction of protein-protein interactions. Protein is an essential player in a cell and participates in almost biological processes. Proteins work through mediating other biological materials or modifying chemically themselves to extend their functions.

 

 

Green fluorescent protein.png

Green fluorescent protein

 

  Visualization of proteins in a live cell is an important technique to monitor expression of proteins and their cellular location. One of popular fluorescent biomaterials used in the technique is a green fluorescent protein (GFP), which is biologically inert and does not need cofactors or other biomaterials in working. It is commonly found in a cell that a protein enhances and modulates its biological function by rearranging chemical nature or by attaching biochemical functional groups after translation (posttranslational modification, PTM). The GFP forms a fluorophore, which is a chemical compound and emits fluorescence, through the PTM process using autocatalytic reaction. My research interest in protein design is on improving function of the GFP using computational methods and accompanying experimental verifications. It is expected that this study enlarges fundamental knowledge on the PTM process and gives a chance to advance in visualizing technologies.

 

 

graph.PNG

Theoretical analysis of SPOT data for SH3-peptide complex (Hahn et al. 2010 Journal of computational chemistry)

 

  Understanding a protein function in a biological process is too complex in nature because large number of biomaterials is participated on the process. To simplify the matter, many studies have been devoted on finding binding partners of some commonly appeared peptide recognition modules (PRM) such as PDZ, SH2, SH3, and WW domains. High-throughput technologies enable statistical studies to identify binding partners of a target protein in genome-wide level. In particular, synthetic peptide array (SPOT) technology makes it possible to obtain binding affinity of individual peptides to a target PRM. My research is focused on developing a theoretical model, which describes statistically the binding phenomena, and on applying the model to find possible binding partners with high accuracy. In generally it is expected that improvements in computational methods to process large amounts of data obtained from the high-throughput experiments generate higher quality information and the experimental technology is also improved based on feedback from the advances in the computational methods.

 

 

> KOREAN 

 

  단백질은 세포 내에서 중요한 역할을 하는 물질로 다른 생물질들을 매개하거나 자신의 구조를 화학적으로 변형시키어 기능을 향상시키는 방법으로 대부분의 생물학적 과정에 참여한다. 나의 연구의 목표는 두 가지 방향으로 구성되어 있다. 하나는 단백질의 구조를 변형시켜 성능을 향상시키는 것이고 다른 하나는 단백질 간의 상호작용에 대한 이론적인 모형을 발전시키는 것이다.

 

  살아있는 세포에서 단백질을 관찰할 수 있게 하는 기술은 단백질의 발현과 세포 내에서의 위치를 관찰하는 데에 있어서 중요하다. 그러한 기술들에 사용되는 물질 중에서 녹색형광 단백질은 중요한 역할을 하는데, 이 단백질은 다른 생물질의 도움 없이도 발색단을 만들어 자신의 고유한 역할을 하며 관찰하고자 하는 대상 물질에 많은 경우에 있어 미미한 영향을 미친다. 이 단백질의 발색단은 단백질의 사후변형과정(PTM)을 통하여 이루어 지는데 녹색형광단백질의 내부에 있는 아미노산의 곁사슬 들이 스스로 촉매 역할을 하여 발색단을 형성한다. 나의 연구의 목적은 컴퓨터를 이용한 방법과 실험적인 방법을 결합하여 녹색형광단백질의 성능을 향상시키는 것이다. 이러한 연구를 통하여 단백질사후변형과정에 대한 기본적인 지식을 늘릴 수 있고 살아있는 세포를 관찰하는 실험적인 방법에 있어서의 발전을 도모할 수 있을 것으로 예상된다.

 

  생물학적 현상을 분자수준에서 이해하기 위한 목적으로 단백질간의 상호작용에 대한 연구가 이루어 지고 있다. 이러한 연구 중, 세포 내에서 흔히 나타나는 PDZ, SH2, SH3, 그리고 WW 도메인들과 같은 펩티드 인식 단위체들 (PRM)이 연구의 대상이 되어왔다. 대량의 실험을 다루는 기술(High-throughput technology) 들은 다량의 실험 정보를 유전자 총체를 검색하여 펩티드 인식 단위체와 결합하는 단백질 후보 군을 찾아내는 통계적인 방법들에 쓰일 수 있다. 특별히, SPOT 기술은 각각의 펩티드들이 어떠한 세기로 펩티드 인식 단위체와 결합하는가에 대한 정보를 준다. 내가 관심을 가지고 있는 분야는 펩티드 인식 단위체와 펩티드의 결합에 대한 이론적인 모형의 개발을 통하여 대량의 실험을 다루는 기술을 바탕으로 얻어진 다량의 생물학적 정보들을 효과적으로 분석하는 것이다.

 


 

 

 
조회 수 : 9368
2010.08.10 (02:02:49)

  We aim to develop bioinformatics pipeline to study epigenetics for human embryo stem cell. Through the bioinformatics pipeline we would like to provide epigenetic database and suggest new hypothesis to control development of human embryo stem cell.


1. Construct database for epigenetics
2. Develop new algorithm to predict epigenetic regulation factors
3. Develop new algorithm to predict cross-talk between epigentic marks

 

 

 

> KOREAN

 

 

인간 줄기세포의 분화와 (중배엽, 내배염, 외배엽) 관련된 후성유전체학 연구를 위한 생물정보학적 파이프라인을 구축하여, 실험연구자들을 위한 관련 생물정보학적 도구와 DB를 제공하며 줄기세포 분화조절을 위한 프로토콜 개발에 필요한 가설을 생성 (Hypothesis Generation) 함. 히스톤 변형들 간의 상호 작용 및, 후성유전적 현상에 영향을 미치는 신호 전달 과정에 대한 연구를 통해 줄기세포 분화조절 메카니즘을 밝히는데 단서를 제공함.


1. 줄기세포 후성유전체 데이터베이스에 추가 데이터 통합
- 줄기세포 분화 관련 중배엽, 내배엽, 외배엽에 관한 후성유전체 데이터 추가


2. 줄기세포 후성유전체 조절 관련 요소 분석
- 실험 데이터로부터 줄기세포 분화 특이적 요소 분석
- 줄기세포 분화 특이적 요소들의 역할 분석


3. 후성유전체 조절 관련 요소들 간의 상호 관계 분석
- 후성유전체 조절 인자 데이터 수집 및 분석
- 후성유전체 조절 인자 사이의 상호 관계 분석
- 후성유전체 조절 인자 사이 상호 관계 예측 알고리즘 개발

 

 

 research1.jpg

연구개요

 

 

 

 

 

research2.jpg

연구방법

 


 

   

 

 
조회 수 : 10483
2010.08.10 (10:56:16)

One of the most powerful ways to predict a protein's unknown structure/function is to use of comparison with other proteins that already have structures/functions verified. This approach is so called "Comparative analysis". We aim to develop a computational approach to understand the protein structure and function relationship. Comparative analysis using evolutionarily related proteins would be a effective approach for our work. To achieve this goal, we develop and improve the bioinformatics algorithms such as sequence alignment and remote homology detection.


  In order to do the most effective and accurate prediction, we're doing :


1. Sequence alignment quality improvement
     The most important step for the prediction. If sequence alignments become more accurate, more precise putative template proteins can be found.

  r1.PNG

 

2. Search for the remote homolog
     A protein's remotely homologous proteins are defined as those that have low sequence identity with a qurey protein(a protein of which structure/function we want to identify), but have similar structures or functions with a query.
     we are aming at finding those remote homologs with better performance than commonly being used technique such as 'PSI-BLAST'.

 

r2.png

 

 

3. Algorithms and classifiers design
     we're taking use of various kinds of bioinformatics-related databases, and mathematical/statistical principles to do our research. Also for a better protein's structure/function prediction, we're using hyper-spatial machine learning techniques like SVM.

 

As proteins are formed and function in water, their interaction with water molecules is important in understanding their structure and function. Conventionally the water molecules were assumed to interact with its partners by forming hydrogen bonds in tetrahedral geometry. However, we revealed that in interaction with protein the water molecules preferred the planner hydrogen bonding structures. These finding would help us to better understand the water mediated protein – ligand interactions, which are related to the understanding of cellular signaling, engineering of new proteins, and drug development.


단백질이 삼차원 구조를 형성하는 과정과 고유의 기능을 수행하는 일은 모두 물이 있는 환경에서 일어난다. 따라서 단백질과 물과의 상호작용은 단백질의 구조와 기능을 이해하는데 있어서 필수적이라 있다. 분자는 4개의 수소결합을 가질 있다. 따라서 단백질 주변에서 분자가 4면체 형태의 수소결합을 가질 것으로 알려져 있었다. 하지만 단백질 결정 구조들을 분석한 결과 우리는 수소결합의 구조가 평면에 가까운 입체적 형태를 띄고 있다는 것을 발견하였다. 이러한 발견은 추후 단백질의 상호작용을 이해하는데 도움을 것으로 기대한다. 연구 결과는 최종적으로는 단백질-단백질 상호작용의 이해 설계, 새로운 단백질의 설계, 신약개발에 기여할 있을 것으로 기대한다. 

lab_research_intro_sp1.jpg


Figure. Hydrogen bond structures of protein-water interaction. (a) The water molecules in the protein crystal structures were collected and there interacting structures were analyzed. (b) The water molecules interacting with proteins assumed non-tetrahedral geometry. (c) The most representative geometry of the hydrogen bonding structure was planar

 
조회 수 : 246
2016.06.03 (01:07:34)

Antibody has been used as the molecular agent recognizing a specific molecules of biomedical interests. However as the DNA manipulation technique and in vitro affinity screening methods evolved, the other proteins can be used as alternative for the antibody. Many new binding protein scaffolds were developed and shown to be a good binder. Still, their development was dependent on the researcher’s intuition and there is no systematic way of finding a new candidates for the binding protein scaffolds. Therefore we devised a new computational way of evaluating the protein’s potency as a binding protein scaffolds and reported a set of noble candidates expected to be a good binding protein scaffolds. To do so we evaluated a protein’s structure and its evolutionarily related sequences. Consequently we found new set of proteins that are stable yet have a highly variable surface region. We expect that they can be used as a new classes of binding protein scaffolds, and this will eventually facilitate the development of the binders for the proteins of medicinal and diagnostic importance.


의학적으로 중요한 역할을 하는 단백질을 인식하는 항체는 질병 치료 혹은 진단 목적으로 오랜 기간 활용되었다. 최근 분자생물학적 기술의 진보로 인해 항체 이외의 단백질을 이용하여 항체를 대체할 있게 되었다. 결과 다양한 종류의 단백질들이 항체를 대체할 목적으로 개발되었고 일부는 매우 성공적이었다. 그렇지만 이러한 항체 대체 단백질의 개발은 주로 연구자의 직관에 의지하는 경우가 많았고 단백질의 구조적인 특성을 체계적으로 연구하여 새로운 단백질을 선정하는 연구는 없었다. 따라서 연구에서 우리는 단백질의 서열과 구조를 체계적으로 분석함으로써 결합 단백질로 활용될 가능성이 높은 단백질을 전산학적 방법을 통해 설계하는 방법을 제시하였다. 결과 좋은 결합 단백질이 있을 것으로 기대되는 여러 단백질 후보군을 발굴하였다. 연구를 통해 얻은 단백질을 이용하면 단백질 신약 개발 혹은 질병 예측 센서 개발에 도움이 것으로 기대한다

lib_research_intro_sp2.jpg



Figure. Library of Binding Protein (LibBP). (a) The structure and evolutionarily related sequences were collected and their structural and sequential features were analyzed to evaluate a protein’s utility as binding protein scaffold. (b) In this procedure, the variety of each residues and the spatial connectivity among the residues was evaluated to find out a spatially connected variable regions. (c) An illustration of a protein with high potency for a new binding protein and their variable sites. 

 
조회 수 : 252
2016.06.03 (01:10:33)

CTCF (CCCTC-binding Factor) is the transcription factor which is involved in various cellular process. Canonically, CTCF binding sites were interpreted as the “insulator”, which insulate enhancing signal from “enhancer”.  However, additional experiments like Hi-C sequencing suggest that CTCF mediates DNA-DNA interaction and form high order genome structure.

Goal of this research is to characterize and separate CTCF binding sites. There are two type of CTCF binding sites: Single CTCF binding sites(blue) whose binding pattern is strongly sample-dependent. Clustered CTCF binding sites(red) is well conserved among various cell types. Example of Clustered CTCF binding sites at X chromosome. CTCF binding pattern of this region is strongly depend on the gender of donor. It strongly suggests that this cluster may regulate Barr body formation.


CTCF_binding_pattern.jpg

Figure 1 : Bimodal CTCF Binding Pattern and their functionality

 
조회 수 : 239
2016.06.03 (01:12:59)

Maintenance and differentiation of stem cell is important to apply stem cell into clinical purpose. Understanding epigenomics profile of stem cell help to regulate stem cell fate. In this study we try to collect, curate, and manipulate epigenomic profile of stem cell and their derived cells. Roadmap Epigenomics from NCBI, ENCODE project, and other third party experiments provide sequencing data to explain epigenomics profile of various cells. Curation and identification of appropriate pairs of experiments is performed for reliable signal. User can interact with database with severe methods. Experiments matrix explain which experience and samples were used. Descriptive figure visualize whole-genomic trend of each epigenome profile. Genome browser allow to discover individual genomic locus to confirm whole-genomic trends are reliable or not.


StemCellEpigenomeDataBase.jpg


Figure 1 : Schematic overflow for mouse/human stem cell epigenome database

 
조회 수 : 2684
2016.06.03 (01:14:47)

Human genome is well packaged into the cell nucleus. Their structure is highly regulated and hierarchical. Genome structure(3d-ome) is highly related with epigenome and transcriptome.

This research combine Hi-C 3D-ome data, Epigenome data, and Transcriptome data to understand how 3D-ome is regulated and 3D-ome regulate other features.  Hierarchy of genome structure is one of feature to explain and make model based on other omics data.


3DGenome.jpg


Figure 1 : Genome structure and their consequence

 



XE Login