• 免費服務熱線
  • 400-065-6886
  • 電話:86(0)512-6295 9990
  • 傳真:86(0)512-6295 9995
新聞中心

ATACdb——人類染色質可及性綜合數據庫

發稿時間:2021-03-17來源:天昊生物

年初哈爾濱醫科大學醫學信息學系李春權課題組在《核酸研究》雜志上發布了人類染色質可及性(chromatin accessibility)綜合數據庫ATACdbhttp://www.licpathway.net/ATACdb),該數據庫提供了最全面的可及性(可訪問性)染色質數據、質控、轉錄因子印記及其它注釋信息



可接近的染色質是識別調控元件的高度信息結構特征,它提供了大量關于轉錄活性和基因調控機制的信息。人的ATAC-seq數據集快速積累,因此急需全面收集并有效處理這些數據。ATACdb數據庫的目的是為了提供大量關于人類染色質可及性數據的公共資源,并且以組織或細胞類型特異性的方式注釋和闡明其潛在功能。

ATACdb當前版本記錄了1400ATAC-seq樣本數據中52078883個區域信息,這些樣本是從NCBI GEO/SRA數據庫的2200個染色質可及性樣本中挑選的。ATACdb數據庫提供了質量保證過程,包含4項質控標準。而且,ATACdb提供了詳細的染色質可及性區域的(表觀)遺傳注釋,包括超級增強子、典型增強子、轉錄因子、常見的SNPs、風險SNPseQTLs、連鎖不平衡SNPs、甲基化、染色質相互作用和拓撲結構域。特別地是,ATACdb提供了染色質可及性區域準確地轉錄因子印記的推斷。


一、檢索染色質可訪問性數據的搜索界面

下邊主要介紹ATACdb數據庫的使用:ATACdb具有界面友好的搜索選項來檢索染色質可及性數據(文末圖AB)。用戶可以通過四個路徑確定染色質可及性數據查詢的范圍,包括基因組區域的搜索(輸入基因組位置)搜索組織類型(輸入感興趣的組織的名稱)搜索轉錄因子(輸入感興趣的轉錄因子的名字)搜索基因(輸入基因名稱和識別策略)。在基于基因組區域的查詢中,用戶可以輸入基因組位置,ATACdb將識別與提交區域重疊的可及性染色質區域。基于TF查詢,用戶可以通過提交感興趣的TF來獲取所有可及的TF結合的染色質區域。用戶也可以提交一個基因名,與之相關的可及的染色質區域可以通過可及性染色質區域和相關基因之間的關系返回,可以通過三種策略識別,包括最接近,重疊和近端區域。在基于組織的查詢中,用戶可以選擇組織類型和生物樣品類型來定制過濾。ATACdb可以在結果頁面上顯示與特定組織類型相關的可及的染色質區域。



查詢結果頁面以表格形式顯示檢索結果的概要信息。該表描述了區域ID、基因組位置、長度、倍數變化、-log10P/log10q值和可訪問染色質區域的詳細(表觀)遺傳信息(文末圖D)。結果頁面提供了ATAC-seq數據的QC報告,包括四個檢測分數和一個直方圖(文末圖E)。用戶可以查看染色體中染色質區域的分布情況。對于每個樣本,ATACdb能夠提供TF印記分析結果,包括帶有標簽數的TFTF保護評分、結合站點數量和印記logoATACdb還支持閾值選項,允許用戶設置不同的閾值,以確保每個樣本的TFs是高活性和特定細胞類型的(文末圖F)。此外,用戶可以點擊區域ID查看可訪問染色質區域的詳細信息。ATACdb列出了更詳細的注釋信息,包括TFs、超級增強子、典型增強子、常見SNPs、危險SNPseQTLsLD SNPsDNA甲基化位點、3D染色質相互作用和TADs(文末圖G)。與可訪問的染色質區域相關的基因是通過使用最近、重疊和近端識別策略提供的(文末圖H)。可以顯示與基因相關的詳細信息,如來源于GTExNCBIENCODECCLE項目中不同樣本的基因-疾病關系信息和基因表達數據。ATACdb還提供了染色體peak覆蓋的可視化以及與TSS區域結合的peak的概況(文末圖L)


二、瀏覽可訪問的染色質區域友好界面

用戶可以快速瀏覽樣本,并通過生物樣本類型、生物樣本名稱、組織類型和癌癥類型設置過濾(文末圖C)。可以使用‘Show entries’下拉菜單更改每頁記錄的數量。頁面顯示每個樣本可訪問的染色質區域的數量統計。重要的是,用戶可以進一步點擊樣本ID來查看給定樣本的可訪問染色質區域。


三、在線分析工具

ATACdb提供了兩個實用的分析工具。一種是差異重疊區域分析工具,另一種是由兩個TFs結合的重疊的可及的染色質區域分析工具。差異重疊區域分析工具可以計算兩個樣本的可訪問染色質區域之間的相似性和差異性。當用戶提交兩個感興趣的樣本時,工具將比較兩個樣本之間的區域,并提取兩個樣本之間至少有一個堿基的所有重疊區域。對于這些重疊區域,工具進一步顯示重疊區域的長度和重疊比例(重疊長度與總長度之比)。此外,我們可以將它們分為四種重疊類型。對于不重疊的區域,我們將其視為差異區域,分別提取兩個樣本的這些區域。最后,ATACdb將會展示兩個樣本之間的這些差異和重疊區域,以及它們的詳細信息,包括基因組區域、區域長度、區域數目、重疊比例和重疊類型(文末圖I)。高重疊率表明兩個可及的染色質區域之間有更多的相似性。對于兩個TF結合的重疊的可訪問染色質區域分析工具,用戶可以提交兩個TF名稱和TF結合位點的窗口長度。該工具可以根據TF結合位點計算重疊區域。ATACdb將顯示這些具有重疊長度和重疊比例的重疊區域(文末圖J)。這種分析可以進一步幫助用戶分析可訪問染色質區域中兩個感興趣的TFs之間的重疊區域。

四、個性化基因組瀏覽器和數據可視化

ATACdb提供了一個強大的基因組瀏覽器,幫助用戶直觀地查看基因組中可訪問的染色質區域的鄰近信息。我們使用JBrowse開發了一個個性化的基因組瀏覽器,并添加了許多有用的路徑,如可訪問的染色質區域、增強子、超級增強子、基因、SNPsTADs(文末圖M)ATACdb可以顯示染色質可及性相關的染色體分布餅圖。此外,ATACdb還提供了TF印記標識的可視化(文末圖F)、與染色質可及區結合的轉錄因子表達直方圖以及染色質可及區與基因之間的關系(文末圖H)


五、數據下載和統計

下載頁面提供了所有樣本的染色質可訪問區域和元素。用戶可以快速搜索和下載相關信息(文末圖K)。我們為每個樣本提供了‘.bed’和‘.csv’格式的染色質可訪問區域文件下載。為了分析TF印記,我們提供了‘.txt’和‘.pdf’格式的TF印記文件下載。通過單擊‘pdf’,用戶可以下載壓縮文件中相應的印記logoATACdb支持打包下載所有可訪問的染色質區域和TF印記分析結果。在統計頁面中,ATACdb為用戶提供了關于可訪問的染色質區域和注釋信息的數字和圖形顯示(文末圖N)。此外,在ATACdb中提供了超級增強子與染色質相互作用的樣本信息。


咨詢溝通請聯系

18964693703(微信同號)


創新基因科技,成就科學夢想




Copyright ? 2012-2021 天昊基因科技(蘇州)有限公司    All Rights Reserved    蘇ICP備17064027號-1
国产精品三级黄色片_国产亚洲日韩在线播放不卡_国产乱色_欧美乱色视频_日本高清视频wwwwg色