Method Article
Burada sunulan protokol, konakçı-patojen etkileşimlerini inceleyen RNA dizileme transkriptom verilerinden sirkRNA'ları tahmin etmek ve işlevsel olarak karakterize etmek için gereken in silico boru hattının tamamını açıklamaktadır.
Dairesel RNA'lar (sirkRNA'lar), geri ekleme yoluyla oluşturulan kodlamayan RNA'ların bir sınıfıdır. Bu sirkRNA'lar ağırlıklı olarak çeşitli biyolojik süreçlerin düzenleyicileri olarak rolleri için incelenmiştir. Özellikle, ortaya çıkan kanıtlar, konakçı sirkRNA'ların patojenlerle (örneğin, influenza ve koronavirüsler) enfeksiyon üzerine farklı şekilde eksprese edilebileceğini (DE) göstermektedir, bu da sirkRNA'ların konakçı doğuştan gelen bağışıklık tepkilerini düzenlemede bir rol oynadığını düşündürmektedir. Bununla birlikte, patojenik enfeksiyonlar sırasında sirkRNA'ların rolü üzerine yapılan araştırmalar, RNA dizileme (RNA-seq) verilerinden DE sirkRNA'larını tanımlamak için gerekli biyoinformatik analizi yapmak için gerekli bilgi ve becerilerle sınırlıdır. Biyoinformatik tahmin ve sirkRNA'ların tanımlanması, herhangi bir doğrulamadan önce ve maliyetli ve zaman alıcı ıslak laboratuvar tekniklerini kullanan fonksiyonel çalışmalardan önce çok önemlidir. Bu sorunu çözmek için, RNA-seq verilerini kullanarak sirkRNA'ların in silico tahmini ve karakterizasyonunun adım adım bir protokolü verilmiştir. Protokol dört adıma ayrılabilir: 1) CIRIquant boru hattı aracılığıyla DE sirkRNA'larının tahmini ve nicelleştirilmesi; 2) circBase yoluyla ek açıklama ve DE sirkRNA'larının karakterizasyonu; 3) Circr boru hattı üzerinden CircRNA-miRNA etkileşim tahmini; 4) Gen Ontolojisi (GO) ve Kyoto Genler ve Genomlar Ansiklopedisi (KEGG) kullanılarak sirkRNA ebeveyn genlerinin fonksiyonel zenginleştirme analizi. Bu boru hattı, sirkRNA'ların konakçı-patojen etkileşimlerindeki rolünü daha da çözmek için gelecekteki in vitro ve in vivo araştırmaları yönlendirmede yararlı olacaktır.
Konakçı-patojen etkileşimleri, patojenler ve konakçı organizmalar arasındaki karmaşık bir etkileşimi temsil eder, bu da konakçıların doğuştan gelen bağışıklık tepkilerini tetikler ve sonuçta istilacı patojenlerin uzaklaştırılmasıyla sonuçlanır 1,2. Patojenik enfeksiyonlar sırasında, konakçı immün genlerinin çoğu, patojenlerin replikasyonunu ve salınımını inhibe etmek için düzenlenir. Örneğin, patojenik enfeksiyonlar üzerinde düzenlenen yaygın interferon ile uyarılmış genler (ISG'ler) ADAR1, IFIT1, IFIT2, IFIT3, ISG20, RIG-I ve OASL 3,4'ü içerir. Protein kodlayan genlerin yanı sıra, çalışmalar ayrıca uzun kodlamayan RNA'lar (lncRNA'lar), mikroRNA'lar (miRNA'lar) ve dairesel RNA'lar (sirkRNA'lar) gibi kodlamayan RNA'ların da rol oynadığını ve patojenik enfeksiyonlar sırasında eşzamanlı olarak düzenlendiğini bildirmiştir 5,6,7. Proteinleri esas olarak fonksiyonel moleküller olarak kodlayan protein kodlayan genlerin aksine, kodlamayan RNA'ların (ncRNA'lar) transkripsiyonel ve transkripsiyon sonrası seviyelerde genlerin düzenleyicileri olarak işlev gördüğü bilinmektedir. Bununla birlikte, kodlamayan RNA'ların, özellikle sirkRNA'ların, konakçıların bağışıklık genlerini düzenlemeye katılımını içeren çalışmalar, protein kodlayan genlere kıyasla iyi rapor edilmemiştir.
SirkRNA'lar, geri ekleme8 adı verilen kanonik olmayan bir ekleme işlemi ile üretilen kovalent kapalı sürekli döngü yapıları ile yaygın olarak karakterize edilir. Geri ekleme işlemi, konyak lineer RNA'ların ekleme işleminden farklı olarak, aşağı akış donör bölgesinin yukarı akış alıcı bölgesine bağlanmasını ve dairesel şekilli bir yapı oluşturmasını içerir. Şu anda, sirkRNA'ların biyogenezi için üç farklı geri ekleme mekanizması önerilmiştir. Bunlar RNA bağlayıcı protein (RBP) aracılı daireselleştirme 9,10, intron eşleştirme güdümlü daireselleştirme 11 ve lariat güdümlü daireselleştirme12,13,14'tür. SirkRNA'ların dairesel bir yapıda uçtan uca bağlandığı göz önüne alındığında, normal ekzonükleaz sindirimlerine karşı doğal olarak dirençli olma eğilimindedirler ve bu nedenle doğrusal muadillerinden daha kararlı oldukları düşünülmektedir15. SirkRNA'lar tarafından sergilenen bir diğer ortak özellik, konakçılardaki hücre veya doku tipine özgü ekspresyonu içerir16.
Benzersiz yapıları ve hücre veya dokuya özgü ekspresyonları ile ima edildiği gibi, sirkRNA'ların hücrelerde önemli biyolojik işlevler oynadığı keşfedilmiştir. Bugüne kadar, sirkRNA'ların öne çıkan işlevlerinden biri, mikroRNA (miRNA) süngerleri olarak rolleridir17,18. SirkRNA'ların bu düzenleyici rolü, sirkRNA nükleotidlerinin miRNA'ların tohum bölgesi ile tamamlayıcı bağlanmasıyla gerçekleşir. Böyle bir sirkRNA-miRNA etkileşimi, miRNA'ların hedef mRNA'lar üzerindeki normal düzenleyici fonksiyonlarını inhibe eder, böylece19,20 genlerinin ekspresyonunu düzenler. Ek olarak, sirkRNA'ların, RNA bağlayıcı proteinlerle (RBP'ler) etkileşime girerek ve RNA-protein kompleksleri21'i oluşturarak gen ekspresyonunu düzenlediği de bilinmektedir. Her ne kadar sirkRNA'lar kodlamayan RNA'lar olarak sınıflandırılsa da, sirkRNA'ların protein translasyonu için şablon görevi görebileceğine dair kanıtlar da vardır22,23,24.
Son zamanlarda, sirkRNA'ların, özellikle konakçılar ve virüsler arasında, konakçı-patojen etkileşimlerinin düzenlenmesinde önemli roller oynadığı gösterilmiştir. Genel olarak, konakçı sirkRNA'ların, istilacı patojenleri ortadan kaldırmak için konağın bağışıklık tepkilerini düzenlemeye yardımcı olduğu varsayılır. Konakçı bağışıklık tepkilerini destekleyen bir sirkRNA örneği, Guo ve ark.25 tarafından bildirilen circRNA_0082633'dir. Bu sirkRNA, A549 hücreleri içindeki tip I interferon (IFN) sinyallemesini arttırır ve bu da influenza virüsü replikasyonunu baskılamaya yardımcı olur25. Dahası, Qu ve ark. ayrıca, IFN-β 26,27'nin bir sinyal dönüştürücüsü olan CREB-bağlayıcı proteinin (CREBBP) ekspresyonunu düzenleyerek bağışıklığı teşvik eden sirkRNA AIVR adı verilen bir insan intronik sirkRNA'sını da bildirmiştir. Bununla birlikte, enfeksiyon üzerine hastalığın patogenezini desteklediği bilinen sirkRNA'lar da mevcuttur. Örneğin, Yu ve ark. yakın zamanda, konakçı hücre otofajisi28'in inhibisyonu yoluyla H1N1 virüs replikasyonunu teşvik etmede 2A genini (circGATAD2A) içeren GATA çinko parmak alanından eklenmiş bir sirkRNA'nın oynadığı rolü bildirmiştir.
SirkRNA'ları etkili bir şekilde incelemek için, genellikle genom çapında bir sirkRNA tahmin algoritması uygulanır, ardından herhangi bir fonksiyonel çalışma yapılmadan önce tahmin edilen sirkRNA adaylarının in silico karakterizasyonu yapılır. SirkRNA'ları tahmin etmek ve karakterize etmek için böyle bir biyoinformatik yaklaşım daha az maliyetli ve daha fazla zaman verimlidir. İşlevsel olarak incelenecek aday sayısını iyileştirmeye yardımcı olur ve potansiyel olarak yeni bulgulara yol açabilir. Burada, konakçı-patojen etkileşimleri sırasında sirkRNA'ların in silico tanımlaması, karakterizasyonu ve fonksiyonel ek açıklaması için ayrıntılı bir biyoinformatik tabanlı protokol sunuyoruz. Protokol, RNA dizileme veri kümelerinden sirkRNA'ların tanımlanması ve nicelleştirilmesini, circBase aracılığıyla ek açıklama yapılmasını ve sirkRNA adaylarının sirkRNA tipleri, örtüşen genlerin sayısı ve öngörülen sirkRNA-miRNA etkileşimleri açısından karakterizasyonunu içerir. Bu çalışma aynı zamanda Gen Ontolojisi (GO) ve Kyoto Genler ve Genomlar Ansiklopedisi (KEGG) zenginleştirme analizi yoluyla sirkRNA ebeveyn genlerinin fonksiyonel ek açıklamasını sağlar.
Bu protokolde, influenza A virüsü ile enfekte olmuş insan makrofaj hücrelerinden hazırlanan kimliksizleştirilmiş ribozomal RNA (rRNA)-tükenmiş RNA-seq kütüphanesi veri setleri, Gen İfade Omnibus (GEO) veritabanından indirilmiş ve kullanılmıştır. Tahminden sirkRNA'ların fonksiyonel karakterizasyonuna kadar tüm biyoinformatik boru hattı Şekil 1'de özetlenmiştir. Boru hattının her bir parçası aşağıdaki bölümlerde daha ayrıntılı olarak açıklanmaktadır.
1. Veri analizinden önce hazırlık, indirme ve kurulum
NOT: Bu çalışmada kullanılan tüm yazılım paketleri ücretsiz ve açık kaynaklıdır.
2. CIRIquant kullanarak sirkRNA'ların tahmin ve diferansiyel ekspresyon analizi
NOT: Diferansiyel ifade analizinin yüklenmesi ve gerçekleştirilmesiyle ilgili daha ayrıntılı bir kılavuz, CIRIquant kağıt31'in kod kullanılabilirliği bölümünde bulunabilir. Ek veriler, bu protokolde kullanılan bazı temel komutları da içerir.
3. Öngörülen DE sirkRNA'larının karakterizasyonu ve ek açıklaması
4. Circr kullanarak circRNA-miRNA etkileşimini tahmin etme
NOT: CircRNA-miRNA etkileşim analizi için Circr'nin nasıl kurulacağı ve kullanılacağı hakkında daha ayrıntılı bir kılavuz şu adreste bulunabilir: https://github.com/bicciatolab/Circr37.
5. CeRNA ağının inşası
NOT: Cytoscape'in nasıl kullanılacağına dair ayrıntılı bir kılavuz şu adreste bulunabilir: http://manual.cytoscape.org/en/stable/ ve https://github.com/cytoscape/cytoscape-tutorials/wiki#introduction
6. Fonksiyonel zenginleştirme analizi
Önceki bölümde listelenen protokol, Linux OS sistemine uyacak şekilde değiştirilmiş ve yapılandırılmıştır. Bunun temel nedeni, sirkRNA'ların analizinde yer alan çoğu modül kütüphanesinin ve paketinin yalnızca Linux platformunda çalışabilmesidir. Bu analizde, Influenza A virüsü ile enfekte olmuş insan makrofaj hücrelerinden hazırlanan tanımlanmamış ribozomal RNA (rRNA) tükenmiş RNA-seq kütüphanesi veri setleri, GEOveritabanı 42'den indirildi ve temsili sonuçları üretmek için kullanıldı.
CircRNA tahmini ve nicelleştirmesi
Bu analizde, sirkRNA tespiti ve fonksiyonel analizi yapmak için İnfluenza A virüsü ile enfekte olmuş insan makrofaj hücrelerinden hazırlanan ribozomal RNA (rRNA) tükenmiş RNA-seq kütüphanesi veri setleri kullanılmıştır. Protokol bölümünde belirtildiği gibi, CIRIquant, RNA-seq kütüphanesi veri kümelerini girdi olarak kullanarak tanımlanmış sirkRNA'ların DE analizini tanımlamak ve gerçekleştirmek için kullanılmıştır. Kullanılan referans dosyaları en son insan genomu versiyonuna (hg38) dayanmaktadır. Tablo 4 , CIRIquant analizinden elde edilen nihai çıktının bir örneğini göstermektedir. CIRIquant çıktısından DE sirkRNA'larının tanımlanması ve filtrelenmesi, basit RStudio komut dosyaları (Ek Dosya 1) aracılığıyla gerçekleştirildi. SirkRNA'lar yalnızca yanlış keşif oranı (FDR) değeri <0.05 ve log kıvrım değişimi (LogFC) >|2| olduğunda DE olarak sınıflandırılır. Tablo 5 , tespit edilen sirkRNA'ların ve DE sirkRNA'larının toplam sayısını göstermektedir. 306'sı DE olmak üzere toplam 35.846 sirkRNA tespit edildi. Bu çıktıda tespit edilen DE sirkRNA'ları tamamen yukarı regüle edilir (LogFC > 2), hiçbiri aşağı regüle edilmez (LogFC < 2).
DE sirkRNA'larının ek açıklaması ve karakterizasyonu
DE sirkRNA'larının ek açıklama durumu
Tanımlanan DE sirkRNA'ları, yerleşik bir sirkRNA veritabanı olan circBase ile çapraz kontrol edildi. Bununla birlikte, circBase'de biriken circRNA koordinatları önceki bir insan genomu versiyonuna (hg19) dayandığından, circBase'den gelen circRNA koordinatları, bu çalışmada çapraz kontrol için mevcut insan genomu versiyonuna (hg38) dönüştürülmelidir. Ek olarak, başlangıç koordinatı CIRIquant'ın 1 tabanlı çıktısından 0 tabanlı olarak dönüştürülmelidir. circBase'in hg38 sürümüne dönüştürülmüş circRNA koordinatları, Github (https://github.com/bicciatolab/Circr)37'deki bir sürücü klasöründe sağlanır. Daha sonra, yeni bir veri çerçevesi sütununda sirkRNA'ların ek açıklama durumunu atamak için Rstudio betikleri (Ek Dosya 1) kullanıldı. Tablo 6 , ek açıklama durumuna sahip sirkRNA'ların bir örneğini göstermektedir.
DE sirkRNA'larının karakterizasyonu
Bu bölüm tamamen RStudio yazılımındaki R betikleri aracılığıyla yürütüldü. R betikleri analitik süreçleri kolaylaştırır ve yalnızca temel bilgiler gereklidir.
CircRNA tipleri
Bu adımda, DE sirkRNA'ları, genomik konumlarına dayanarak sirkRNA tipleri (Antisens, Exonic, Intergenic ve Intronic) ile karakterize edildi. Aşağıdaki Tablo 7 , tanımlanan DE sirkRNA'ları tarafından kapsanan farklı sirkRNA tiplerinin yüzde dağılımını göstermektedir. Toplam 306 DE sirkRNA'sından 263 sirkRNA'nın (%85.95) ekzonik sirkRNA'lar olduğu tespit edilmiştir ki bu da tanımlanan en bol sirkRNA tipidir. Intronik sirkRNA'lar, toplam DE sirkRNA'larının% 5.56'sını oluşturan 17 DE sirkRNA'sından oluşan ikinci en çok tanımlanmış sirkRNA tipi olarak gelir. Bunu intergenik sirkRNA'lar (16 DE sirkRNA'ları ~% 5.23) ve antisens sirkRNA'lar (10 DE sirkRNA'ları ~% 3.27) izler.
SirkRNA başına yayılan gen sayısı
CIRIquant tarafından tanımlanan sirkRNA'lar bir dizi gen arasında örtüşebilir. Bugüne kadar, çoğu çalışma bir geni kapsayan sirkRNA'lara odaklanmıştır. Bu nedenle, bu protokolde, birden fazla geni kapsayan sirkRNA adayları aşağı akış analizinden hariç tutulur. Aşağıdaki Tablo 8 , bir ve birden fazla geni kapsayan DE sirkRNA'larının sayısını ve yüzdesini açıklamaktadır. Bu tabloda, intergenik sirkRNA'lar (16 DE sirkRNA'lar) herhangi bir konakçı genle örtüşmedikleri için hariç tutulurken, sirkRNA tiplerinin geri kalanı (290 DE sirkRNA'lar) bu analize tabi tutulmuştur. 290 DE sirkRNA'sından, DE sirkRNA'larının çoğunluğu (261 sirkRNA ~% 90) sadece bir geni kapsarken, kalan 29 sirkRNA (~% 10) birden fazla geni kapsar.
CeRNA ağının inşası
Bir ceRNA ağı genellikle tahmin edildikten sonra sirkRNA-miRNA etkileşimlerini görselleştirmek için çizilir. Aşağıdaki Şekil 3'te , temsili bir sonuç olarak sadece bir DE sirkRNA seçilmiştir, bu da sirkRNA hsa_DE_58. Circr tahminlerine dayanarak, hsa_DE_58 dokuz farklı miRNA'ya kadar sünger oluşturabilir. Bu dokuz miRNA, sıkı kriterlerden geçirildikten sonra tanımlanır.
Fonksiyonel zenginleştirme analizi
SirkRNA ebeveyn genlerinin GO ve KEGG analizi
Aşağıdaki Şekil 4 , GO analizi yoluyla DE sirkRNA ebeveyn genlerinin fonksiyonel zenginleşmesinin bir kabarcık grafiğini göstermektedir. Temel olarak, GO analizi, incelenen durumda, bu durumda virüs bulaşmış örnekte zenginleştirilmiş veya etkilenen biyolojik süreçleri, hücresel konumları ve moleküler fonksiyonları çözmeyi amaçlamaktadır. Zenginleştirme istatistiksel olarak anlamlı kabul edilir ve kabarcık grafiğinde yalnızca p değeri 0,01 < ise çizilir. Şekil 4'te gösterildiği gibi, biyolojik süreçler (BP) için ilk üç zenginleştirme, ribonükleoprotein kompleksi biyogenezi, virüse yanıt ve biyotik bir uyarana yanıtın düzenlenmesini içerirken, moleküler fonksiyonlar (MF) için sadece RNA ve tek sarmallı RNA bağlanması üzerinde etkili olan katalitik aktivite istatistiksel olarak zenginleştirilmiştir. Öte yandan, sadece retromer kompleksi hücresel bileşenler (CC) için istatistiksel olarak zenginleştirilmiştir.
Şekil 5 , bir kabarcık grafiğinde DE circRNA ebeveyn genlerinin KEGG zenginleştirme analizini göstermektedir. GO zenginleştirme analizine benzer şekilde, KEGG zenginleştirmesi yalnızca istatistiksel olarak anlamlı kabul edilir ve p değeri 0.01 < ise bir kabarcık grafiği üzerinde çizilir. Bu vakada sadece iki KEGG terimi zenginleştirilmiştir, bunlar İnfluenza A ve viral yaşam döngüsü (HIV-1) yollarıdır.
Şekil 1: SirkRNA'ların tahmini ve fonksiyonel karakterizasyonu için boru hattı. Boru hattı, gerekli yazılım paketlerinin kurulumunu, sirkRNA ekspresyonunun tahmin edilmesini ve ölçülmesini, ceRNA ağının inşasını ve sirkRNA ebeveyn gen fonksiyonel zenginleştirmesinin gerçekleştirilmesini içeren baştan sona temel adımlara basit bir genel bakış sunar. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Şekil 2: Circr için klasör ağacı yapısı. Bu klasör ağacı yapısının, analiz için gerekli dosyaları tespit etmek için Circr yazılımını çalıştırmadan önce kurulması gerekir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Şekil 3: sirkRNA-miRNA etkileşiminden oluşan ceRNA ağı. Mavi oval şekil sirkRNA'yı temsil ederken, turuncu üçgenler miRNA'ları temsil eder. SirkRNA'yı miRNA'lara bağlayan katı çizgiler, hsa_DE_58 sirkRNA'nın potansiyel miRNA süngerleme fonksiyonunu tanımlar. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Şekil 4: DE circRNA ebeveyn genlerinin GO zenginleştirme analizinin kabarcık grafiği. X eksenindeki GeneRatio, verilen GO terimiyle ilişkili giriş listesindeki genlerin sayısıdır ve toplam giriş gen sayısını böler. Grafikteki nokta boyutu, verilen GO terimiyle ilişkili giriş listesindeki genlerin sayısı olan count değeri ile temsil edilir. Noktaların boyutu ne kadar büyük olursa, terimle ilişkili giriş genlerinin sayısı da o kadar büyük olur. Ayrıca, grafikteki noktalar p değerine göre renk kodludur. P-değeri, bir ek açıklama teriminin gözlemlenen sıklığı ile tesadüfen beklenen frekansın karşılaştırılmasıyla hesaplanır. Bireysel terimler, bir kesme değerinin ötesinde zenginleştirilmiş olarak kabul edilir (p değeri < 0,01). Maviden kırmızıya değişen p değerinin renk gradyanı, terimlerin artan zenginleşmesini gösterir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Şekil 5: DE circRNA ebeveyn genlerinin KEGG zenginleştirme analizi. X eksenindeki GeneRatio, verilen KEGG terimiyle ilişkili giriş listesindeki genlerin sayısıdır ve toplam giriş gen sayısını böler. Grafikteki nokta boyutu, verilen KEGG terimiyle ilişkili giriş listesindeki genlerin sayısı olan count değeri ile temsil edilir. Noktaların boyutu ne kadar büyük olursa, terimle ilişkili giriş genlerinin sayısı da o kadar büyük olur. Ayrıca, grafikteki noktalar p değerine göre renk kodludur. P-değeri, bir ek açıklama teriminin gözlemlenen sıklığı ile tesadüfen beklenen frekansın karşılaştırılmasıyla hesaplanır. Tek tek terimler, bir kesme değerinin ötesinde zenginleştirilmiş olarak kabul edilir (p değeri < 0,01). P değerinin maviden kırmızıya değişen renk gradyanı, terimlerin zenginleşmesinin arttığını gösterir. Bu şeklin daha büyük bir versiyonunu görmek için lütfen buraya tıklayın.
Örnek ad | CIRIquant çıktı GTF dosyasının yolu | Grup -landırma |
Kontrol 1 | /yol/to/CIRIquant/ctrl1.gtf | C |
Kontrol 2 | /yol/to/CIRIquant/ctrl2.gtf | C |
Enfekte 1 | /yol/to/CIRIquant/infect1.gtf | T |
Enfekte 2 | /yol/to/CIRIquant/infect2.gtf | T |
Tablo 1: CIRIquant'ın .lst dosyası hazırlanması. Kontrolün hedef yolları ve CIRIquant çıktısından işlenmiş örnekler, iki tür numune arasındaki circRNA ifadelerini karşılaştırmak için bir metin dosyasına yazılır.
Chr | Başlamak | Son | Ad | . | Yalı |
CHR2 | 137428930 | 137433876 | hsa_circ_000076 | . | - |
CHR2 | 154705868 | 154706632 | hsa_circ_000105 | . | - |
CHR2 | 159104273 | 159106793 | hsa_circ_000118 | . | - |
CHR2 | 159215701 | 159226125 | hsa_circ_000119 | . | - |
CHR4 | 39980067 | 39980129 | hsa_circ_002584 | . | - |
Tablo 2: Circr için örnek BED dosyası. BED dosyasını oluşturmak için sirkRNA'larla ilişkili altı sütun (Chr, Start, End, Name, Gene ve Strand) gereklidir.
circRNA_name | Tür | miRNA_name | Tür |
DE_circRNA_1 | sirkRNA | miR-001 | miRNA |
DE_circRNA_1 | sirkRNA | miR-002 | miRNA |
DE_circRNA_2 | sirkRNA | miR-003 | miRNA |
DE_circRNA_2 | sirkRNA | miR-004 | miRNA |
Tablo 3: Cytoscape giriş dosyası. Bir metin dosyasına dört sütun (circRNA_name, Type, miRNA_name ve Type) yazılması gerekir.
SirkRNA | logFC | logCPM | LR | Pvalue | DE | FDR |
chr4:17595410|17598558 | 8.167934481 | -0.039318634 | 185.5341965 | 3.00E-42 | 1 | 1.08E-37 |
chr16:18834892|18850467 | -3.955083482 | -4.397235736 | 2.982607619 | 0.08416358 | 0 | 0.282478158 |
CHR14:73198031|73211942 | 2.493964729 | -4.448176684 | 2.736442046 | 0.09808293 | 0 | 0.282478158 |
Tablo 4: CIRIquant'ın son çıktı (.csv) dosyasının bir parçası. CIRIquant, LogFC, milyon başına günlük sayıları (LogCPM), lojistik regresyon (LR), p değeri, diferansiyel ifade ve FDR gibi bilgiler sağlar.
CIRIquant sonuçları | |||
Toplam | DE | Yukarı | Aşağı |
35846 | 306 | 306 | 0 |
Tablo 5: Tanımlanan toplam ve diferansiyel olarak eksprese edilen (DE) sirkRNA'ların sayısının bir özeti. 306'sı DE sirkRNA'ları olmak üzere toplam 35.846 sirkRNA tespit edilmiştir. Tüm 306 DE sirkRNA'ları, kontrol numunelerine kıyasla tedavi edilen numunelerde yukarı regüle edilir (hiçbiri aşağı regüle edilmez).
Custom_Name | Annotation_Status |
hsa_DE_22 | Açıklamasız |
hsa_DE_2 | Açıklamalı |
hsa_DE_58 | Açıklamasız |
hsa_DE_3 | Açıklamalı |
Tablo 6: Ek açıklama durumuna sahip özel sirkRNA adları tablosu. CircRNA'lar, bilinen birikmiş sirkRNA'ların (circBase) bir veritabanında sorgulanır. SirkRNA veritabanında mevcutsa, açıklama eklenmek üzere etiketlenirken, sirkRNA'nın yokluğu açıklamasız olarak etiketlenir.
CircRNA Tipi | Frekans | Yüzde |
antisens | 10 | 3.27% |
Exon | 263 | 85.95% |
intergenik | 16 | 5.23% |
İntron | 17 | 5.56% |
Tablo 7: Tanımlanan sirkRNA tipleri. SirkRNA'lar, sekans bölgelerine bağlı olarak, yani ekzonik, intronik, antisens ve intergenik olmak üzere farklı sirkRNA tiplerine ayrılabilir.
Ebeveyn genlerinin sayısı | Frekans | Yüzde |
1 | 261 | 90% |
> 1 | 29 | 10% |
Tablo 8: Farklı sayıda genin yayıldığı sirkRNA'ların yüzdesi. SirkRNA'lar genellikle bir genin ekzonlarından kodlanır, ancak birden fazla geni kapsayan sirkRNA'lar CIRIquant tarafından da tespit edilebilir.
Ek Dosya 1: Protokolde kullanılan komut dosyaları. Bu Dosyayı indirmek için lütfen buraya tıklayın.
Bu protokolün faydasını göstermek için, influenza A virüsü ile enfekte olmuş insan makrofaj hücrelerinden RNA-seq örnek olarak kullanılmıştır. Konakçı-patojen etkileşimlerinde potansiyel miRNA süngerleri olarak işlev gören sirkRNA'lar ve bir konakçı içinde GO ve KEGG fonksiyonel zenginleştirmeleri araştırıldı. Çevrimiçi olarak çeşitli sirkRNA araçları olmasına rağmen, her biri birbiriyle etkileşime girmeyen bağımsız bir pakettir. Burada, sirkRNA tahmini ve nicelleştirmesi, sirkRNA fonksiyonel zenginleştirme, sirkRNA-miRNA etkileşim tahmini ve ceRNA ağ yapısı için gerekli olan araçlardan birkaçını bir araya getirdik. Bu kolaylaştırılmış protokol zaman kazandırır ve tanısal ve prognostik değerlere sahip sirkRNA adaylarını tespit etmek için klinik örneklere uygulanabilir.
Temel olarak, sirkRNA'ların DE analizini tespit edebilen ve gerçekleştirebilen CIRI2 ile önceden paketlenmiş bir sirkRNA niceleme aracı olan CIRIquant31'i kullandık. DE sirkRNA'ları, LogFC'nin bir kesme değerine göre filtrelenir > |2| ve FDR 0.05'i <, bu da aşağı akış analizlerinde potansiyel yanlış pozitifleri ortadan kaldırmaya yardımcı olur. DE sirkRNA'larının ek açıklama durumu, sirkRNA tipleri ve yayılan gen sayısı açısından karakterizasyonu, sirkRNA adaylarının kategorize edilmesine ve daha fazla filtrelenmesine yardımcı olur. Daha sonra, bir circRNA-miRNA tahmin aracı olan Circr37, potansiyel miRNA süngerleme adaylarını tahmin etmek için kullanılır. Potansiyel miRNA'ları sirkRNA'ların hedefleri olarak tahmin ettikten sonra, bir ceRNA ağı çizilir. Son olarak, sirkRNA'ların ebeveyn genlerine dayanarak, R clusterProfiler paketi39 , GO ve KEGG yol zenginleştirme analizi yoluyla fonksiyonel ek açıklama için kullanılır. GO ve KEGG'den elde edilen sonuçlar, sirkRNA'lardan etkilenen biyolojik mekanizmaların çözülmesine yardımcı olabilir.
Bugüne kadar, CIRI2 43, CIRCexplorer244, find_circ 45, MapSplice46 ve UROBORUS 47 dahil olmak üzere birkaç farklı sirkRNA tahmin aracı geliştirilmiştir. Hansen ve ark. tarafından yapılan bir çalışmada, CIRI2'nin yüksek bir genel performansa sahip olduğu bildirilmiştir. De novo tahmin ve yanlış pozitif tanımlamanın azaltılması açısından iyi işlev görebilen birkaç sirkRNA tespit aracı arasındadır48. Bu nedenle bu çalışmada sirkRNA tespiti ve nicelleştirmesi için CIRI2'yi kullanan CIRIquant kullanılmıştır. CIRIquant, arka ekleme birleşimi (BSJ) okumalarını saymak için kullanıldı ve sayım verileri, aynı gen lokuslarından kopyalanan doğrusal RNA'ları birleştirmek için eşlenen okumalara normalleştirildi. Bu, bir numunedeki sirkRNA'ların nicelleştirilmesine izin verir. Deneysel koşullar arasında sirkRNA'ların diferansiyel ekspresyonunu belirlemek için CIRIquant, DE analizi için edgeR49'da genelleştirilmiş bir doğrusal model uyguladı ve tam oran-oran testi, sirkRNA bağlantı oranındaki farkın önemini belirlemek için istatistiksel bir test olarak kullanıldı. Her ne kadar sirkRNA'ların ekspresyon seviyesini ölçmek için CIRCexplorer3-CLEAR50 gibi diğer sirkRNA niceleme araçları kullanılabilse de, bu araç sadece bir numunede sirkRNA nicelemesine izin verir, çünkü BSJ bir numunede okur ve sayım verilerini aynı numuneden konyak doğrusal RNA sayımlarına karşı normalleştirir. CIRCexplorer3-CLEAR, deneysel koşullar arasında circRNA ekspresyonlarını karşılaştıramaz. Ayrıca, niceliksel ifade düzeyini desteklemek için CIRCexplorer3-CLEAR'da istatistiksel analiz aracı uygulanmaz. CIRIquant içinde uygulanan varsayılan sirkRNA tahmin aracı CIRI2 olmasına rağmen, find_circ ve CIRCexplorer2 gibi diğer araçlardan elde edilen tahmin sonuçları niceleme ve DE analizi31 için de kullanılabilir. Bu protokolde, tahmin için sadece bir sirkRNA tahmin aracı (CIRI2) kullanıldı, bu da hala yanlış pozitif sirkRNA adayları verebilir. Yanlış pozitifleri azaltmak için, analiz için diğer sirkRNA tahmin araçlarını birleştirebilir ve farklı sirkRNA tahmin araçları arasında tespit edilen ortak sirkRNA'ları seçebilir48,51. SirkRNA tespitini daha da iyileştirmek için, hem rRNA tükenmiş hem de RNase R ön işlemine tabi tutulan RNA dizileme veri kümelerini kullanmak idealdir.
Çalışmanın amacına bağlı olarak, de novo ve açıklamalı DE sirkRNA'ları, circBase veritabanı52'ye dayanarak ayrı ayrı tanımlanabilir. Bununla birlikte, birden fazla geni kapsayan sirkRNA'lar, sirkRNA'ların özgünlüğünü belirlemek ve yanlış pozitifleri ortadan kaldırmak için genellikle UCSC veya başka bir genom tarayıcısında manuel inceleme gerektirir. Bununla birlikte, füzyon genlerinden türetilen sirkRNA'lar gibi birden fazla geni kapsayan sirkRNA'lar da yakın zamandabildirilmiştir 53,54.
Circr, sirkRNA-miRNA bağlanma bölgelerini tahmin etmek için üç farklı miRNA-mRNA tahmin algoritmasını, yani TargetScan 55, miRanda56 ve RNAhybrid57'yi birleştirerek çalışır. Bunun da ötesinde, algoritma ayrıca sirkRNA-miRNA analizinde AGO zirvelerinin ve daha önce doğrulanmış etkileşimlerin bilgilerini de içerir. Burada, daha güvenilir bir sirkRNA-miRNA tahmininin elde edilmesini sağlamak için sıkı filtreleme kriterleri uygulandı, böylece yanlış pozitifler daha da azaltıldı. Ancak, bu filtreleme adımının sıkılığı, kullanıcı tercihine bağlı olarak daha yüksek veya daha düşük olarak ayarlanabilir.
ClusterProfiler, çeşitli organizmalardaki gen kümelerine işlevsel olarak açıklama ekleyebilen iyi belgelenmiş bir R paketidir. Bu protokolde bahsedilen R clusterProfiler paketindeki (enrichGO ve enrichKEGG) aşırı gösterim analizini kullanan işlevlerin yanı sıra, gseGO ve gseKEGG gibi kullanılabilecek başka işlevler de vardır. clusterProfiler iş akışı için uygun bir seçim değilse, "AllEnricher"58 veya "Metascape"59 gibi bir dizi geni işlevsel olarak açıklama ekleyebilen web sitesi tabanlı araçlar gibi başka araçlar ve paketler de vardır. Son olarak, yukarıda sağlanan boru hattı potansiyel sirkRNA'ları ve fonksiyonel ek açıklamalarını tahmin etmede yardımcı olsa da, sağlam kanıtlar sağlamak için ıslak laboratuvar doğrulamasına ihtiyaç duyulacaktır.
Yazarların açıklayacak hiçbir şeyi yok.
Yazar, bu makaleyi eleştirel bir şekilde gözden geçirdikleri için Tan Ke En ve Dr. Cameron Bracken'e teşekkür eder. Bu çalışma, Temel Araştırma Hibe Programı (FRGS/1/2020/SKK0/UM/02/15) ve Malaya Üniversitesi Yüksek Etkili Araştırma Bursu (UM. C/625/1/HIR/MOE/CHAN/02/07).
Name | Company | Catalog Number | Comments |
Bedtools | GitHub | https://github.com/arq5x/bedtools2/ | Referring to section 4.1.2. Needed for Circr. |
BWA | Burrows-Wheeler Aligner | http://bio-bwa.sourceforge.net/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome |
Circr | GitHub | https://github.com/bicciatolab/Circr | Referring to section 4. Use to predict the miRNA binding sites |
CIRIquant | GitHub | https://github.com/bioinfo-biols/CIRIquant | Referring to section 2.1.3. To predict circRNAs |
Clusterprofiler | GitHub | https://github.com/YuLab-SMU/clusterProfiler | Referring to section 7. For GO and KEGG functional enrichment |
CPU | Intel | Intel(R) Xeon(R) CPU E5-2620 V2 @ 2.10 GHz Cores: 6-core CPU Memory: 65 GB Graphics card: NVIDIA GK107GL (QUADRO K2000) | Specifications used to run this entire protocol. |
Cytoscape | Cytoscape | https://cytoscape.org/download.html | Referring to section 5.2. Needed to plot ceRNA network |
FastQC | Babraham Bioinformatics | https://www.bioinformatics.babraham.ac.uk/projects/fastqc/ | Referring to section 1.2.1. Quality checking on Fastq files |
HISAT2 | http://daehwankimlab.github.io/hisat2/ | Referring to section 2.1.1 and 2.1.2. Needed to run CIRIquant, and to index the genome | |
Linux | Ubuntu 20.04.5 LTS (Focal Fossa) | https://releases.ubuntu.com/focal/ | Needed to run the entire protocol. Other Ubuntu versions may still be valid to carry out the protocol. |
miRanda | http://www.microrna.org/microrna/getDownloads.do | Referring to section 4.1.2. Needed for Circr | |
Pybedtools | pybedtools 0.8.2 | https://pypi.org/project/pybedtools/ | Needed for BED file genomic manipulation |
Python | Python 2.7 and 3.6 or abover | https://www.python.org/downloads/ | To run necessary library modules |
R | The Comprehensive R Archive Network | https://cran.r-project.org/ | To manipulate dataframes |
RNAhybrid | BiBiServ | https://bibiserv.cebitec.uni-bielefeld.de/rnahybrid | Referring to section 4.1.2. Needed for Circr |
RStudio | RStudio | https://www.rstudio.com/ | A workspace to run R |
samtools | SAMtools | http://www.htslib.org/ | Referring to section 2.1.2. Needed to run CIRIquant |
StringTie | Johns Hopkins University: Center for Computational Biology | http://ccb.jhu.edu/software/stringtie/index.shtml | Referring to section 2.1.2. Needed to run CIRIquant |
TargetScan | GitHub | https://github.com/nsoranzo/targetscan | Referring to section 4.1.2. Needed for Circr |
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiThis article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır