Method Article
Bu makale, araştırmacılara analitik yöntemlere ve spektral verilere kolay erişim sağlamak için tasarlanmış bir keminformatik uygulaması olan web tabanlı Analitik Yöntemler ve Açık Spektrum veritabanı olan AMOS'u açıklamaktadır.
Analitik yöntemler, ayrıntılı düzenleyici belgelerden daha basit özetlere kadar değişebilir. Düzenleyici yöntemler, uygun analitler, desteklenen matrisler, gerekli reaktifler, istatistiksel performans, laboratuvarlar arası doğrulama ve diğer özellikler hakkında bilgi içerebilir. Özetler tipik olarak reaktiflere, enstrümantasyona ve genellikle kısa bir analit listesine genel bir bakış sağlar. ABD Çevre Koruma Ajansı (USEPA), ABD Jeolojik Araştırması (USGS), ABD Tarım Bakanlığı (USDA), Gıda ve İlaç Dairesi (FDA) ve diğerleri dahil olmak üzere ABD hükümet organlarının analitik yöntemleri, ayrıntılı prosedür bilgileri sunar. Agilent, Shimadzu, Thermo Fisher Scientific, Sciex ve diğerleri gibi cihaz satıcıları da özet yöntemler olarak kabul edilebilecek yüzlerce uygulama notuna erişim sağlar. Bu çalışma, kimyasalların yöntem belgelerinden çıkarıldığı, tanımlayıcıların (isimler ve/veya Chemical Abstracts Service kayıt numaraları (CASRN)) kimyasal yapılarla eşleştirildiği keminformatik özellikli bir yöntem veritabanı geliştirmiştir. Yaklaşık 7.000 yöntem içeren ortaya çıkan veritabanı, tanımlayıcı, kimyasal yapı ve yapısal benzerliğe göre aranabilir ve yaklaşık bir milyon kamu malı spektrumu (LC/MS, GC/MS, NMR ve IR) ile desteklenir. Uygulama, analitik yöntemlerin aranmasını ve analitlere, işlevsel kullanıma, yöntem kaynaklarına ve diğer ilgili meta verilere dayalı filtrelemeyi destekler.
Kimya verilerinin topluluğa web tabanlı teslimi, PubChem1, ChemSpider2 ve CompTox Chemicals Dashboard (CCD)3 gibi uygulamalarla örneklendirilmiştir. Dergi makalelerinde yayınlanan, cihaz satıcıları tarafından teknik uygulama notları olarak yayınlanan, devlet kurumları tarafından standart işletim prosedürleri veya düzenleyici yöntemler olarak sağlanan ve Uluslararası Standardizasyon Örgütü (ISO) gibi standart kuruluşları tarafından yayınlanan analitik yöntem detaylarının dolaşıma sokulması için çaba sarf edilmiştir. On binlerce kimyasal madde bu kaynaklar tarafından çok çeşitli koşullar ve analitik teknikler altında incelenmiştir. Bu kapsamlı kaynak grubu, çeşitli maddeleri kapsar ve belirli bir matristeki (örneğin kan) tek bir kimyasalın miktarının belirlenmesinden, belirli ürünlerdeki pestisit ve kalıntılarının karışımlarına ve içme suyunda tanımlanan yüzlerce kimyasala kadar değişen senaryoları içerir. Birçok analitik yöntem genel arama motorları aracılığıyla keşfedilebilirken, hepsi ücretsiz olarak kullanılabilir veya açık erişimli değildir.
İlgilenilen belirli bilgileri bulmak zor olabilir. Genel amaçlı arama motorları, kimya verileri için optimize edilmemiştir ve sıralama algoritmaları, dar kitlelere yönelik yüksek kaliteli içeriği gizleyebilir. Dergi web sitelerinde yapılan aramalar daha hedefli sonuçlar verebilir, ancak erişim genellikle sınırlıdır, yalnızca özetler kamuya açıktır ve bu da bir yöntemin kullanışlılığını değerlendirmeyi zorlaştırır. Ayrıca, numune matrisleri, algılama limitleri ve nicelik tayini gibi kritik parametreler genellikle yapılandırılmış bir formatta saklanmaz. Bir diğer önemli zorluk, tek bir kimyasalla ilişkili kimyasal tanımlayıcıların, isimlerin ve eşanlamlıların çeşitliliği ve tutarsızlığında yatmaktadır. Yapılandırılmış yöntem verilerinin eksikliği, onlarca yıllık birikmiş analitik kimya bilgisinden ve ilgili yayınlardan yararlanabilecek yazılım araçlarının geliştirilmesini sınırlar.
Bu zorlukların ve sınırlamaların bir sonucu olarak, başka bir yerde tanımlanmamış olan analitik yöntemleri uyumlaştırmak ve araştırmak için küratörlü, kimya odaklı bir uygulamaya ihtiyaç vardır. Bu boşluğu gidermek için ABD Çevre Koruma Ajansı, AMOS, Analitik Yöntemler ve Açık Spektrum veritabanı ve web tabanlı uygulama geliştirdi. AMOS şu anda üç tür veri kaydı toplamakta ve düzenlemektedir: analitik yöntemler, çeşitli analitik spektrumlar ve topluca bilgi sayfaları olarak adlandırılan geniş bir ek belge kategorisi. Her kayıt, yöntemin hedef kimyasal analitleri ve reaktifleri ile bağlantılıdır. Veriler, metin sorguları, kimyasal yapı ve yapısal veya spektral benzerlik dahil olmak üzere çeşitli şekillerde aranabilir.
AMOS uygulaması öncelikle açık erişim ve açık veri kayıtları sunmaya odaklanır. Mümkün olduğunda, veritabanındaki kayıtlar özgün kaynaklarına köprülenir. Açık lisanslama altında olmayan ve bu nedenle doğrudan veritabanında saklanmayan kayıtlar, aksi takdirde mevcut olmaları koşuluyla, URL aracılığıyla entegre edilebilir ve erişilebilir. Bu, iki tür kayıt için geçerlidir: ödeme duvarlarının arkasındaki, tipik olarak EPA'nın erişimi olan dergilerden veya standart kuruluşlarından gelen analitik yöntemler ve mevcut olan ancak oturum açma erişimi gerektiren spektrumlar.
Veri kaynakları, kayıtların nasıl yapılandırıldığına göre değişir ve içeriği bir araya getirmek ve uyumlu hale getirmek için ayıklama ve iyileştirme konusunda önemli çaba gerektirir. Çoğu kayıt, madde tanımlayıcıları sağlar (örneğin, CASRN, DTXSID, InChIKey, yaygın adlar) ve çoğu durumda çıkarma işlemi basittir. Bununla birlikte, bu tanımlayıcıları kimyasal yapılar ve madde ayrıntılarıyla eşleştirmek karmaşık olabilir. Bazı tanımlayıcılar, EPA'nın Dağıtılmış Yapı Aranabilir Toksisite (DSSTox) veritabanındakigirişlerle doğrudan eşleştirilebilir 4; Eşleşme bulunamadığında, tanımlayıcılar mevcut maddelere bağlanır veya yeni maddeler kaydedilir. AMOS girişimi sonuç olarak DSSTox veritabanının genişlemesine yol açmış ve CompTox Chemicals Dashboard3 gibi diğer EPA veritabanlarını ve uygulamalarını destekleyen temel verileri geliştirmiştir.
Bazı değerli ek bilgiler için manuel küratörlük gereklidir. Analitik yöntemler için, tespit ve miktar belirleme sınırları, numune matrisi ve analitik metodoloji gibi deneysel parametreler standart bir şekilde düzenlenmemiştir ve otomatik araçlar, tutarsız depolanması nedeniyle bu bilgileri tanımlayamaz.
Kayıt bilgisinin iki unsuru, numuneyle ilişkili ortam ve analitin işlevsel kullanımı, kirleticilerden kaynaklanan tehlike ve maruz kalma endişelerini izlemeye yönelik devam eden çabalarla son derece ilgilidir. Bu nedenle, bu özniteliklerin kayıt verileri içinde yapılandırılmasına büyük önem verilmiştir. Bu proje için fonksiyonel kullanım sınıflandırmalarının bir ontolojisi geliştirilmiştir. Bu ontoloji, maddelerin işlevsel kullanımlarını, daha genel 'ebeveyn' kullanımlarından daha spesifik 'çocuk' kullanımlarına kadar değişen hiyerarşik bir yapı halinde düzenler. Ontoloji, maruziyeti ve tehlikeyi değerlendirmek için bir araç olarak işlevsel kullanımları vurgulayan araştırma girişimlerini destekleyerek, maddelerin uygulama perspektifinden araştırılmasını kolaylaştırır 5,6. Ek olarak, yöntemler, EPA'nın multimedya izleme veritabanında (MMDB) belirtildiği gibi, numunelerinin uyumlaştırılmış ortam kategorisine göre etiketlendi7. Bu sınıflandırma, kimyasalların belirli ortamlardaki oluşumlarına göre aranmasını sağlayarak, belirli çevresel veya biyolojik numunelerdeki kimyasalları tespit etmeye odaklanan çözümlerin geliştirilmesini kolaylaştırır. Bu ek açıklamalar, AMOS'un EPA içinde geliştirilmekte olan maruz kalma ve tehlike odaklı iş akışlarına entegrasyonunu geliştirir.
Spektrumları bir araya getirirken, bazıları yalnızca nominal olarak standartlaştırılmış olan çeşitli dosya formatlarını işleme ve eşlik eden meta verileri ayrıştırma zorluğu genellikle özel işlem gerektirir. Spektral koleksiyonların bir yayına bağlı olduğu durumlarda, yayın içinde belgelenen ayrıntıların veri yükleme için manuel olarak çıkarılması gerekebilir. Bu çaba, bu farklı spektrumları entegre eden ve yapılandıran bir veri tabanı ile sonuçlandı ve araştırmacıların gelecekteki çabalarda zahmetli küratörlük ihtiyacından kaçınmalarına olanak tanıdı.
Mart 2025 itibariyle, veritabanı yaklaşık 935.000 spektrum içerir ve bunların yaklaşık %99'u kütle spektrumları ve daha küçük NMR (~2.000) ve IR (~400) koleksiyonlarıdır. Ek olarak, yaklaşık 770.000 harici bağlantılı spektrum (SpectraBase veritabanınabağlı 8), ~36.000 bilgi formu ve ~7.400 analitik yöntem vardır. Uygulamaya entegre edilen maddeler, CompTox Chemicals Dashboard'a (CCD) dahil edilen ve 1,2 milyondan fazla madde içeren DSSTox veritabanındaki maddelerin bir alt kümesidir.
AMOS'un işlevselliğinin çoğu üç kategoriye ayrılabilir: belirli maddeler için kayıt arama, belirli madde koleksiyonlarını arama veya kayıt kategorileri arasında arama yapma. Bu işlevler için ayrı sayfaların tümüne, her sayfanın üst kısmındaki gezinme çubuğundan erişilebilir. Uygulama şu anda AMOS modülü aracılığıyla https://hcd.rtpnc.epa.gov/#/ olarak dağıtılmaktadır. Bu çalışmada kullanılan yazılım araçları Malzeme Tablosu'nda listelenmiştir.
1. Belirli maddeler için kayıtların aranması
Şekil 1: Kolesterol içeren kayıtlar için arama sonuçları. "Kolesterol" için genel bir arama, tabloda (solda) eşleşen kayıtların bir listesini görüntüler. Seçilen bir kaydın kütle spektrumu sağda gösterilir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
Şekil 2: Toplu arama arayüzü. Arama alanı, DTXSID'leri tarafından tanımlanan iki madde içerir. Sorgu için varsayılan arama seçenekleri seçilidir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
Şekil 3: 1P-LSD için arama sonuçlarını yapılandırma. Tablo, yapısal olarak benzer maddeler içeren yöntemleri listeler. Seçilen bir yöntem sağda görüntülenir. Tabloda kalın yazılmış girişlerin olmaması, 1P-LSD'nin listelenen herhangi bir yöntemde görünmediğini gösterir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
2. Maddelerin aranması
Şekil 4: ClassyFire sınıflandırma arama sonuçları. Sonuçlar, madde düzeyindeki bilgileri ve sınıflandırma grubu başına kayıt sayısını içerir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
Şekil 5: "Trazine" için kısmi tanımlayıcı arama sonuçları. Arama, "trazin" alt dizesini içeren tercih edilen adlara veya eşanlamlılara sahip maddeleri alır. Üç sonuçtan ikisi, tercih ettikleri isimlerde değil, yalnızca eşanlamlılarında "trazin" kelimesini içeriyor. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
3. Kayıtlar arasında arama yapma
Şekil 6: Analitik yöntemlerin filtrelenmiş listesi. Tablo, analit ve matris ile filtrelenir ve yalnızca sudaki PFAS (per- ve polifloroalkil maddeler) ile ilgili yöntemleri gösterir. İlgili bilgi sayfaları listesi bu düzene çok benzer. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
Şekil 7: Spektrum benzerliği arama sonuçları. Giriş olarak AMOS veritabanından bir kafein spektrumu kullanılır. Benzer spektrumlar, maksimum benzerlik puanı 1.0 olacak şekilde maddeye göre gruplandırılır. Yansıtılmış çizim, giriş spektrumunu (üstte) ve seçilen bir veritabanı spektrumunu (altta) gösterir. Açık mavi tepeler girişe özgüdür, turuncu tepeler veritabanı eşleşmesine özgüdür ve koyu mavi tepeler paylaşılır. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
Şekil 8: İşlevsel kullanım sınıflandırma görselleştirmesi. Hiyerarşik yapı, imleç "endüstriyel kimyasallar" düğümünün (sarı renkle belirtilmiştir) üzerine geldiğinde gösterilir. Alt sınıfları yeşil renkle belirtilmiştir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
Şekil 9: Toprak üçlü arsa görselleştirmesi. Grafik, toprak örnekleri için bileşim verilerini görüntüler. Sağ üstteki bir araç ipucu, şu anda imlecin altında bulunan bölgenin tam bileşimini gösterir. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
Yukarıda gösterilen AMOS'un ekran görüntüleri, hem ilgilenilen maddeler için hem de spektrumlar, bilgi formları ve yöntemler arasında yapılan aramalar dahil olmak üzere, uygulamadaki bireysel aramalardan elde edilen tipik sonuçları göstermektedir. Veritabanını sorgulamanın çeşitli yolları, veriler ve ilgili oldukları maddeler hakkında daha derin bir araştırmaya izin verecek şekilde en olası ve en yararlı arama türlerini kapsamayı amaçlamaktadır.
Bir kullanıcının aramasına yardımcı olmak için, işlevlerin çoğu, mevcut verilerin daha derin bir şekilde incelenmesini desteklemeyi amaçlayan yollarla birbirine bağlanır. Örnek bir iş akışı olarak, işlevsel kullanım sınıflandırması görselleştirmesi, söz konusu işlevsel sınıfla ilgili yöntemlerin ve bilgi formlarının görünümlerine bağlanır, bu öğelerden madde listeleri çıkarılabilir ve toplu aramaya beslenebilir veya tek tek belgeler incelenebilir ve bu belgelerdeki tek tek maddeler daha fazla araştırılabilir. Yöntemlerdeki birçok madde de veritabanında deneysel kütle spektrumlarına sahip olduğundan, bu, bir araştırmacının bir madde kategorisinden, belirli bir maddenin varlığını test edebilen bir dizi yöntem ve spektruma hızlı bir şekilde geçmesine izin verebilir (bkz. Şekil 9).
Sonuçlar büyük ölçüde neyin arandığına ve hangi aramanın veya aramaların çalıştırıldığına bağlı olacağından, tüm uygulama için temsili sonuçların tanımlanması zordur. Genel olarak, bir "başarı"yı kullanıcı deneyimi açısından tanımlamak daha doğru olabilir; Bu durumda, aşağıdakilerin genel olarak geçerli olacağı umulmaktadır: Arama ve filtreleme yöntemlerinin (ve farklı aramalar ve filtreler arasında geçiş yapma yeteneğinin) bir kullanıcının hangi bilgi alt kümelerini istediğini belirlemede etkili olduğu; kullanıcının bulduğu sonuçların doğru ve yararlı olması. Şekil 10'da , AMOS işlevlerini gösteren örnek bir iş akışı gösterilmektedir.
Şekil 10: AMOS işlevlerini gösteren örnek iş akışı. İş akışı, fonksiyonel kullanım sınıflandırması (solunum ilaçları) ile başlar, kandaki solunum ilaçları ile ilgili yöntemleri filtreler, belirli bir yöntemi inceler ve bu yönteme dahil edilen bir madde için spektrumları tanımlar. Bu rakamın daha büyük bir sürümünü görüntülemek için lütfen buraya tıklayın.
Birçok proje ve uygulama, yöntemler, bilgi formları veya belirli bir spektrum türü gibi tek bir kayıt türünden bilgi toplamaya ve standartlaştırmaya odaklanırken, AMOS, birden çok kayıt türünde büyük hacimli bilgileri derleyen ve entegre eden ilk araçtır. Bu çeşitli kaynaklardan gelen verilerin birleştirilmesi, uyumlaştırılması ve yapılandırılması, analitik kimya metodolojilerine erişim gerektiren iş akışlarına daha kolay dahil edilebilecek bir veri tabanı ile sonuçlanır. Veritabanında çeşitli tamamlayıcı yollarla arama yapabilme yeteneği, aksi takdirde birden çok web sitesi veya araçta kapsamlı manuel çaba gerektirebilecek bilgilerin verimli bir şekilde alınmasını sağlar.
Kamuya açıklanmadan önce, AMOS'un faydası, EPA personeli tarafından çok çeşitli projeleri desteklemek için kullanılmasıyla gösterildi. EPA, hedeflenmemiş analiz10,11 için kütle spektrometresinin uygulanmasına sürekli bir ilgi duymaktadır ve çok sayıda girişim, DSSTox kimyasallarından12,13 üretilen büyük bir in silico spektral kitaplığa karşı aramaları geliştirmek için AMOS'taki deneysel kütle spektrumlarından yararlanmıştır. Diğer projeler, yeni yöntemler geliştirmek için başlangıç noktalarını belirlemek için yapısal benzerlik araştırmasını kullanmış, tespit ve nicelik sınırlarını değerlendirmek için mevcut yöntemleri incelemiş ve kimyasal alan kapsamının kapsamını değerlendirmek için yöntemlerle bağlantılı kimyasal koleksiyonlarını analiz etmiştir.
AMOS'un potansiyel eğitim verilerini bir araya getirmesi, hedeflenmemiş analiz (NTA) iş akışlarını ilerletmek için temel bir ihtiyaç olan analitik yöntemler14 için nicel uygunluk modellerinin geliştirilmesini daha da desteklemektedir. AMOS içindeki küratörlük çabaları, metodolojik kapsama alanıyla ilişkili kimyasal alanları modelleme, keşfetme ve görselleştirme girişimlerini de kolaylaştırmaktadır14.
AMOS'un temel işlevselliği olgun olsa da, devam eden geliştirme kullanıcı geri bildirimleriyle yönlendirilir. Mevcut görevler arasında ek verilerin dahil edilmesi, gelişmiş filtreleme için daha fazla meta verinin düzenlenmesi ve arama yeteneklerinin genişletilmesi yer alır. EPA paydaşları ile işbirliği içinde, grafik kullanıcı arayüzünün (GUI) verimsiz olabileceği kullanım durumlarını ele alarak programatik erişimi etkinleştirmek için uygulama programlama arayüzleri (API'ler) geliştirilme aşamasındadır. Zaman içindeki kod güncellemelerini izlemek ve iletmek için uygulamaya bir sürüm notları sayfası entegre edilmiştir.
Yeni veri kayıtları ve kimyasallar şu anda haftalık olarak eklenmektedir; Ancak, halka açık lansmanın ardından daha yavaş bir sürüm programı bekleniyor. Kayıtların ve ilgili meta verilerin doğruluğunu sağlamak için önemli çaba sarf edilse de, verilerin çoğu genel veritabanlarından kaynaklanmaktadır. Bu nedenle, her kaydın tam olarak doğrulanması mümkün değildir ve kullanıcılar mutlak veri doğruluğunun garanti edilemeyeceğini bilmelidir.
Bu makale, ABD Çevre Koruma Ajansı'nın görüşlerini veya politikalarını temsil etmek zorunda değildir.
Yazarlar, veritabanı için kimyasalların küratörlüğünü yapan tüm çalışmaları için kürasyon ekibine ve AMOS'un inşası ve dağıtımında teknik destek için Joshua Powell, Asif Rashid ve Freddie Valone'a teşekkür eder. Ayrıca Charles Lowe'a el yazması üzerindeki incelemesi için teşekkür ederiz.
Name | Company | Catalog Number | Comments |
Git | N/A | https://git-scm.com/ | Open-source version control system. |
JavaScript | N/A | https://ecma-international.org/publications-and-standards/standards/ecma-262/ | Programming language. Defined by ECMA International standards. |
PostgreSQL | PostgreSQL Global Development Group | https://postgresql.org/about/licence | Open-source database management system. |
Python | Python Software Foundation | https://www.python.org/ | Open-source programming language. |
Bu JoVE makalesinin metnini veya resimlerini yeniden kullanma izni talebi
Izin talebiThis article has been published
Video Coming Soon
JoVE Hakkında
Telif Hakkı © 2020 MyJove Corporation. Tüm hakları saklıdır