Method Article
توضح هذه المقالة AMOS ، وهي قاعدة بيانات الأساليب التحليلية المستندة إلى الويب و Open Spectra ، وهو تطبيق للمعلوماتية الكيميائية مصمم لتزويد الباحثين بسهولة الوصول إلى الأساليب التحليلية والبيانات الطيفية.
يمكن أن تتراوح الطرق التحليلية من الوثائق التنظيمية التفصيلية إلى الملخصات الأبسط. قد تشمل الأساليب التنظيمية معلومات عن التحليلات القابلة للتعديل ، والمصفوفات المدعومة ، والكواشف المطلوبة ، والأداء الإحصائي ، والتحقق بين المختبرات ، وغيرها من التفاصيل. توفر الملخصات عادة نظرة عامة على الكواشف والأجهزة وغالبا ما تكون قائمة قصيرة من التحليلات. تقدم الأساليب التحليلية من الهيئات الحكومية الأمريكية ، بما في ذلك وكالة حماية البيئة الأمريكية (USEPA) ، وهيئة المسح الجيولوجي الأمريكية (USGS) ، ووزارة الزراعة الأمريكية (USDA) ، وإدارة الغذاء والدواء (FDA) ، وغيرها ، معلومات إجرائية مفصلة. يوفر بائعو الأدوات مثل Agilent و Shimadzu و Thermo Fisher Scientific و Sciex وغيرهم أيضا الوصول إلى مئات ملاحظات التطبيق ، والتي يمكن اعتبارها طرقا موجزة. طورت هذه الدراسة قاعدة بيانات ممكنة للمعلوماتية الكيميائية للطرق التي يتم فيها استخراج المواد الكيميائية من وثائق الطريقة، مع تحديد المعرفات (الأسماء و/أو أرقام سجل خدمة الملخصات الكيميائية (CASRN)) المعينة بالهياكل الكيميائية. قاعدة البيانات الناتجة ، التي تحتوي على ما يقرب من 7,000 طريقة ، قابلة للبحث عن طريق المعرف والتركيب الكيميائي والتشابه الهيكلي ، ويتم استكمالها بحوالي مليون طيف للملكية العامة (LC / MS ، GC / MS ، NMR ، و IR). يدعم التطبيق البحث عن الأساليب التحليلية والتصفية بناء على التحليلات والاستخدام الوظيفي ومصادر الطريقة والبيانات الوصفية الأخرى ذات الصلة.
يتجلى التسليم المستند إلى الويب لبيانات الكيمياء إلى المجتمع من خلال تطبيقات مثل PubChem1 و ChemSpider2 و CompTox Chemicals Dashboard (CCD) 3. وبذلت جهود لتعميم تفاصيل الأسلوب التحليلي المنشورة في مقالات المجلات، والتي أصدرها بائعو الأدوات كملاحظات تطبيق تقنية، وتقدمها الوكالات الحكومية كإجراءات تشغيل قياسية أو أساليب تنظيمية، وتصدرها منظمات المعايير مثل المنظمة الدولية للتوحيد القياسي (ISO). تمت دراسة عشرات الآلاف من المواد الكيميائية بواسطة هذه المصادر في ظل مجموعة واسعة من الظروف والتقنيات التحليلية. تغطي هذه المجموعة الواسعة من المصادر مواد متنوعة وتتضمن سيناريوهات تتراوح من القياس الكمي لمادة كيميائية واحدة في مصفوفة محددة (مثل الدم) ، إلى مخاليط من مبيدات الآفات ومخلفاتها في محاصيل معينة ، إلى مئات المواد الكيميائية المحددة في مياه الشرب. في حين أنه يمكن اكتشاف العديد من الأساليب التحليلية عبر محركات البحث العامة ، إلا أنها ليست كلها متاحة مجانا أو مفتوحة الوصول.
قد يكون تحديد موقع معلومات محددة ذات أهمية أمرا صعبا. لم يتم تحسين محركات البحث للأغراض العامة لبيانات الكيمياء ، وقد تحجب خوارزميات الترتيب الخاصة بها المحتوى عالي الجودة المخصص للجماهير الضيقة. يمكن أن تؤدي عمليات البحث عبر مواقع المجلات إلى نتائج أكثر استهدافا، ولكن غالبا ما يكون الوصول مقيدا، مع توفر الملخصات للجمهور فقط، مما يجعل من الصعب تقييم فائدة الطريقة. علاوة على ذلك ، غالبا ما لا يتم تخزين المعلمات الحرجة - مثل مصفوفات العينة وحدود الكشف والقياس الكمي - بتنسيق منظم. يكمن التحدي المهم الآخر في تباين وعدم اتساق المعرفات الكيميائية والأسماء والمرادفات المرتبطة بمادة كيميائية واحدة. يحد الافتقار إلى بيانات الأساليب المنظمة من تطوير أدوات البرمجيات التي يمكن أن تستفيد من عقود من المعرفة المتراكمة بالكيمياء التحليلية والمنشورات ذات الصلة.
نتيجة لهذه التحديات والقيود ، هناك حاجة إلى تطبيق منسق وموجه نحو الكيمياء لتنسيق الأساليب التحليلية والبحث عنها - وهو تطبيق لم يتم تحديده في أي مكان آخر. ولمعالجة هذه الفجوة، طورت وكالة حماية البيئة الأمريكية قاعدة بيانات AMOS والأساليب التحليلية والأطياف المفتوحة والتطبيق المستند إلى الويب. تقوم AMOS حاليا بجمع وتنظيم ثلاثة أنواع من سجلات البيانات: الأساليب التحليلية ، والأطياف التحليلية المختلفة ، وفئة واسعة من الوثائق التكميلية التي يشار إليها مجتمعة باسم صحائف الوقائع. يرتبط كل سجل بالتحليلات والكواشف الكيميائية المستهدفة للطريقة. يمكن البحث في البيانات بطرق متعددة ، بما في ذلك الاستعلامات النصية ، والبنية الكيميائية ، والتشابه الهيكلي أو الطيفي.
يركز تطبيق AMOS بشكل أساسي على تقديم الوصول المفتوح وسجلات البيانات المفتوحة. حيثما أمكن ، يتم ربط السجلات في قاعدة البيانات بمصادرها الأصلية. لا يزال من الممكن دمج السجلات غير الخاضعة للترخيص المفتوح وبالتالي غير المخزنة مباشرة في قاعدة البيانات والوصول إليها عبر عنوان URL، شريطة أن تكون متاحة بخلاف ذلك. ينطبق هذا على نوعين من السجلات: الأساليب التحليلية الموجودة خلف جدران الاشتراك غير المدفوع ، عادة من المجلات أو منظمات المعايير التي يمكن لوكالة حماية البيئة الوصول إليها ، والأطياف المتوفرة ولكنها تتطلب الوصول إلى تسجيل الدخول.
تختلف مصادر البيانات في كيفية تنظيم السجلات ، مما يتطلب جهدا كبيرا في الاستخراج والتنظيم لتجميع المحتوى ومواءمته. توفر معظم السجلات معرفات المواد (على سبيل المثال ، CASRN و DTXSID و InChIKey ، الأسماء الشائعة) ، وفي كثير من الحالات ، يكون الاستخراج واضحا. ومع ذلك ، يمكن أن تكون مطابقة هذه المعرفات مع الهياكل الكيميائية وتفاصيل المادة معقدة. يمكن مطابقة بعض المعرفات مباشرة مع الإدخالات في قاعدة بيانات سمية الهيكل الموزع القابلة للبحث (DSSTox) التابعة لوكالة حماية البيئة4. عندما لا يتم العثور على التطابقات، يتم ربط المعرفات بالمواد الموجودة، أو يتم تسجيل مواد جديدة. أدت مبادرة AMOS بالتالي إلى توسيع قاعدة بيانات DSSTox ، وتحسين البيانات الأساسية التي تدعم قواعد بيانات وتطبيقات وكالة حماية البيئة الأخرى ، مثل لوحة معلومات CompTox Chemicals3.
التنظيم اليدوي مطلوب لبعض المعلومات الإضافية القيمة. بالنسبة للطرق التحليلية ، لا يتم تنظيم المعلمات التجريبية مثل حدود الكشف والكمية ومصفوفة العينة والمنهجية التحليلية بطريقة موحدة ، ولا يمكن للأدوات الآلية تحديد هذه المعلومات بسبب تخزينها غير المتسق.
هناك عنصران من معلومات السجل ، الوسائط المرتبطة بالعينة والاستخدام الوظيفي للتحليل ، وثيق الصلة بالجهود الجارية لمراقبة مخاوف المخاطر والتعرض من الملوثات. على هذا النحو ، تم إيلاء اهتمام كبير لهيكلة هذه السمات في بيانات السجل. تم تطوير أنطولوجيا تصنيفات الاستخدام الوظيفي لهذا المشروع. تنظم هذه الأنطولوجيا الاستخدامات الوظيفية للمواد في بنية هرمية ، تتراوح من استخدامات "الوالدين" الأكثر عمومية إلى استخدامات "الأطفال" الأكثر تحديدا. يسهل علم الوجود استكشاف المواد من منظور التطبيق ، ودعم المبادرات البحثية التي تؤكد على الاستخدامات الوظيفية كوسيلة لتقييم التعرض والمخاطر5،6. بالإضافة إلى ذلك ، تم تصنيف الطرائق وفقا لفئة الوسائط المنسقة لعمائاتهم ، على النحو المحدد في قاعدة بيانات مراقبة الوسائط المتعددة (MMDB) التابعة لوكالة حماية البيئة (MMDB)7. يتيح هذا التصنيف البحث عن المواد الكيميائية بناء على حدوثها في وسائط محددة ، مما يبسط تطوير الحلول التي تركز على الكشف عن المواد الكيميائية في عينات بيئية أو بيولوجية محددة. تعزز هذه التعليقات التوضيحية دمج AMOS في تدفقات العمل الموجهة نحو التعرض والمخاطر قيد التطوير داخل وكالة حماية البيئة.
عند تجميع الأطياف ، غالبا ما يتطلب التحدي المتمثل في معالجة تنسيقات الملفات المختلفة - بعضها موحد اسميا فقط - وتحليل البيانات الوصفية المصاحبة معالجة مخصصة. في الحالات التي ترتبط فيها المجموعات الطيفية بمنشور ، قد يلزم استخراج التفاصيل الموثقة داخل المنشور يدويا لتحميل البيانات. نتج عن هذا الجهد قاعدة بيانات تدمج وتبني هذه الأطياف المتباينة ، مما يسمح للباحثين بتجنب الحاجة إلى التنظيم الشاق في المساعي المستقبلية.
اعتبارا من مارس 2025 ، تحتوي قاعدة البيانات على ما يقرب من 935,000 طيف ، مع ما يقرب من 99٪ من أطياف الكتلة ومجموعات أصغر من الرنين المغناطيسي النووي (~ 2,000) والأشعة تحت الحمراء (~ 400). بالإضافة إلى ذلك ، هناك ما يقرب من 770,000 أطياف مرتبطة خارجيا (متصلة بقاعدة بيانات SpectraBase8) ، ~ 36,000 صحيفة وقائع ، و ~ 7,400 طريقة تحليلية. المواد المدمجة في التطبيق هي مجموعة فرعية من تلك الموجودة في قاعدة بيانات DSSTox ، والتي تم دمجها في لوحة معلومات المواد الكيميائية CompTox (CCD) وتحتوي على أكثر من 1.2 مليون مادة.
يمكن تقسيم غالبية وظائف AMOS إلى ثلاث فئات: البحث عن سجلات لمواد معينة ، أو البحث عن مجموعات معينة من المواد ، أو البحث بين فئات السجلات. يمكن الوصول إلى جميع الصفحات الفردية لهذه الوظائف من شريط التنقل أعلى كل صفحة. يتم نشر التطبيق حاليا في https://hcd.rtpnc.epa.gov/#/ عبر وحدة AMOS. يتم سرد أدوات البرامج المستخدمة في هذه الدراسة في جدول المواد.
1. البحث عن سجلات لمواد معينة
الشكل 1: نتائج البحث عن السجلات التي تحتوي على الكوليسترول. يعرض البحث العام عن "الكوليسترول" قائمة بالسجلات المطابقة في الجدول (على اليسار). يظهر الطيف الكتلي للسجل المحدد على اليمين. الرجاء النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 2: واجهة البحث الدفعي. يحتوي حقل البحث على مادتين تم تحديدهما بواسطة DTXSIDs الخاصة بهما. يتم تحديد خيارات البحث الافتراضية للاستعلام. الرجاء النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 3: نتائج البحث عن هيكل 1P-LSD. يسرد الجدول الطرق التي تحتوي على مواد متشابهة هيكليا. يتم عرض طريقة محددة على اليمين. لا توجد إدخالات غامقة في الجدول تشير إلى أن 1P-LSD لا يظهر في أي طريقة مدرجة. الرجاء النقر هنا لعرض نسخة أكبر من هذا الرقم.
2. البحث عن المواد
الشكل 4: نتائج البحث عن تصنيف ClassyFire. وتشمل النتائج معلومات على مستوى المادة وعدد السجلات لكل مجموعة تصنيف. الرجاء النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 5: نتائج البحث الجزئي عن المعرف ل "trazine". يسترد البحث المواد ذات الأسماء المفضلة أو المرادفات التي تحتوي على السلسلة الفرعية "trazine". تتضمن اثنتان من النتائج الثلاث "trazine" فقط في مرادفاتهما ، وليس أسمائهم المفضلة. الرجاء النقر هنا لعرض نسخة أكبر من هذا الرقم.
3. البحث في السجلات
الشكل 6: قائمة مرشحة للطرق التحليلية. يتم ترشيح الجدول بواسطة المادة التحليلية والمصفوفة ، مع عرض الطرق المتعلقة فقط ب PFAS (مواد per- و polyfluoroalkyl) في الماء. وتشبه قائمة صحائف الوقائع المقابلة هذا التصميم إلى حد كبير. الرجاء النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 7: نتائج البحث عن تشابه الطيف. يتم استخدام طيف الكافيين من قاعدة بيانات AMOS كمدخلات. يتم تجميع الأطياف المتشابهة حسب الجوهر ، مع درجة تشابه قصوى تبلغ 1.0. يظهر المخطط المعكوس طيف الإدخال (الأعلى) وطيف قاعدة البيانات المحدد (أسفل). القمم الزرقاء الفاتحة فريدة من نوعها للمدخلات ، والقمم البرتقالية لمطابقة قاعدة البيانات ، ويتم مشاركة القمم الزرقاء الداكنة. الرجاء النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 8: تصور تصنيف الاستخدام الوظيفي. يظهر الهيكل الهرمي مع المؤشر الذي يحوم فوق عقدة "المواد الكيميائية الصناعية" (الموضحة باللون الأصفر). فصول الأطفال محددة باللون الأخضر. الرجاء النقر هنا لعرض نسخة أكبر من هذا الرقم.
الشكل 9: تصور قطعة الأرض الثلاثية للتربة. تعرض قطعة الأرض بيانات تركيبية لعينات التربة. يوضح تلميح الأداة في أعلى اليمين التركيب الدقيق للمنطقة الموجودة حاليا تحت المؤشر. الرجاء النقر هنا لعرض نسخة أكبر من هذا الرقم.
تظهر لقطات شاشة AMOS الموضحة أعلاه النتائج النموذجية من عمليات البحث الفردية في التطبيق ، بما في ذلك عمليات البحث عن المواد ذات الأهمية وبين الأطياف وصحائف الوقائع والأساليب. تهدف مجموعة متنوعة من طرق استجواب قاعدة البيانات إلى تغطية أكثر أنواع البحث احتمالا وأكثرها فائدة بطرق تسمح بإجراء تحقيق أعمق في البيانات والمواد التي تتعلق بها.
وللمساعدة في بحث المستخدم، فإن الكثير من الوظائف مترابطة بطرق تهدف إلى دعم فحص أعمق للبيانات المتاحة. وكمثال على سير العمل، يرتبط تصور تصنيف الاستخدامات الوظيفية بطرق عرض الأساليب وصحائف الوقائع المتعلقة بتلك الفئة الوظيفية، التي يمكن من خلالها استخراج قوائم المواد وإدخالها في البحث الدفعي، أو يمكن فحص الوثائق الفردية، ويمكن إجراء مزيد من التحقيق في المواد الفردية في تلك الوثائق. نظرا لأن العديد من المواد في الطرق تحتوي أيضا على أطياف كتلة تجريبية في قاعدة البيانات ، فقد يسمح ذلك للباحث بالانتقال بسرعة من فئة من المواد إلى مجموعة من الطرق والأطياف التي يمكنها اختبار وجود مادة معينة (انظر الشكل 9).
نظرا لأن النتائج ستعتمد بشكل كبير على ما يتم البحث عنه والبحث أو عمليات البحث التي يتم إجراؤها ، يصعب تحديد النتائج التمثيلية للتطبيق بأكمله. بشكل عام ، قد يكون من الأدق وصف "النجاح" من حيث تجربة المستخدم. في هذه الحالة ، من المأمول أن يكون ما يلي صحيحا بشكل عام: أن تكون طرق البحث والتصفية (والقدرة على التنقل بين عمليات البحث والفلاتر المختلفة) فعالة في تحديد المجموعات الفرعية من المعلومات التي يريدها المستخدم. أن النتائج التي يجدها المستخدم دقيقة ومفيدة. يوضح الشكل 10 مثالا لسير العمل يوضح وظائف AMOS.
الشكل 10: مثال على سير العمل يوضح وظائف AMOS. يبدأ سير العمل بتصنيف الاستخدام الوظيفي (أدوية الجهاز التنفسي) ، ويقوم بتصفية الطرق المتعلقة بأدوية الجهاز التنفسي في الدم ، ويفحص طريقة واحدة محددة ، ويحدد أطياف مادة مدرجة في تلك الطريقة. الرجاء النقر هنا لعرض نسخة أكبر من هذا الرقم.
بينما تركز العديد من المشاريع والتطبيقات على جمع وتوحيد المعلومات من نوع واحد من السجلات ، مثل الأساليب أو صحائف الوقائع أو نوع معين من الأطياف ، فإن AMOS هي الأداة الأولى التي تم تحديدها والتي تجمع وتدمج كميات كبيرة من المعلومات عبر أنواع سجلات متعددة. يؤدي توحيد البيانات من هذه المصادر المتنوعة وتنسيقها وهيكلتها إلى قاعدة بيانات يمكن دمجها بسهولة أكبر في تدفقات العمل التي تتطلب الوصول إلى منهجيات الكيمياء التحليلية. تتيح القدرة على البحث في قاعدة البيانات بعدة طرق تكميلية استرجاع المعلومات بكفاءة والتي قد تتطلب جهدا يدويا مكثفا عبر مواقع ويب أو أدوات متعددة.
قبل الإصدار العام ، تم إثبات فائدة AMOS من خلال استخدامه من قبل موظفي وكالة حماية البيئة لدعم مجموعة واسعة من المشاريع. لدى وكالة حماية البيئة اهتمام مستمر بتطبيق قياس الطيف الكتلي للتحليل غير المستهدف10،11 ، وقد استفادت مبادرات متعددة من أطياف الكتلة التجريبية في AMOS لتعزيز عمليات البحث ضد مكتبة طيفية كبيرة في السيليكو تم إنشاؤها من المواد الكيميائية DSSTox12،13. استخدمت مشاريع أخرى البحث عن التشابه الهيكلي لتحديد نقاط البداية لتطوير طرق جديدة ، وفحص الأساليب الحالية لتقييم حدود الكشف والكمية ، وتحليل مجموعات المواد الكيميائية المرتبطة بطرق تقييم مدى التغطية الفضائية الكيميائية.
يدعم تجميع AMOS لبيانات التدريب المحتملة تطوير نماذج كمية للملاءمة للطرقالتحليلية 14 ، وهي حاجة أساسية لتعزيز سير عمل التحليل غير المستهدف (NTA). تسهل جهود التنظيم داخل AMOS أيضا مبادرات نمذجة واستكشاف وتصور المساحات الكيميائية المرتبطة بالتغطيةالمنهجية 14.
في حين أن الوظائف الأساسية ل AMOS ناضجة ، إلا أن التطوير المستمر يسترشد بملاحظات المستخدمين. تشمل المهام الحالية دمج بيانات إضافية ، وتنظيم المزيد من البيانات الوصفية لتحسين الفلترة ، وتوسيع قدرات البحث. بالتعاون مع أصحاب المصلحة في وكالة حماية البيئة، يجري تطوير واجهات برمجة التطبيقات (APIs) لتمكين الوصول البرمجي، ومعالجة حالات الاستخدام التي قد تكون فيها واجهة المستخدم الرسومية (GUI) غير فعالة. تم دمج صفحة ملاحظات الإصدار في التطبيق لتعقب تحديثات التعليمات البرمجية وتوصيلها بمرور الوقت.
وتضاف حاليا سجلات بيانات ومواد كيميائية جديدة على أساس أسبوعي؛ ومع ذلك ، من المتوقع أن يكون جدول إصدار أبطأ بعد الإطلاق العام. بينما يتم بذل جهد كبير لضمان دقة السجلات والبيانات الوصفية المرتبطة بها ، فإن الكثير من البيانات تنشأ من قواعد البيانات العامة. على هذا النحو ، لا يمكن التحقق الكامل من كل سجل ، ويجب أن يدرك المستخدمون أنه لا يمكن ضمان دقة البيانات المطلقة.
لا تمثل هذه الورقة بالضرورة وجهات نظر أو سياسات وكالة حماية البيئة الأمريكية.
يشكر المؤلفون فريق التنظيم على كل عملهم في تنظيم المواد الكيميائية لقاعدة البيانات ، وجوشوا باول وآصف راشد وفريدي فالون على الدعم الفني في بناء ونشر AMOS. كما نشكر تشارلز لوي على مراجعته للمخطوطة.
Name | Company | Catalog Number | Comments |
Git | N/A | https://git-scm.com/ | Open-source version control system. |
JavaScript | N/A | https://ecma-international.org/publications-and-standards/standards/ecma-262/ | Programming language. Defined by ECMA International standards. |
PostgreSQL | PostgreSQL Global Development Group | https://postgresql.org/about/licence | Open-source database management system. |
Python | Python Software Foundation | https://www.python.org/ | Open-source programming language. |
Request permission to reuse the text or figures of this JoVE article
Request PermissionThis article has been published
Video Coming Soon
Copyright © 2025 MyJoVE Corporation. All rights reserved