JoVE Logo

로그인

기사 소개

  • 요약
  • 초록
  • 서문
  • 프로토콜
  • 결과
  • 토론
  • 공개
  • 감사의 말
  • 자료
  • 참고문헌
  • 재인쇄 및 허가

요약

이 기사에서는 AMOS(웹 기반 분석 방법) 및 Open Spectra 데이터베이스(연구자가 분석 방법 및 스펙트럼 데이터에 쉽게 액세스할 수 있도록 설계된 화학 정보학 응용 프로그램)에 대해 설명합니다.

초록

분석 방법은 상세한 규제 문서에서 간단한 요약에 이르기까지 다양할 수 있습니다. 규제 방법에는 수정 가능한 분석물, 지원되는 매트릭스, 필요한 시약, 통계적 성능, 실험실 간 검증 및 기타 세부 사항에 대한 정보가 포함될 수 있습니다. 요약은 일반적으로 시약, 기기 및 종종 분석물의 짧은 목록에 대한 일반적인 개요를 제공합니다. 미국 환경보호국(USEPA), USGS(U.S. 지질조사국), 미국 농무부(USDA), 미국 식품의약국(FDA) 등을 포함한 미국 정부 기관의 분석 방법은 자세한 절차 정보를 제공합니다. Agilent, Shimadzu, Thermo Fisher Scientific, Sciex 등과 같은 기기 공급업체도 요약 방법으로 간주될 수 있는 수백 개의 애플리케이션 노트에 대한 액세스를 제공합니다. 이 연구는 화학 구조에 매핑된 식별자(이름 및/또는 CASRN(Chemical Abstracts Service Registry Number))를 사용하여 방법 문서에서 화학 물질을 추출하는 방법에 대한 화학 정보학 지원 데이터베이스를 개발했습니다. 약 7,000개의 분석법이 포함된 결과 데이터베이스는 식별자, 화학 구조 및 구조적 유사성으로 검색할 수 있으며 약 100만 개의 공개 도메인 스펙트럼(LC/MS, GC/MS, NMR 및 IR)으로 보완됩니다. 이 응용 프로그램은 분석 방법 검색 및 분석물, 기능 사용, 방법 소스 및 기타 관련 메타데이터를 기반으로 한 필터링을 지원합니다.

서문

웹 기반으로 화학 데이터를 커뮤니티에 전달하는 방법은 PubChem1, ChemSpider2 및 CompTox Chemicals Dashboard(CCD)3와 같은 애플리케이션에서 볼 수 있습니다. 저널 논문에 게재된 분석 방법 세부 정보, 기기 공급업체가 기술 응용 노트로 발표, 정부 기관에서 표준 운영 절차 또는 규제 방법으로 제공, ISO(International Organization for Standardization)와 같은 표준 기관에서 발행한 분석 방법 세부 정보를 배포하기 위한 노력이 이루어졌습니다. 수만 개의 화학 물질이 광범위한 조건과 분석 기술에서 이러한 출처에 의해 연구되었습니다. 이 광범위한 출처는 다양한 물질을 다루며 특정 매트릭스(예: 혈액)에서 단일 화학 물질의 정량화부터 특정 작물의 살충제 및 잔류물 혼합물, 식수에서 확인된 수백 가지 화학 물질에 이르기까지 다양한 시나리오를 포함합니다. 공개 검색 엔진을 통해 많은 분석 방법을 찾을 수 있지만 모든 방법을 무료로 사용할 수 있거나 공개 액세스할 수 있는 것은 아닙니다.

관심 있는 특정 정보를 찾는 것은 어려울 수 있습니다. 범용 검색 엔진은 화학 데이터에 최적화되어 있지 않으며 순위 지정 알고리즘으로 인해 제한된 잠재 고객을 대상으로 하는 고품질 콘텐츠가 모호해질 수 있습니다. 저널 웹 사이트를 검색하면 보다 표적화된 결과를 얻을 수 있지만, 액세스가 제한되고 초록만 공개적으로 사용할 수 있어 방법의 유용성을 평가하기 어려운 경우가 많습니다. 또한 샘플 매트릭스, 검출 한계 및 정량화와 같은 중요한 매개변수는 종종 구조화된 형식으로 저장되지 않습니다. 또 다른 중요한 문제는 단일 화학 물질과 관련된 화학 식별자, 이름 및 동의어의 다양성과 불일치에 있습니다. 구조화된 분석법 데이터가 부족하기 때문에 수십 년 동안 축적된 분석 화학 지식 및 관련 출판물을 활용할 수 있는 소프트웨어 도구의 개발이 제한됩니다.

이러한 과제와 한계로 인해 분석 방법을 조화시키고 검색하기 위해 다른 곳에서는 확인되지 않은 선별된 화학 지향적인 응용 프로그램이 필요합니다. 이러한 간극을 해소하기 위해 미국 환경보호국(EPA)은 AMOS(Analytical Methods and Open Spectra) 데이터베이스와 웹 기반 애플리케이션을 개발했습니다. AMOS는 현재 분석 방법, 다양한 분석 스펙트럼 및 팩트 시트라고 하는 광범위한 범주의 보충 문서라는 세 가지 유형의 데이터 기록을 수집하고 구성합니다. 각 기록은 분석법의 표적 화학 분석물 및 시약에 연결됩니다. 데이터는 텍스트 쿼리, 화학 구조, 구조적 또는 스펙트럼 유사성을 포함한 여러 가지 방법으로 검색할 수 있습니다.

AMOS 응용 프로그램은 주로 오픈 액세스 및 오픈 데이터 레코드를 제공하는 데 중점을 둡니다. 가능한 경우 데이터베이스의 레코드는 원래 소스에 하이퍼링크로 연결됩니다. 오픈 라이선싱이 아니기 때문에 데이터베이스에 직접 저장되지 않은 기록은 다른 방법으로 사용할 수 있는 경우 URL 을 통해 계속 통합하고 액세스할 수 있습니다. 이는 두 가지 유형의 기록에 적용되는데, 하나는 일반적으로 EPA가 액세스할 수 있는 저널 또는 표준 조직의 페이월 뒤에 있는 분석 방법이고, 다른 하나는 사용 가능하지만 로그인 액세스가 필요한 스펙트럼입니다.

데이터 소스는 기록이 구성되는 방식이 다양하므로 콘텐츠를 조합하고 조화시키기 위해 추출 및 큐레이션에 상당한 노력이 필요합니다. 대부분의 레코드는 물질 식별자(예: CASRN, DTXSID, InChIKey, 일반 이름)를 제공하며, 대부분의 경우 추출은 간단합니다. 그러나 이러한 식별자를 화학 구조 및 물질 세부 정보와 일치시키는 것은 복잡할 수 있습니다. 일부 식별자는 EPA의 DSSTox(Distributed Structure-Searchable Toxicity) 데이터베이스4의 항목과 직접 일치시킬 수 있습니다. 일치하는 물질이 발견되지 않으면 식별자가 기존 물질에 연결되거나 새로운 물질이 등록됩니다. AMOS 이니셔티브는 결과적으로 DSSTox 데이터베이스의 확장으로 이어졌으며 CompTox Chemicals Dashboard3와 같은 다른 EPA 데이터베이스 및 애플리케이션을 지원하는 기본 데이터를 개선했습니다.

특정 귀중한 추가 정보에 대해서는 수동 큐레이션이 필요합니다. 분석 방법의 경우 검출 및 정량 한계, 시료 매트릭스 및 분석 방법론과 같은 실험 파라미터가 표준화된 방식으로 구성되지 않았으며 자동화된 도구는 일관되지 않은 저장으로 인해 이러한 정보를 식별할 수 없습니다.

기록 정보의 두 가지 요소, 즉 샘플과 관련된 매체와 분석물의 기능적 사용은 오염 물질로 인한 위험 및 노출 문제를 모니터링하기 위한 지속적인 노력과 매우 관련이 있습니다. 따라서 레코드 데이터 내에서 이러한 속성을 구조화하는 데 상당한 주의를 기울였습니다. 이 프로젝트를 위해 기능적 사용 분류의 온톨로지가 개발되었습니다. 이 온톨로지는 물질의 기능적 사용을 보다 일반적인 '부모' 사용에서 보다 구체적인 '자식' 사용에 이르기까지 계층적 구조로 조직합니다. 온톨로지는 응용 관점에서 물질의 탐색을 촉진하여 노출 및 위험을 평가하는 수단으로 기능적 사용을 강조하는 연구 이니셔티브를 지원합니다 5,6. 또한 EPA의 멀티미디어 모니터링 데이터베이스(MMDB)7에 지정된 대로 샘플의 조화 배지 범주에 따라 분석법을 라벨링했습니다. 이러한 분류를 통해 특정 매체에서 발생하는 화학물질을 기반으로 화학물질을 검색할 수 있으며, 특정 환경 또는 생물학적 시료에서 화학물질을 검출하는 데 중점을 둔 솔루션 개발을 간소화할 수 있습니다. 이러한 주석은 EPA 내에서 개발 중인 노출 및 위험 지향 워크플로우에 AMOS를 통합하는 것을 향상시킵니다.

스펙트럼을 조합할 때 다양한 파일 형식(그 중 일부는 명목상으로만 표준화되어 있음)을 처리하고 함께 제공되는 메타데이터를 구문 분석해야 하는 과제는 종종 사용자 지정 처리가 필요합니다. 스펙트럼 컬렉션이 출판물에 연결되어 있는 경우, 출판물 내에 문서화된 세부 정보는 데이터 로드를 위해 수동으로 추출해야 할 수 있습니다. 이러한 노력으로 이러한 이질적인 스펙트럼을 통합하고 구조화하는 데이터베이스가 구축되어 연구자들이 향후 노력에서 힘든 큐레이션의 필요성을 피할 수 있습니다.

2025년 3월 현재 데이터베이스에는 약 935,000개의 스펙트럼이 포함되어 있으며 거의 99%가 질량 스펙트럼이고 더 작은 NMR(~2,000) 및 IR(~400) 컬렉션입니다. 또한 약 770,000개의 외부 링크 스펙트럼(SpectraBase 데이터베이스8에 연결), ~36,000개의 팩트 시트 및 ~7,400개의 분석 방법이 있습니다. 애플리케이션에 통합된 물질은 CompTox Chemicals Dashboard(CCD)에 통합되고 120만 개 이상의 물질을 포함하는 DSSTox 데이터베이스의 물질 하위 집합입니다.

프로토콜

AMOS의 기능 대부분은 주어진 물질에 대한 기록 검색, 특정 물질 모음 검색 또는 기록 범주 간 검색의 세 가지 범주로 나눌 수 있습니다. 이러한 기능에 대한 개별 페이지는 모든 페이지 상단의 탐색 모음에서 모두 액세스할 수 있습니다. 이 애플리케이션은 현재 AMOS 모듈을 통해 https://hcd.rtpnc.epa.gov/#/ 배포되어 있습니다. 이 연구에서 사용된 소프트웨어 도구는 재료 표에 나열되어 있습니다.

1. 특정 물질에 대한 기록 검색

  1. 일반 검색: 일반 검색을 수행하여 단일 물질과 관련된 모든 유형의 기록 목록을 얻습니다( 그림 1 참조).
    1. 탐색 모음의 왼쪽 상단에 있는 텍스트 필드 또는 첫 페이지의 검색 필드에 물질 이름, CASRN, InChIKey 또는 DSSTox 물질 식별자(DTXSID)를 입력합니다. Enter 키를 누르거나 검색을 클릭하여 검색을 실행합니다.
      참고: 첫 페이지의 검색 창에는 하위 문자열로 검색할 수 있는 추가 옵션이 있습니다. 자세한 내용은 부분 식별자 검색(2.2단계) 섹션을 참조하십시오.
    2. 검색된 식별자가 인식되고 단일 물질과 일치하는 경우 페이지 왼쪽에 물질에 대한 몇 가지 기본 정보와 해당 물질과 관련된 모든 기록을 나열하는 표가 표시됩니다. 해당 테이블에서 행을 선택하면 데이터베이스에 직접 저장된 경우 페이지 오른쪽에 연결된 레코드가 표시됩니다.
    3. 검색된 식별자가 여러 물질과 일치하는 경우(예: 둘 이상의 물질에 사용되는 약어) 사용자가 보고 싶은 물질을 선택할 수 있도록 명확성 프롬프트가 나타납니다. 해당 목록에서 물질을 선택하면 인식된 물질에 대한 디스플레이로 리디렉션됩니다.
    4. 결과 테이블을 필터링하려면 테이블 바로 위에 있는 탭을 클릭하여 레코드 유형별로 필터링하고(이렇게 하면 다른 열도 숨겨지거나 숨김 해제됨), 테이블 맨 위에 있는 필드에 텍스트를 입력하여 데이터의 다른 측면을 필터링하고, 탭 위의 확인란을 선택하여 데이터의 더 넓은 속성을 필터링합니다.
  2. 일괄 검색: 일괄 검색을 수행하여 지정된 물질 목록과 연결된 데이터베이스의 모든 기록에 대한 정보를 나열하는 스프레드시트 파일을 생성하고 다운로드합니다. ( 그림 2 참조).
    1. 입력 데이터 필드에 검색할 DTXSID 목록을 한 줄에 하나씩 입력합니다. DTXSID를 사용할 수 없는 경우 페이지의 링크를 사용하여 다른 식별자가 지정된 DTXSID를 제공할 수 있는 CCD 도구로 이동합니다.
    2. 검색 옵션 아래의 확인란을 사용하여 결과를 필터링하거나 레코드에 추가 정보를 추가합니다. 옵션은 레코드 유형별 필터링, 분석 방법론별 필터링, 결과 파일에 추가 물질 수준 정보 추가, 추가 레코드 수준 정보 추가(현재 질량 스펙트럼에만 사용 가능) 및 일부 기타 옵션의 5가지 범주로 그룹화됩니다.
      참고: 점선 밑줄이 있는 옵션에는 옵션을 더 자세히 설명하는 텍스트가 있습니다. 옵션의 레이블 위에 커서를 올려 놓으면 표시됩니다.
    3. 페이지 하단의 Search(검색 )를 클릭하여 검색을 실행합니다.
      참고: 출력 스프레드시트에는 물질 식별자, 소스 링크 및 기타 기본 정보와 함께 물질 기록 연관 목록이 포함되어 있습니다. 검색된 여러 물질이 기록에 나타나는 경우 기록은 각 물질에 대해 한 번씩 나타납니다.
  3. 구조적 유사성 검색: 이 검색을 수행하여 검색된 물질 또는 타니모토 구조적 유사성 계수가 충분히 높은 물질을 포함하는 데이터베이스의 방법 및 팩트 시트 목록을 얻습니다( 그림 3 참조).
    참고: 이 검색은 관심 물질이 어떤 분석법에도 나타나지 않는 경우에 유용할 수 있지만 매우 유사한 물질이 있는 분석법이 잠재적으로 참조로 사용될 수 있습니다.
    1. 검색 필드에 DTXSID, InChIKey, CASRN 또는 물질 이름을 입력하고 검색을 클릭하거나 Enter 키를 누릅니다. 검색을 완료하는 데 20-30초가 소요될 수 있습니다.
    2. 검색이 완료되면 아래에 탭 테이블이 나타납니다. 탭을 선택하여 검색 결과를 살펴봅니다.
      1. 처음 두 탭에는 발견된 메서드와 팩트 시트가 나열됩니다. 하나를 선택하면 페이지 오른쪽에 해당 문서의 보기가 표시됩니다. 검색된 물질이 포함된 방법 또는 팩트 시트는 굵은 글꼴로 되어 있습니다.
      2. 세 번째 탭에는 방법 또는 팩트 시트에 나타나는 것으로 밝혀진 유사한 물질이 나열되어 있습니다. 표에서 행을 선택하여 검색된 물질과 표에서 선택한 물질을 비교합니다. 검색된 물질 자체가 문서에서 발견된 경우 굵은 글꼴로 표시됩니다.
      3. 맨 위에 있는 Filter minimum substance similarity(최소 물질 유사성 필터링) 선택기를 사용하여 선택한 유사성 임계값 미만의 물질이 없는 물질 검색 결과를 숨깁니다.

figure-protocol-3013
그림 1: 콜레스테롤이 포함된 레코드에 대한 검색 결과. "cholesterol"에 대한 일반적인 검색은 표(왼쪽)에 일치하는 레코드 목록을 표시합니다. 선택한 레코드의 질량 스펙트럼이 오른쪽에 표시됩니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-protocol-3457
그림 2: 일괄 검색 인터페이스. 검색 필드에는 DTXSID로 식별되는 두 가지 물질이 포함되어 있습니다. 쿼리에 대한 기본 검색 옵션이 선택됩니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-protocol-3869
그림 3: 1P-LSD에 대한 구조 검색 결과. 이 표에는 구조적으로 유사한 물질을 포함하는 방법이 나열되어 있습니다. 선택한 방법이 오른쪽에 표시됩니다. 표에서 굵게 표시된 항목은 1P-LSD가 나열된 메서드에 나타나지 않음을 나타냅니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

2. 물질 검색

  1. ClassyFire 검색: ClassyFire 분류9 의 주어진 처음 4개 수준에 속하는 모든 물질을 나열하려면 이 검색을 수행합니다( 그림 4 참조).
    1. 페이지 맨 위에 있는 4개의 필드를 사용하여 분류의 상위 4개 수준을 한 번에 하나씩 선택합니다. 처음 세 개를 각각 선택한 후 해당 필드 아래의 버튼을 사용하여 분류 목록을 한 수준 아래로 가져옵니다. 네 번째의 경우 아래 버튼이 검색을 실행합니다.
      참고: 검색이 완료되면 아래 표에 해당 분류에 속하는 물질 목록이 채워집니다. 이 표에는 공통 식별자 및 물질 정보와 AMOS에 존재하는 레코드 수가 포함되어 있습니다.
    2. 클래스 선택과 테이블 사이의 버튼을 사용하여 4비트의 기능을 허용합니다.
      1. URL에 분류 복사를 클릭하여 클립보드에 URL을 복사하면 새 브라우저 탭이나 창에 로드되면 분류 수준이 자동으로 미리 채워지고 검색이 실행됩니다.
      2. Reset Selection(선택 항목 재설정)을 클릭하여 분류 필드의 선택 항목을 재설정합니다. 발견된 물질의 표를 재설정하지 않습니다.
      3. Download Table을 클릭하면 물질 이미지를 제외하고 테이블에서 볼 수 있는 모든 필드와 레코드가 포함된 스프레드시트 파일을 다운로드하라는 메시지가 표시됩니다. 결과 테이블의 맨 위에 있는 필터를 사용 중인 경우 다운로드한 결과도 필터링되지만 필터의 내용은 포함되지 않습니다.
      4. Send Selected Substances to Batch Search(선택한 물질을 일괄 검색으로 보내기)를 클릭하여 ClassyFire 검색 결과에서 선택한 물질로 미리 채워진 DTXSID를 나열하는 필드가 있는 일괄 검색을 위한 새 탭을 엽니다. 개별 물질의 선택은 각 행의 확인란을 사용하여 수행할 수 있습니다. 모든 물질의 선택 또는 선택 취소는 표 헤더의 확인란을 클릭하여 수행할 수 있습니다. 일괄 검색에 대한 자세한 내용은 1.2단계를 참조하십시오.
  2. 부분 식별자 검색: 고유하지 않은 식별자와 일치하는 모든 물질을 찾으려면 이 작업을 수행합니다( 그림 5 참조). 현재 옵션은 name substring(EPA 선호 이름과 일반 동의어를 모두 포함), InChIKey 첫 번째 블록, 정확한 분자 공식 및 다양한 단일 동위원소 질량입니다.
    1. 페이지 상단에서 식별자를 선택하고 인접한 필드에 정보를 입력합니다.
    2. 검색을 클릭하여 검색을 실행합니다.
    3. 검색이 완료되면 표가 부분 식별자와 일치하는 물질 목록과 AMOS의 데이터베이스 및 기타 문헌에 나타나는 빈도에 대한 정보로 채워집니다. 표의 열 맨 위에 있는 필터를 사용하여 결과를 더 구체화하고, 다성분 물질 표시 확인란을 사용하여 여러 화합물로 구성된 물질을 표시하거나 숨길 수 있습니다.
      참고: 이름 부분 문자열 검색이 실행된 경우 검색된 동의어를 나열하는 열이 나타납니다. 물질이 동의어로만 발견되는 경우, 즉 선호하는 이름에 부분 문자열 이 포함되어 있지 않은 경우 선호하는 이름은 기울임꼴로 표시됩니다.

figure-protocol-6230
그림 4: ClassyFire 분류 검색 결과. 결과에는 물질 수준 정보와 분류 그룹당 기록 수가 포함됩니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-protocol-6620
그림 5: "trazine"에 대한 부분 식별자 검색 결과. 검색은 하위 문자열 "trazine"을 포함하는 선호 이름 또는 동의어를 가진 물질을 검색합니다. 세 가지 결과 중 두 개는 동의어에만 "trazine"을 포함하고 선호하는 이름은 포함하지 않습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

3. 레코드 검색

  1. 팩트 시트 및 방법 목록: 이 페이지에는 데이터베이스에 있는 모든 팩트 시트와 메서드가 나열되며, 이를 필터링하는 다양한 방법이 포함되어 있습니다( 그림 6 참조). 두 페이지의 기능은 거의 동일하기 때문에 여기에 함께 그룹화되어 있습니다.
    참고: 페이지로 이동하면 테이블이 로드된다는 메시지가 표시됩니다. 존재하는 레코드의 수로 인해 시간이 걸릴 수 있습니다.
    1. 테이블이 로드되면 각 열의 맨 위에 있는 입력을 사용하여 데이터와 다양한 필드를 필터링합니다. 정확한 필드는 테이블마다 다르지만 대부분은 선택하거나 필터링할 수 있습니다.
    2. 테이블 위의 Full Table Filter 필드를 사용하여 모든 열에서 특정 문자열을 확인합니다.
      참고: 메서드 목록에는 기본적으로 숨겨져 있는 두 개의 필드(author 및 publisher)가 포함되어 있습니다. 전체 테이블 필터는 이러한 필드 중 하나에 검색된 용어가 있는 레코드를 포착합니다.
    3. 팩트 시트 목록을 사용하면 주어진 물질을 검색하여 개별 결과를 필터링할 수 있습니다. 물질 이름, CASRN, InChIKey 또는 DTXSID를 입력하고 검색을 눌러 테이블을 필터링합니다. 필터 지우기 를 클릭하여 물질 필터를 지웁니다.
      참고: 두 테이블 모두 다음과 같은 버튼을 사용할 수 있습니다: 클립보드에 필터 복사 는 URL을 클립보드에 복사하며, 브라우저에서 액세스할 때 목록을 로드하고 테이블의 필터 필드를 현재 값으로 미리 채웁니다. Download Table(테이블 다운로드 )은 테이블에서 볼 수 있는 모든 결과 및 필터 목록을 다운로드합니다. Download Substances 는 (필터링된) 테이블에 나타나는 모든 물질 목록을 다운로드합니다. 필터 재설정 은 전체 테이블 필터를 포함한 모든 테이블 필터를 지웁니다.
  2. 질량 스펙트럼 검색: 이 검색을 수행하여 사용자가 제공한 스펙트럼을 기반으로 데이터베이스에서 질량 스펙트럼 일치 목록을 검색합니다( 그림 7 참조).
    1. 4개의 필수 입력 필드를 채우거나 조정합니다: Daltons의 대상 물질에 대한 질량 범위 , Daltons 또는 ppm의 오차 범위가 있습니다. GC/MS 또는 LC/MS 방법론; 전하 대 질량 및 강도 쌍의 목록으로 제공되는 질량 스펙트럼; 그리고 피크 유사성을 위한 질량 창의 크기 .
    2. 해당 필드가 채워지면 그 아래에 있는 검색 버튼을 클릭합니다.
      참고: 검색이 완료되면 스펙트럼이 발견되면 질량 범위와 일치하는 모든 물질에서 선택한 방법론과 일치하는 스펙트럼이 나열된 표가 페이지 오른쪽에 나타나며 사용자가 제출한 스펙트럼과 데이터베이스 스펙트럼 간의 엔트로피 유사성에 따라 정렬됩니다.
    3. 테이블에서 행을 선택하여 사용자 스펙트럼과 데이터베이스 스펙트럼의 비교를 보여주는 플롯을 불러옵니다(각각 플롯의 맨 위와 맨 아래에 있음). Minimum similarity to show 필드를 사용하여 지정된 엔트로피 유사성 미만의 결과를 숨길 수 있습니다.
  3. 기능적 사용 분류 시각화: 이 페이지는 AMOS의 기능적 사용 온톨로지를 시각화하고 해당 사용 클래스에 대한 메서드 및 팩트 시트에 대한 링크를 제공합니다. 클래스는 유방향 그래프로 표시되며, 간선은 보다 일반적인 부모 클래스에서 보다 구체적인 자식 클래스로 이동합니다( 그림 8 참조).
    1. 오른쪽에 있는 검색 필드를 사용하여 기능적 사용 클래스 목록을 검색합니다. use 클래스 이름 위로 마우스를 가져가면 그래프에서 해당 노드가 강조 표시됩니다.
    2. 그래프를 직접 살펴보는 경우 지정된 노드 위로 마우스를 가져가면 해당 클래스에 대한 간단한 설명이 표시되고 해당 노드에 대한 직접 부모 또는 자식 클래스가 강조 표시됩니다.
    3. 페이지 오른쪽에 있는 목록에서 클래스 이름을 클릭하거나 그래프의 노드를 마우스 오른쪽 버튼으로 클릭하여 메서드 및 팩트 시트 목록에 대한 옵션이 있는 메뉴를 표시합니다. 이 중 하나를 선택하면 해당 목록에 대한 새 브라우저 탭이 열리며 기능 클래스 필드가 선택한 기능 클래스로 미리 필터링됩니다.
  4. 토양 삼원 플롯: 이 페이지는 미국 농무부의 토양 질감 분류를 재현하여 토양 유형별로 AMOS의 방법을 검색할 수 있습니다.
    1. 플롯 영역 위로 마우스를 가져가면 플롯 구성에 대한 세부 정보를 볼 수 있습니다.
    2. 플롯의 영역을 클릭하면 선택한 토양 분류에서 미리 필터링된 매트릭스 필드가 있는 방법 목록에 대한 새 탭이 열립니다.

figure-protocol-9905
그림 6: 필터링된 분석 방법 목록. 이 표는 분석물 및 매트릭스별로 필터링되어 물 내 PFAS(per- 및 polyfluoroalkyl substances)와 관련된 방법만 표시합니다. 해당 팩트 시트 목록은 이 레이아웃과 매우 유사합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-protocol-10369
그림 7: 스펙트럼 유사성 검색 결과. AMOS 데이터베이스의 카페인 스펙트럼이 입력으로 사용됩니다. 유사 스펙트럼은 물질별로 그룹화되며 최대 유사성 점수는 1.0입니다. 대칭복사된 플롯은 입력 스펙트럼(위)과 선택한 데이터베이스 스펙트럼(아래)을 보여줍니다. 연한 파란색 피크는 입력에 고유하고, 주황색 피크는 데이터베이스와 일치하며, 진한 파란색 피크는 공유됩니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-protocol-10904
그림 8: 기능적 사용 분류 시각화. 계층 구조는 커서가 "industrial chemicals" 노드(노란색 윤곽선) 위로 마우스를 가져가면 표시됩니다. 자식 클래스는 녹색으로 윤곽선이 표시되어 있습니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

figure-protocol-11348
그림 9: 토양 삼원 플롯 시각화. 이 플롯에는 토양 샘플에 대한 조성 데이터가 표시됩니다. 오른쪽 상단의 툴팁은 현재 커서 아래에 있는 영역의 정확한 구성을 보여줍니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

결과

위에 표시된 AMOS의 스크린샷은 관심 물질에 대한 검색과 스펙트럼, 팩트 시트 및 방법 간의 검색을 포함하여 애플리케이션의 개별 검색에서 얻은 일반적인 결과를 보여줍니다. 데이터베이스를 조사하는 다양한 방법은 데이터 및 데이터와 관련된 물질에 대한 심층적인 조사를 허용하는 방식으로 가장 가능성이 높고 가장 유용한 종류의 검색을 다루기 위한 것입니다.

사용자의 검색을 지원하기 위해 대부분의 기능은 사용 가능한 데이터에 대한 심층적인 검사를 지원하기 위한 방식으로 상호 연결됩니다. 워크플로우의 예로, 기능적 사용 분류 시각화는 해당 기능 클래스와 관련된 분석법 및 팩트 시트의 보기에 연결되며, 여기에서 물질 목록을 추출하여 배치 검색에 입력하거나 개별 문서를 검사하고 해당 문서의 개별 물질을 추가로 조사할 수 있습니다. 분석법의 많은 물질은 데이터베이스에 실험적 질량 스펙트럼도 있기 때문에 연구자는 물질 범주에서 특정 물질의 존재를 테스트할 수 있는 일련의 방법 및 스펙트럼으로 빠르게 이동할 수 있습니다( 그림 9 참조).

결과는 검색되는 항목과 실행되는 검색에 따라 크게 달라지므로 전체 응용 프로그램에 대한 대표 결과를 정의하기가 어렵습니다. 전반적으로 사용자 경험 측면에서 "성공"을 설명하는 것이 더 정확할 수 있습니다. 이 경우, 다음과 같은 결과가 일반적으로 적용되기를 바랍니다: 검색 및 필터링 방법(및 다른 검색과 필터 사이를 이동할 수 있는 기능)이 사용자가 원하는 정보의 하위 집합을 식별하는 데 효과적입니다. 사용자가 찾은 결과가 정확하고 유용한지 확인합니다. 그림 10 은 AMOS 기능을 보여주는 워크플로우의 예를 보여줍니다.

figure-results-1064
그림 10: AMOS 기능을 보여주는 워크플로우 예시. 워크플로우는 기능적 사용 분류(호흡기 약물)로 시작하고, 혈액 내 호흡기 약물과 관련된 방법을 필터링하고, 하나의 특정 방법을 검사하고, 해당 방법에 포함된 물질에 대한 스펙트럼을 식별합니다. 이 그림의 더 큰 버전을 보려면 여기를 클릭하십시오.

토론

많은 프로젝트와 응용 프로그램이 메서드, 팩트 시트 또는 특정 종류의 스펙트럼과 같은 단일 유형의 레코드에서 정보를 수집하고 표준화하는 데 중점을 두지만, AMOS는 여러 레코드 유형에 걸쳐 대량의 정보를 컴파일하고 통합하는 첫 번째 도구입니다. 이러한 다양한 소스의 데이터를 통합, 조화 및 구조화하면 분석 화학 방법론에 액세스해야 하는 워크플로우에 보다 쉽게 통합할 수 있는 데이터베이스를 만들 수 있습니다. 여러 가지 보완적인 방법으로 데이터베이스를 검색할 수 있는 기능을 통해 여러 웹 사이트 또는 도구에서 광범위한 수동 작업이 필요할 수 있는 정보를 효율적으로 검색할 수 있습니다.

공개되기 전에 AMOS의 유용성은 EPA 직원이 광범위한 프로젝트를 지원하기 위해 사용함으로써 입증되었습니다. EPA는 비표적 분석을 위한 질량 분석법의 적용에 지속적인 관심을 가지고 있으며,10,11 , 여러 이니셔티브는 AMOS의 실험적 질량 스펙트럼을 활용하여 DSSTox 화학 물질 12,13에서 생성된 대규모 인실리코 스펙트럼 라이브러리에 대한 검색을 향상시켰습니다. 다른 프로젝트에서는 구조적 유사성 검색을 사용하여 새로운 방법 개발의 시작점을 식별하고, 기존 방법을 검토하여 검출 및 정량 한계를 평가하고, 화학 물질 공간 적용 범위를 평가하기 위해 방법과 연결된 화학 물질 컬렉션을 분석했습니다.

AMOS의 잠재적 학습 데이터 집계는 NTA(Non-targeted Analysis) 워크플로우를 발전시키기 위한 핵심 요구 사항인 분석 방법14에 대한 편의 시설의 정량적 모델 개발을 추가로 지원합니다. AMOS 내의 큐레이션 노력은 또한 방법론적 커버리지와 관련된 화학적 공간을 모델링, 탐색 및 시각화하는 이니셔티브를 촉진합니다14.

AMOS의 핵심 기능은 완성도 단계에 이르렀지만, 사용자 피드백에 따라 개발이 진행됩니다. 현재 작업에는 추가 데이터 통합, 향상된 필터링을 위한 추가 메타데이터 큐레이션 및 검색 기능 확장이 포함됩니다. EPA 이해 관계자와의 협력을 통해 프로그래밍 방식의 액세스를 가능하게 하는 애플리케이션 프로그래밍 인터페이스(API)를 개발 중이며, 그래픽 사용자 인터페이스(GUI)가 비효율적일 수 있는 사용 사례를 해결합니다. 릴리스 정보 페이지가 애플리케이션에 통합되어 시간이 지남에 따라 코드 업데이트를 추적하고 전달할 수 있습니다.

새로운 데이터 기록 및 화학 물질은 현재 매주 추가됩니다. 그러나 공개 출시 이후 출시 일정이 느려질 것으로 예상됩니다. 레코드 및 관련 메타데이터의 정확성을 보장하기 위해 상당한 노력을 기울이고 있지만 대부분의 데이터는 공용 데이터베이스에서 비롯됩니다. 따라서 모든 기록에 대한 완전한 검증은 불가능하며 사용자는 절대적인 데이터 정확성을 보장할 수 없다는 점을 알고 있어야 합니다.

공개

이 백서가 반드시 미국 환경 보호국의 견해나 정책을 나타내는 것은 아닙니다.

감사의 말

저자는 데이터베이스를 위한 화학물질을 큐레이팅하는 모든 작업에 대해 큐레이션 팀에게 감사를 표하고, AMOS의 구축 및 배포에 대한 기술 지원을 제공한 Joshua Powell, Asif Rashid, Freddie Valone에게 감사를 표합니다. 우리는 또한 원고에 대한 검토를 해준 Charles Lowe에게 감사드립니다.

자료

NameCompanyCatalog NumberComments
GitN/Ahttps://git-scm.com/Open-source version control system.
JavaScriptN/Ahttps://ecma-international.org/publications-and-standards/standards/ecma-262/Programming language.  Defined by ECMA International standards.
PostgreSQLPostgreSQL Global Development Grouphttps://postgresql.org/about/licenceOpen-source database management system.
PythonPython Software Foundationhttps://www.python.org/Open-source programming language.

참고문헌

재인쇄 및 허가

JoVE'article의 텍스트 или 그림을 다시 사용하시려면 허가 살펴보기

허가 살펴보기

더 많은 기사 탐색

220

This article has been published

Video Coming Soon

JoVE Logo

개인 정보 보호

이용 약관

정책

연구

교육

JoVE 소개

Copyright © 2025 MyJoVE Corporation. 판권 소유