AI 기반 전사체 데이터를 이용한 환경요인 분류 및 예측 연구
A Study on the Classification and Prediction of Environmental Factors based on AI using Transcriptome Data
중금속, 미세플라스틱 등 다양한 환경오염 물질이 수생태계 미치는 영향을 평가하기 위해서 물벼룩과 같은 수생태계 모델 생물의 전사체 데이터를 기계학습 기법을 적용하여 노출되는 환경요인을 신속히 판별하고 예측하는 것을 목표로 한다.
Open source database로부터 OECD에서 지정한 독성평가의 표준시험생물인 물벼룩(Daphnia magna)을 대상으로 수생태계에 환경문제를 일으킬 수 있는 환경요인에 대한 전사체 데이터를 수집한다. 수집한 전사체 데이터는 quality check과 trimming을 수행하여 가공하고 환경요인에 따른 특이발현유전자를 발굴한다. 환경요인을 정확히 식별할 수 있는 특이발현유전자를 선정하기 위해 feature-selection을 수행하고 선정된 features는 Random Forest, XGBoost 등 기계학습 기반의 다양한 알고리즘을 적용하여 환경요인의 판별 및 예측을 위한 최적화된 모델을 구축한다.
본 연구는 한국환경연구원, 낙동강생물자원관, 물환경연구소, 국립환경과학원 등 수생태계 환경모니터링을 수행하는 기관이 현장에서 활용 가능할 것으로 사료되며, 이를 통해 다양한 환경오염 물질이 수생태계에 미치는 영향을 평가하고 이를 방지하는데 도움이 될 것으로 기대된다.