기업조회

보고서

보고서

보고서 기본정보

Flow cytometry 데이터 처리를 위한 머신러닝 기반 데이터 분석 프레임워크

보고서 개요
기관명 NDSL
공개여부
사업명
과제명(한글)
과제명(영어)
과제고유번호
보고서유형 report
발행국가
언어
발행년월 2017-05-01
과제시작년도

보고서 개요

보고서 개요
주관연구기관 서울과학기술대학교
연구책임자
주관부처
사업관리기관
내용
목차
초록 연구의 목적 및 내용 본 연구에서는 flow cytometry (유세포분석기) 데이터 분석을 위한 머신러닝에 기반 프레임워크를 구축하는 것이 주요 연구목표이다. Flow cytometry (유세포분석기)는 바이오메디컬 분야에서 세포 수준의 정량적 분석을 가능하게 하는 중요한 기술이다. 매초 수천 개의 세포에서 여러 물리적, 생물학적, 화학적 성상을 동시에 계측하여 수치 데이터를 생성해 낼 수 있어 정량적 분석을 하는데 있어 폭 넓게 이용되고 있다. 하지만 광범위한 사용에 비해 flow cytometry 장비로부터 얻어지는 풍부한 데이터를 체계적으로 분석할 수 있는 분석 기술 및 표준화된 분석 방법이 정립되지 않은 실정이다. 또한 자동화된 분석알고리즘 개발이 미진하여 이로 인해 측정 데이터로부터 의미 있는 결과를 도출하기까지 수작업에 의존하는 여러 단계의 데이터 처리 과정을 거치는 과정에서 인적, 시간적 낭비가 발생하고 있다. 이에 본 연구에서는 머신러닝 방법론을 이용하여 flow cytometry 데이터 분석을 위한 알고리즘을 고안하고 이를 바탕으로 자동화된 데이터 분석 프로세스를 구축하고 소프트웨어 패키지를 연구 개발하고자 한다. 연구결과 • flow cytometry 데이터는 15명의 정상 환자로부터 peripheral blood sample를 채취하여 획득한 15개의 데이터 셋을 수집하였다. • 각 데이터 셋에는 약 10,000~100,000개의 세포가 있으며, 각 세포에서 FS, SS, CD45, CD4,CD8, CD3에 해당하는 6개의 feature 측정값이 있다. • Flow cytometry 데이터는 일반적으로 여러 feature 쌍들에 대하여 2차원 평면에 투사하여 그려진 scatter plot을 통하여 분석하며, 다양한 세포 종류에 따라 여러 군집을 형성한다. • Flow cytometry 데이터의 gating을 자동화하기 위해 임상의가 수작업을 통해 gating한 기존의 데이터를 이용하여 support vector machine 모델을 생성하고 이를 새로운 데이터에 적용하여 원하는 세포군을 자동으로 gating 하였다. • 세포 종류의 계층성을 이용하여 각 세포 종류를 분류하기 위해 계층적 데이터 군집 기법인 hierarchical clustering 알고리즘을 제안하였다. 제안한 알고리즘은 데이터 밀도 분포를 추정하여 각 클러스터를 찾는다. 여러 밀도 레벨에 해당하는 레벨 셋을 추정하기 위해 OC-SVM(one-class support vector machines)을 이용한 알고리즘을 제안하였다. • 데이터 계층구조는 dendrogram이나 spanning tree를 이용하여 시각화해 나타낼 수 있다. 연구결과의 활용계획 • 본 연구는 flow cytometry 데이터에서 다양한 종류의 세포군 중에서 lymphocyte를 구분하는데 초점을 두고 진행하였다. lymphocyte를 구분하는 것은 혈액 관련 질병의 진단과 치료에서 중요한 부분을 차지하고 있어 관련 질병 진단 치료에 활용 가능할 것이다. 또한 다른 종류의 혈액세포를 구분하거나 pheripheral blood sample이 아닌 다른 부위에서 얻은 데이터에도 본 연구결과를 적용 가능할 것으로 보인다. • 생물학, 해양학 등에서도 미생물 분석 등에 flow cytometry가 이용되는 것으로 보고되고 있어 본 연구의 결과는 다른 분야에도 적용 가능할 것으로 보인다. • 현재 neural network에 기반한 deep learning이 활발하게 연구되고 있으며 다양한 분야에서 활용이 확대되고 있는 추세이므로 flow cytometry 데이터 분석에 있어서 추후 deep learning을 활용하여 gating 알고리즘을 개선하는 방안을 고려한 필요가 있다. ( 출처 : 한글요약문 4p )
원문URL http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=REPORT&cn=TRKO201800004466
첨부파일

추가정보

추가정보
과학기술표준분류
ICT 기술분류
주제어 (키워드)