바이오 의료 빅데이터 분야 세계적인 전문가인 마이크 체리(Mike Cherry) 미국 스탠퍼드대 의과대학 교수가 인공지능(AI) 발전을 위해서는 양질의 데이터와 이를 이해할 수 있는 데이터 전문가의 역할이 중요하다고 밝혔다.
체리 교수는 본지와 단독으로 만나 AI 발전에서 사람의 역할을 강조했다. 현재 AI 발전에서 컴퓨팅 역할이 크게 강조되고 있지만, 본질은 사람이라고 밝혔다. 구글 딥마인드나 오픈AI와 같은 AI 혁신 기업들이 데이터를 이해할 수 있는 전문가를 지속 고용하는 것도 이 때문이라고 설명했다. 그는 “단순히 컴퓨팅 자원을 제공하는 것만으로 AI 발전을 이룰 수 없다”며 “데이터와 이를 이해하는 전문가가 함께 있어야 진정 원하는 결과를 얻을 수 있다”고 강조했다.
체리 교수는 유전체학과 생물정보학 분야에서 세계적으로 인정받는 학자다. 유전체 기능 분석을 위한 미국 국립보건원(NIH) 주도 컨소시엄 프로젝트인 ENCODE뿐만 아니라, 유전자 온톨리지(Gene Ontology) 컨소시엄, 모델 생물 유전체 데이터베이스인 SGD(Saccharomyces Genome Database) 등 다양한 대형 프로젝트를 이끌어 오고 있다. 최근에는 인간 세포 지도(Human Cell Atlas) 프로젝트에도 참여하는 등 생명의료 대규모 데이터 통합 및 분석 소프트웨어 개발 분야를 선도하고 있다. 그동안 그의 연구와 공공 데이터베이스 구축 노력은 전 세계 연구자들이 유전학 데이터에 쉽게 접근하고 활용할 수 있도록 도와 과학적 발견과 혁신을 촉진하고 있다고 평가된다.
이번 인터뷰는 체리 교수의 제자인 송길태 부산대 AI융합대학원장이 동석했다. 송길태 원장은 2012년부터 2016년까지 스탠퍼드대 의과대학 유전학과에서 박사후연구원으로 근무하면서 체리 교수와 인연을 맺었다. 당시 체리 교수가 그의 멘토였다.
- 유전체학 분야에 AI가 접목되고 있다. 유전체학 대가로서 어떻게 보는가.
“AI가 유전체학 분야에 접목되는 점은 흥미로운 일이다. 단백질을 분석하는 AI 모델의 사례는 흥미로웠다. 구글 딥마인드가 만든 AI 모델인 알파폴드 사례다. 이 AI 모델은 큰 단백질 구조를 2분 안에 해결했다. 단백질 데이터베이스(DB)는 대략 50년에 걸쳐 만들어진 분자 구조 DB다. 단백질 하나의 구조를 얻기 위해 많은 노동이 필요했는데, AI가 그 과정을 줄였다. 그런데 유전체학에서 얻은 데이터의 복잡성은 매우 크다. 한 종류의 데이터를 분석하는 알고리듬을 만드는 것은 어렵다. 또 여러 종류의 데이터를 분석하는 것은 불가능하다고 본다. AI는 그 경계를 넘어야 한다. 새로운 기술들이 지속 도입되면서 유전체학 AI 기술은 지속 발전할 것으로 본다.”
- 한국에서도 의료 분야나 유전체학 분야에 AI를 접목하고 있다. 대기업부터 스타트업, 대학에서도 관련 연구가 많이 진행되고 있다. 조언할 점은.
“최근 AI 개발을 하는 데 있어서 컴퓨팅이 많이 강조된다. 데이터가 많아지고 모델이 커지면서 컴퓨팅 자원이 필요해졌다. 그런데 AI가 다른 도메인에 접목돼 실질적인 활용을 끌어내려면 컴퓨팅 이상이 필요하다. 좋은 품질의 데이터가 필요하고, 이 데이터들을 이해하는 전문가가 필요하다. 컴퓨터보다 사람의 역할이 더 중요하다는 의미다. 구글 딥마인드나 오픈AI에서도 전문가 고용에 적극적인 이유도 이 때문이다.”
출처 : http://https://www.newstheai.com/news/articleView.html?idxno=5568