콘텐츠바로가기

뉴스인사이드

디지털 전환 시대의 바이오 연구데이터

글자작게 글자크게 인쇄 목록으로

글 이진환 한국표준과학연구원 첨단바이오 전략기술연구단장

미국 국립보건원(NIH)은 연구데이터와 관련해 중요한 정책을 지난해 공표했다. 올해부터 NIH가 지원하는 연구과제의 계획서를 제출할 때 데이터관리계획(DMP)을 수립해야 하며 과제 종료 시 연구데이터를 의무적으로 공개해야 한다는 것이 그 골자다. 이번 호에서는 바이오 분야의 ‘재현성 위기’ 및 이를 극복하기 위한 ‘바이오 대전환’을 짚어보고자 한다.

1980년 베이-돌 법안(Bayh-Dole Act)의 시행으로 미 연방정부의 지원을 받은 공공연구소, 대학, 비영리연구소가 생산한 연구성과와 연구데이터의 소유권을 연구수행기관과 연구자들이 행사할 수 있게 됐다. 그 결과 특허출원과 기술이전이 활성화되며 산업 발전에 기여했다.

이러한 역사적인 맥락을 되돌아보면 이번 NIH의 결단은 얼핏 시대의 흐름을 거스르는 것처럼 보인다.

NIH가 내린 급진적 결정의 배경에는 바이오 분야의 재현성 위기(Reproducibility Crisis)가 자리잡고 있다. 2012년 미국 제약회사 암젠의 연구팀은 논문 한 편을 발표했다. 전임상 종양학 분야에서 획기적인 발견을 한 53개의 논문 검증 결과, 단 6편(11%)만을 재현할 수 있었다는 충격적인 보고였다.

바이오 분야의 재현성이 떨어진다는 암묵적인 공감대는 형성되어 있었으나 이렇게 다수 논문의 재현성을 체계적으로 검증한 것은 처음이었다. 이는 바이오 분야 연구성과 재현성 논의의 시발점이 됐다.

바이오 연구성과가 재현이 되지 않는 이유로 암젠의 연구팀은 표준화되지 않은 실험절차, 검증되지 않은 시약·재료의 사용 등을 제시했다. 또 다른 연구에서는 재현되지 않는 바이오 분야 연구데이터 생산을 위해 낭비되는 연구비가 미국에서만 연간 10조 원에서 50조 원에 이를 것으로 추산했다.

이후 바이오 각 분야의 연구성과를 검증하려는 움직임이 생겨났으나 검증 대상 논문 중 50% 이상이 재현된 경우는 없었다. 특히 미국 정부가 별도의 검증팀을 구성해 8년간 암 분야 연구성과 검증을 직접 진행한 결과도 이와 별반 다르지 않자 결국 칼을 빼들게 된 것이다. 미국 정부는 연구데이터의 일괄적·포괄적 공개와 같은 강력한 규제 정책을 통해 연구자들에게 본인이 생산한 연구데이터의 신뢰도에 대해 일정 부분 책임을 지게 함으로써 실험의 재현성을 제고하려는 것으로 보인다.
실험 위주에서 데이터 기반으로 변화하는 R&D

국내 바이오 연구성과의 재현성에 대한 공식적인 데이터는 없다. 하지만 바이오 연구데이터 생산과 관련된 관행이 미국과 크게 다르지 않다고 가정한다면, 국내 연구성과 중에도 재현이 되지 않는 경우가 상당수 있을 것으로 유추할 수 있다.

이에 한국 정부는 바이오 분야 연구데이터 관리제도의 중요성을 인식하고 정책적인 노력을 하고 있다. 정부는 10개 관련 부처가 참여한 범부처 ‘제3차 국가생명연구자원 관리·활용 기본계획(2020~2025)’을 수립해 생명연구자원 빅데이터 구축 전략을 추진 중이다. 다른 선진국에 비해 뒤처진 바이오데이터의 수집과 공유 체계를 마련하는 것이 주목적이다.

부처·사업·연구자별로 흩어져 있는 바이오 연구데이터를 ‘국가 바이오데이터 스테이션’에서 통합 수집 및 제공해 선진적인 데이터 기반의 R&D 환경이 조성될 것으로 기대된다. 또한 한국연구재단의 일부 국책사업을 대상으로 DMP 수립을 적극적으로 장려하고, 과제 수행 중 생산된 연구데이터를 공개하도록 하는 제도를 시행 중이다.

이처럼 바이오 분야 연구개발(R&D)의 낮은 재현성, 높은 불확실성 등이 화두가 되면서 이를 극복할 해결책에 대한 요구가 커지고 있다. 이는 바이오제약산업의 글로벌 신약 개발 비용과 기간이 증가하고, 투자 대비 수익률이 감소하는 현상과도 무관하지 않다.

바이오제약업계는 바이오와 디지털 역량 접목으로 과거에는 불가능했던 기술이 가능해지면서 새로운 R&D 및 산업적 기회가 창출되는 것에 주목하고 있다. 인공지능(AI), 빅데이터 등을 활용해 연구, 사업화 과정의 시간과 비용이 크게 줄어들고, 혁신기술의 조기 확보가 가능한 바이오 대전환 시대가 다가오고 있다.

바이오 대전환은 연구데이터를 핵심 연구자원으로 활용하고 첨단 디지털 기술을 내재화하는 것을 특징으로 한다. 실험 위주의 R&D에서 데이터 기반 R&D로의 변혁이 시작되고 있다. 구글은 AI 기반 로제타폴드 소프트웨어를 사용해 수 분에서 수 시간 내에 단백질의 3차원 구조를 정확하게 해독했다. 이는 과거 해독까지 길게는 수년이 소요되거나 해독이 불가능했던 단백질 3차원 구조가 존재했던 사실과 견주어 보면 비약적인 발전이다.

미국 외 선진국도 발 빠르게 디지털 바이오 시대를 준비하고 있다. 유럽 분자생물학연구소(EMBL)는2017년부터 디지털 바이오 사업을 추진 중이며 영국의 맨체스터대와 독일의 뮌헨공대는 디지털 바이오 대학원 과정을 개설했다. 일본 정부는 데이터 중심의 바이오-디지털 융합을 강조한 ‘바이오전략 2020’을 발표하고, 연구데이터 수집·공유를 위한 ‘연구디지털전환 전략’도 함께 추진하고 있다.
바이오 연구데이터 품질관리의 중요성

생산 이력과 신뢰도가 검증된 고품질 연구데이터는 디지털 바이오 시대의 핵심자원이다. 한국이 글로벌 디지털 바이오 시대를 주도하고 재현성 위기를 극복하기 위해서는 ‘고품질 연구데이터’를 생산하고 이를 공유, 활용하는 데이터 기반 바이오 생태계가 선제적으로 조성되어야 한다.

고품질 연구데이터 확보에는 무엇보다 생산을 위한 품질관리 절차가 필수적이다. 하지만 현재 국내 바이오데이터 공유 플랫폼에는 축적된 데이터의 신뢰성에 대한 검증과정이나 자체적인 품질관리체계가 반영되어 있지 않다. 이는 플랫폼의 활용도가 낮은 원인으로도 지적되고 있는 부분이다.

품질관리가 수반되지 않은 R&D 과정에서 발생되는 연구데이터는 연구성과의 검증에는 제한적으로 쓰일 수 있으나, 활용도나 범용성에는 한계가 있다. 정부는 바이오 연구데이터의 품질을 높이기 위해 ‘전임상 바이오 참조 데이터 사업’과 같은 임무 지향적 전략사업을 기획하고, 바이오 세부 분야별 표준운영지침(SOP), 품질관리지표 수립을 촉진하는 등 연구데이터 품질관리제도를 속속 준비 중이다.

글을 마무리하며, 향후 디지털 바이오 시대의 근간인 연구데이터 품질관리제도의 안정적 도입에 도움이 될 제언을 하고자 한다. 가장 시급한 부분은 바이오 분야에 적합한 연구데이터 품질목표를 설정하고, 품질관리 전문가와 바이오 연구자들이 협력해 품질진단과 개선을 위한 세부 분야별 맞춤형 품질관리 절차를 수립하는 것이다.

이렇게 수립된 절차는 국제적 기준에 부합해야 한다. 뿐만 아니라 정부나 공공기관은 고품질 연구데이터의 생산과 수집을 담당할 기관과 조직을 운영하기 위한 최소한의 자격요건을 제시해야 한다.

한국표준과학연구원은 해외 표준기관과의 상호검증에 참여하고, ‘시험 및 교정기관의 적격성에 대한 일반 요구사항(ISO/IEC 17025)’을 준수하며, 이미 국제적으로 통용 가능한 연구데이터 품질검증 활동을 수행 중이다.

따라서 한국표준과학연구원이 운영 중인 연구데이터 관리체계를 시범적으로 적용하는 것도 바이오 연구데이터 품질관리를 높이는 방법이 될 수 있다. 이 관리체계에서는 품질관리, 관련 기술위원회나 제3의 전문가에 의한 공인 여부 등에 따라 연구데이터의 등급을 나누게 되어 있다.

연구데이터 등급제는 이미 국내 화합물 데이터베이스에 일부 적용되고 있어 바이오 연구데이터에 대응하는 제도를 준비하고, 분야의 공감대가 형성된다면 시행에 큰 어려움은 없을 것이다.

이 제도가 시행되면 품질관리와 외부전문가의 공인을 받은 연구데이터는 최상위 연구데이터, 품질관리만 적용된 데이터는 차상위 연구데이터, 그 외의 경우 일반 연구데이터로 크게 분류할 수 있을 것이다. 사용자 입장에서는 활용 목적의 시급성·중요도에 따라 다른 등급의 연구데이터를 골라 쓸 수 있게 된다.

연구데이터 등급제는 사용자가 연구데이터를 믿고 활용할 수 있는 연구문화를 조성하고, 사업화 촉진과 연구 재현성 확보를 담보하여 국내 바이오산업이 한 단계 도약할 수 있는 기틀이 될 것이다. 디지털 바이오의 핵심자원인 연구데이터의 품질을 확보하기 위한 실효성 있는 정책이 하루속히 마련되어 바이오 선도국가의 초석이 되길 기원한다.

<저자 소개>
이진환
서울대학교 화학과에서 학·석사 과정을 마치고 미국 위스콘신-매디슨대에서 생화학 박사학위를 취득했다. 캘리포니아공대 생명학부에서 박사후과정을 마친 후 2013년 한국표준과학연구원에 입사했다. 표준연 정책전략부장, 세계물질량자문회의 단백질분석분과 한국대표, 과학기술정보통신부 연구산업진흥과장 등을 역임했다. 현재 한국단백체학회 부회장을 맡고 있다.

**이 글은 월간 매거진 <한경 BIO Insight> 2023년 3월호에 실렸습니다.

오늘의 신문 - 2024.05.09(목)