You are here

Dr. Jo Røislien 인터뷰: 생물통계학자의 역할이 어느 때보다도 큰 시기

에디티지 인사이트 | 2015년2월2일 | 조회수 42,017
Dr. Jo Røislien 인터뷰
Dr. Jo Røislien, Associate Professor, Dept. of Health Sciences, University of Stavanger

Jo  Røislien 박사는 라디오, TV, 인쇄 매체 등에 고정 출연해 널리 이름을 알린 과학 커뮤니케이터입니다. 그의 강의는 까다로운 주제나 과학적 지식을 전달하기도 하고 박사 자신의 연구에 대해 알리기도 합니다. 노르웨이 최대의 공영방송 NPK 1에서 수학과 통계학을 주제로 한 “수(Siffer)” 라는 프로그램을 진행하기도 했고, 디스커버리 채널에서도 여러 가지 시리즈를 진행했습니다. ‘크리스티안 홀름글라드 감독과 함께 “불도저 필름”을 통해 수학에 관한 단편 영화 “세상에서 가장 큰 수를 찾아서” 를 제작하기도 했습니다. 그가 처음 이름을 알린 “digits” 라는 프로그램은 2012년 노르웨이에서 매년 열리는 TV 시상식인 “굴루텐 시상식”의 “최고의 신작 시리즈”, “최고의 라이프스타일 시리즈” 두 개 부문 후보가 되기도 했습니다.

Røislien 박사는 수학에 대한 여러 가지 저작을 남겼는데, 그 중 “숫자 이야기(2013)”는 “올해의 가장 아름다운 도서상”을 수상하였고 노르웨이 의학 협회 저널로부터 “보석처럼 반짝이는 통계학 서적” 이라는 평을 받기도 했습니다.

Røislien 박사는 노르웨이의 수학자이자 생물통계학자, 의학 연구자로 노르웨이 과학기술대 (NTNU)의 석유공학 및 응용지구물리학과에서 지구통계학 박사학위를 받았습니다. 그는 릭스호스피탈렛 대학병원의 연구고문, 오슬로대학(UiO) 생물통계학과 박사후연구원, 그리고 노르웨이 에어앰뷸런스 재단의 선임연구원으로 재직했습니다. 또 베스트폴드 병원신탁, 수나스 재활병원, 노르웨이 공공의료 연구소가 만든 병적 비만 연구센터 등 다양한 의학 연구 프로젝트에서 통계전문가 및 연구원으로 협력했습니다. 현재 그는 스타방에르 대학의 보건과학대학 조교수인 동시에 오슬로 대학의 생물통계학과, 중독연구센터에서 추가적인 직위를 맡고 있습니다.

선생님의 연구 관심사는 무엇이며, 또 어떻게 그런 관심을 갖게 되었는지 궁금합니다.

연구저작물에서 가장 중요한 항목은 무엇보다도 “방법” 항목입니다. 결론은 연구 결과에 직접적으로 기반을 두고 있으며, 연구 결과는 이 연구에 적용된 방법의 직접적인 귀결이니까요. 그렇기에 학술 토론은 주로 연구 결과가 아니라 연구 방법을 놓고 이루어집니다. 연구 방법이 뒷받침되지 않는다면 연구 결과에는 아무런 가치가 없습니다.

통계학자로서 저는 언제나 방법론을 편애합니다. 결국은 의학을 연구하게 되었지만 젊을 때는 의학에 딱히 큰 관심이 없었습니다. 저는 공학, 수학, 정보학, 통계학을 공부했습니다. 10년 전 지구통계학과 석유공학으로 박사학위를 끝냈을 당시 제 여동생이 오슬로 대학병원의 통계 연구원으로 지원해 보도록 권하더군요. 아직도 그곳에서 처음 책상에 앉았던 순간이 떠오릅니다. 저는 몇 가지 문제를 풀고 있었는데, 갑자기 바로 제 책상 위에 흩어져 있는 종이 조각들이 실제로 삶과 죽음을 담고 있다는 사실이 번개가 내리치듯 제 머릿속에 들어온 것입니다. 무척 강렬한 경험이었지요. 그 후로 다시는 돌아보지 않습니다.

저는 의학과 통계학 분야의 다양한 주제를 넘나들며 수많은 의학 연구 프로젝트에 협력했습니다. 그리고 서서히 제 주된 연구 관심사가 시간성 데이터 분석으로 옮겨가더군요. 시간성 데이터 분석은 보통 복수의 개인에 대한 복수의 시간적 측정이 일어날 시 이를 적절히 분석하는 법을 다루지만, 장기간에 걸친 비선형적 증가, 분기별 영향, 계절별 영향 등의 조합을 비롯한 다층적 시간적 측정의 동시적 모델링을 다루기도 합니다. 제가 노르웨이 공공보건연구소, 노르웨이 중독연구센터, 노르웨이 에어앰뷸런스 재단 등에서 협력 연구를 진행할 땐 이런 문제들을 계속 다루게 되었습니다.

의학연구의 역사가 길어짐에 따라 데이터 수집 역시 보다 복잡해졌습니다. 모든 것을 무작위 제어 실험으로 테스트할 수 없기에 인과관계의 확립을 위해 연구 설계가 보다 복잡한 데이터로 귀결되는 경향이 있습니다. 이러한 데이터의 분석을 위해 필요한 통계적 모형이 너무 단순하거나 아예 부재하는 실정이기 때문에 방법론적 연구가 감당해야 하는 면이 큽니다. 생물통계학자가 할 일이 어느 때보다도 많은 시점인 셈입니다.

오늘날 생물통계학이라는 분야에서 데이터가 가지는 특성을 간단히 설명해 주시겠습니까?  

의생명과학 분야에서 통계학자로 일한다는 것은 굉장히 소중한 경험입니다. 문제의 유형이 극도로 다양하고 이 과정에서 마주치게 되는 데이터 역시 다양합니다. 6마리 쥐를 사용한 랩 실험, 2개로 나뉜 그룹 중 하나를 차지하는 50명에 대한 소규모 무작위 임상시험, 수많은 사람들 각각에게 수십 회의 시간적 측정을 사용한 잠재된 건강 위험성에 대한 장기적 연구, 2차원과 3차원 방사선 영상을 사용한 암세포 분석, 10,000개 유전체 데이터 등입니다.

의생명과학에서 단순한 데이터 수집만을 위해 데이터를 수집하는 경우는 거의 없습니다. 보통은 어떠한 가설을 시험하고자 하거나, 답을 찾고자 하는 질문이 있습니다. 그렇기에 데이터 수집은 특정적인 경우가 많고, 시간이 많이 걸리곤 합니다. 박사과정 학생들은 데이터를 분석하고 실제로 어떤 연구결과를 구상하기 전까지 첫 몇 년 간을 데이터 수집만으로 보내는 경우가 많습니다. 저는 분명 데이터의 접근 가능성을 늘려야 한다는 입장이지만, 데이터 수집의 수혜를 받는 측에서 이 같은 입장을 취하기는 참 쉬운 것이 사실입니다. 만약 어떤 의문에 대한 답을 찾고자 인생의 몇 년 간 데이터를 수집하며 지냈는데 이렇게 수집한 데이터에 모든 사람들이 즉시 접근할 수 있게 해주지 않는다고 보수적이라거나 이기적이라는 말을 듣고 지내야 하는 입장에서는 연구 데이터를 공정하게 분배하기가 쉽지 않겠지요. 

데이터의 수집은 그 “방법” 자체가 또 하나의 연구 분야라는 점에서 더욱 도전적인 과제입니다. 저는 현재 노르웨이 에어앰뷸런스 재단과 함께 전병원 단계의 의료행위에 대한 지식 증진을 위한 연구에 협력하고 있습니다. 사고 발생 후 사고 장소에 최초로 도착한 헬기에서 내린 의료진이 처음으로 취할 행동은 정식 서류에 여러 가지 가능성을 구성하는 요인들을 받아 적거나 환자의 혈액에서 채취한 다양한 생물지표를 측정하는 일이 아니며, 그래서도 안 됩니다. 그러나 환자가 병원에 도착한 다음에 이 같은 요소들을 측정한다는 것은, 곧 환자가 의료진과 최초 접촉한 후로부터 어떠한 상태가 진행 중인지에 대해 아무런 정보가 없음을 의미합니다. 그렇다면 의료진이 취한 어떠한 조치가 실제로 도움이 되었는지도 알 수 없겠지요.

주로 실시간으로 일어나게 될 이 같은 상황에서 무엇을 어떻게 측정할지 알기 위해선 엔지니어, 분자생물학자 등 다양한 분야의 전문가와의 협력이 필수적입니다. 이를 통해 신체가 다양한 개입에 어떻게 반응하는가를 알아낼 가능성 역시 크게 증대됩니다. 시간이 가장 중요하다는 것을 모두가 알지만, 정확히 어떻게 중요한지를 알아야 하겠지요. 

연구자들에게 일반적으로 데이터마이닝(data mining)이 가지는 어려움이나 위험성은 어떤 것이 있을까요?

우연이란 참 재미납니다. 우연에는 우리가 인정하는 것보다 더 깊은 구조가 있지요. 그래서 저는 데이터마이닝이라는 주제가 나올 때 경고의 손짓을 던지는 편입니다. 통계적 분석이란 “데이터에서 패턴을 찾기” 와는 다릅니다. 데이터에는 언제나 패턴이 있으니까요. 작은 패턴, 큰 패턴, 단순한 패턴, 복잡한 패턴이 있습니다. 그리고 더 면밀히 바라볼수록 더 많은 패턴들이 나타납니다.

그러므로 데이터마이닝을 시작했을 때 중요한 것은 패턴을 찾는가의 여부가 아니라 찾아낸 패턴 안에 실제로 데이터의 구조가 반영되는지, 아니면 단순한 우연인지를 알아내는 것입니다. 통계적 분석이란 무작위 패턴 속에서 실제 패턴을 구분하는 행위입니다. 단순한 우연과 진짜 관계성을 구분하는 것입니다. 그리고 가장 중요한 것은, 통계를 통해서 연구 결과의 확실성 수준을 양적으로 측정할 수 있는가 아닌가 하는 것입니다.

그렇기에 2013년 가을 오슬로에서 열린 TEDx 강연에서 “풍요의 역설” 을 주제로 강연 요청을 받았을 때도 저는 이 주제를 선택했던 것입니다. 데이터셋이 크다면 반드시 더 많은 패턴, 더 복잡한 패턴을 찾게 되지만 이는 우연에 의한 것입니다. 그런데 데이터의 양이 많다는 이유만으로 우리는 큰 데이터셋에서 찾은 패턴을 더욱 신뢰하는 경향이 있습니다.

통계학이나 과학연구 방법론을 깊이 분석하지 않더라도 데이터를 무분별하게 파고드는 것이 차라리 아무 것도 하지 않는 것보다 해로울 수 있다는 사실은 분명합니다. 오늘날의 문제는 데이터의 부족이 아니라, 좋은 데이터 분석의 부족입니다.

최근 노르웨이에서는 큰 데이터셋에 대한 통계적 방법론을 개발하고자 하는 ‘빅 인사이트’ 라는 프로젝트가 만들어졌습니다. 이 프로젝트의 결과물이 정말 기대됩니다.

이어지는 인터뷰 2편에서는 Jo Røislien 박사와 함께 저널 출판, 기초연구와 응용연구의 비교, 반복연구에 대해 이야기해 보겠습니다.

스크랩하기

해당 기사를 스크랩해보세요!

지식은 모두에게 함께 공유되어야 한다는 것이 에디티지 인사이트의 이념입니다. 해당 사이트에서 제공되는 모든 기사는 Creative Commons license로 재포스팅 및 스크랩이 가능합니다. 아래의 가이드라인만 유념해주신다면 언제든지 무료로 에디티지 학술 전문가의 지식을 가져가실 수 있습니다!


  • 주의 : 에디티지 학술 전문가들은 해당 콘텐츠를 만들기 위해 많은 시간과 노력을 쏟고 있습니다. 기사를 스크랩 및 재포스팅 하실 때는 명확한 출처를 남겨주시기 바랍니다.
  • 이미지 재사용: 이미지를 원본이 아닌 편집 재사용하실 때는 에디티지 인사이트의 허가가 필요합니다.

코드를 복사하셔서 기사 공유를 원하시는 사이트에 적용하시면 에디티지 인사이트 기사를 가장 쉬운 방법으로 공유하실 수 있습니다.
 
위 코드를 복사하시어 원하시는 곳에 다시 포스팅 하실 수 있습니다.

덧글