앱 기반 디지털 헬스케어의 효용성 검증 연구

앱 기반 디지털 헬스케어의 효용성 검증 연구
앱 기반 디지털 헬스케어의 효용성 검증 연구

앱 기반 디지털 헬스케어의 효용성 검증 연구에 관한 말씀을 드리겠습니다. 작년 하반기에 저희는 암 환자 라이프스타일 관리를 위한 '앱 기반 디지털 헬스케어의 실증적 근거 창출'이라는 제목의 국책 과제를 시작하게 되었습니다. 다양한 애플리케이션들이 이미 일반인을 대상으로 또는 환자들을 대상으로 사용되고 있습니다. 그러나 현재의 상태는 암보다는 당뇨와 같은 만성 질환자들에 대한 애플리케이션이 많고, 그리고 그 근거를 창출해내는 것은 앱 개발 초기 단계의 소규모 대상자를 대상으로 한 연구에서 나온 근거들이 대부분이고, 그리고 실제로도 무료인 애플리케이션에서부터 고가의 사용료를 받는 애플리케이션까지 다양하게 존재합니다. 그래서 저희 팀들은 암 환자에서 과연 이러한 라이프 스타일을 관리하는 애플리케이션이 근거 있는 효용성을 가지느냐 하는 문제, 그리고 소규모가 아니라 대규모 임상시험을 통해서 좀 더 확실한 근거를 만들어낼 필요가 있다. 그리고 과연 어느 정도의 금액을 지불하면 이런 것들이 암 환자에게 사용되는 것이 합당한 타당성을 가지느냐 하는 경제성 분석의 필요성에 주목하였습니다.

프로젝트의 연구 목표

프로젝트는 다음과 같이 4가지로 연구 목표를 말씀드릴 수 있습니다. 첫 번째는 "디지털 헬스케어를 통해서 암 환자에게 있어서 더 건강한 라이프 스타일을 구현할 수 있을까?" 하는 질문이고요. 두 번째는 "디지털 헬스케어를 통해서 암 환자의 저하된 삶의 질이 향상되는가?" 하는 질문이고요. 세 번째로는 "디지털 헬스케어가 경제성에 기반했을 때는 어떤 비용을 치르고 우리가 도입할 수 있는가?" 하는 문제, 그리고 마지막으로 네 번째는 모든 대상자가 디지털 헬스케어에 익숙한 게 아닙니다. 따라서 이러한 디지털 헬스케어가 더 많은 대상자, 즉 여기서는 암 환자인데요. 암 환자들에게 지속적으로 사용되기 위해서는 어떠한 애플리케이션의 특징, 그리고 어떠한 대상자, 암 환자의 특징이 있는지 하는 것들을 밝혀내는 것이 네 번째 목표가 되겠습니다. 저희가 비교적 아주 광범위한 플랫폼을 만들려고 노력했습니다. 제가 전체 총괄 PI를 맡고 있고요. 그리고 이 효용성 검증 연구 플랫폼은 실질적으로, 전향적으로 무작위 배정 임상시험을 하는 것이기 때문에 저희가 유방암, 대장암, 그리고 폐암 전문가를 각 센터의 대표 공동 연구자로 모시고요. 그리고 이 세 분을 정보학 전문가를 함께 모심으로써 지속적인 사용을 위한 방안을 저희가 마련해내고자 했고요. 그리고 이 연구에서 특히 강조하는 경제성 평가를 위해서 이 분야 전문가를 모셨습니다. 그리고 이러한 디지털 헬스케어, 즉 스마트폰 애플리케이션이라고 하는 것이 암 환자의 예후를 바로 변경시키지는 못할 것입니다. 대부분 암 환자의 Distress 상태라든지 또는 우울 상태라든지 이런 것들을 좋게 만드는 것이기 때문에 정신과 전문의로서 라이프케어 삶의 질 전문의를 역시 공동 연구자로 저희가 모셨습니다. 마지막으로 요즘 붐이 일고 있는 스타트업에 대한 컨설턴트 역할도 할 수 있는 플랫폼이 되기 위해서 이 분야 전문가도 공동 연구자로 저희가 모셨습니다.

연구의 단계

연구는 크게 1세부와 2 세부로 나뉘어 있습니다. 1 세부는 임상적인 효과를 검증하는 세부입니다. 따라서 유방암, 대장암, 폐암에서 실제로 전향적인 무작위 배정 임상시험을 시행하는 세부가 되고요. 2 세부는 사회, 경제적인 효과를 분석하는 세부입니다. 총 환자 수는 암종별로 320명. 그래서 이 플랫폼에서는 총 960명의 유방암, 대장암, 그리고 폐암 환자를 저희가 등록시킬 예정입니다. 다양한 임상 자료뿐만 아니라 실제로 앱 사용 데이터까지 분석함으로써 최종적인 목표를 달성하고자 하는 플랫폼입니다. 저희가 선택한 스마트폰 애플리케이션은 4가지입니다. 이 4가지는 사실 꼭 4가지 여야 할 이유는 없습니다. 앞으로 이 플랫폼이 성공적으로 구축된다면 이 4가지 이외에 다른 다양한 관련 애플리케이션이 이 플랫폼을 탐으로써 그 효용성을 검증하는 데 활용되는 것이 목표입니다. 하지만 저희가 첫 연구로써 사실 NOOM이나 또는 워크 온, 그리고 에필 케어나 세컨드 닥터 같은 것은 나름대로 애플리케이션들이 다 특징이 있습니다. 아주 고가의 사용료를 받고 있는 NOOM도 있고요. 그리고 NOOM과 워크 온은 일반인을 대상으로 만들어진 스마트폰 애플리케이션이고요. 그리고 에필 케어와 세컨드 닥터는 암 환자 특이적으로 만들어진, 그리고 일부는 무료 그리고 일부는 또 고가는 아니지만 또 사용료를 받고 있는, 그래서 저희가 이 4가지 애플리케이션을 이 플랫폼에 얹어서 임상시험을 함으로써 과연 어느 정도, 무료인 것과 유료인 것의 차이가 과연 얼마나 있는지, 그리고 암 환자 특이적으로 만들어진 것은 일반인을 대상으로 만들어진 것보다 그럼 효용이 더 큰지, 이런 것들을 서로 다양하게 비교 분석할 수 있을 것으로 예상하고 이 4가지 애플리케이션을 선정하게 되었습니다. 각각 암센터에서는 기본적으로 NOOM이라고 하는 애플리케이션과 워크 온이라고 하는 애플리케이션을 공통으로 사용합니다. 그리고 에필 케어나 세컨드 닥터, 즉 암 환자를 대상으로 특이적으로 만들어진 애플리케이션 2가지 중 1가지를 선택하게 되고 그리고 마지막으로는 아무 애플리케이션도 사용하지 않는 군을 대조군으로 저희가 설정했습니다. 각각의 군은 80명씩이고요. 그래서 총 320명, 암 종당 320명을 저희가 등록하려고 하고 있습니다. 그래서 연구 대상자 수를 선정하기 위해서 저희는 Primary endpoint를 EQ-5D 값으로 잡았습니다. 그래서 6개월 치료, 진단 치료 6개월이 되었을 때의 EQ-5D 인덱스를 가지고 저희는 이 애플리케이션의 효용성을 검증하고자 하였습니다. 탈락률 등을 고려해서 각 군당 수가 계산되었고, 그래서 암종별로 320명을 INOL을 시킨, 등록을 시키는 것이 저희의 목표가 되었습니다.

연구에서 강조하고 싶은점

이 연구에서 특히 강조드리고 싶은 부분은 저희가 단순히 암 환자의 건강 상태가 좋아지는지 또는 삶의 질이 좋아지는지에만 국한하는 것이 아니고 경제성 분석을 한다는 점이 이 연구 플랫폼의 가장 강조드리고 중요한 부분이라고 생각합니다. 예후가, 애플리케이션을 몇 개월 사용했다고 해서 예후가 좋아지지는 않을 것입니다. 그래서 저희는 앞서 말씀드린 삶의 질 지표를 측정할 것이고, 그 지표를 기반으로 해서 실제 cost 계산을 함으로써 실제 이러한 디지털 헬스케어, 즉 스마트폰 애플리케이션이 우리의 급여 시스템 안으로 들어온다면 그 비용은 어느 정도가 적절할까 하는 것에 대한 최초의 초기 근거로써 저희가 제시하고자 하는 것이 이 연구의 아주 중요한 목표 중의 하나입니다. 지금까지 이 프로젝트에서 등록, 진행되고 있는 상황에 대한 말씀을 드리겠습니다. 연구는 2020년 7월부터 저희가 시작했습니다. 2~3개월 정도의 준비 기간을 거쳐서 실제 환자 등록은 2020년 11월부터 시작되었습니다. 월평균 70명 조금 더 많은 숫자를 등록하고 있는 상황이고요. 따라서 지금 저희가 전체적으로 봤을 때 960명의 환자가 등록 목표인데, 그중 580명 조금 넘는 수준으로 등록을 한 상태입니다. 지금 추세라면 저희가 2021년, 즉 올해 하반기까지는 목표 등록을 마무리 지을 수 있을 것으로 예상하고 있습니다. 2022년, 내년이 되면 앞서 말씀드린 Primary endpoint를 비롯해서 다양한 연구 목적에 대한 아주 흥미롭고 재밌는 결론들을 저희가 분석, 발표할 수 있을 것으로 기대하고 있습니다. 그래서 저희 연구진은 건강 관리 애플리케이션의 실질적으로 효용성에 대한 근거를 확인할 수 있게 되기를 기대하면서 좋은 결과를 도출하기 위해서 최선을 다하고 있습니다. 이상의 4개의 유닛으로 나눠서 말씀을 드렸는데요. 거기에 대한 간단한 요약을 함께 해보도록 하겠습니다. 유닛 1에서 말씀드린 "유방암에서 Distress는 왜 중요한가?" Distress는 쉽게 회복되지 않는 삶의 질 영역입니다. 그리고 치료 순응도를 저하시킬 수 있고, 따라서 궁극적으로는 생존율과도 밀접한 관계가 있는 나쁜 예우 인자이기 때문에 중요합니다. 그러나 우리 한국의 의료 현실을 생각했을 때는 이러한 종이 설문지, 이런 것들이 도입되기에는 여건이 전혀 되어 있지 않고 따라서 모바일 기반의 관리 방안을 만드는 것이 매우 중요하다고 말씀드릴 수 있겠습니다. 모바일 설문 순응도 연구에서 과연 소통이 얼마나 가능한가 말씀을 드렸는데요. 그래서 우리는 이 결과를 통해서 모바일 기반 환경에 친숙한 환자군과 친숙하지 않고 어색한 환자군에 대한 고려가 필요합니다. 그래서 저희 연구 결과에서는 아주 맞춤형의 push notification이 필요하다는 말씀을 드렸는데요. 이러한 사용 증진을 위해서는 우리가 환자의 특성을 잘 고려해서 거기에 맞는 독려 방안을 반드시 생각해야겠다는 말씀을 드리겠습니다. 세 번째 유닛에서 걸음 수를 가지고 Distress를 찾아낼 수 있을까 하는 문제, 이 문제는 아직 진행 중인 건데요. 저희가 앱 기반 patient reported outcome, 즉 PRO라고 하죠. 앱 기반 PRO로 Distress를 찾고자 하는 노력은 어느 정도 가능하다는 것을 확인했습니다. 하지만 말씀드린 것처럼 이러한 환자의 의지에서 이런 걸 한다는 건 현실적으로 지속 가능성이 없죠. 따라서 자동으로 생성되는 life log, 즉 걸음 수였는데요. 이것을 이용해서 똑같은 과정을 통해서 Distress를 찾아내고자 하는 노력이 현재 진행되고 있습니다. 마지막 유닛에서 말씀드린 것은 전반적인 lifestyle modification을 관리하는 많은 앱이 현재 그 유용성에 대한 근거가 부족한 상태에서도 사용되고 있습니다. 따라서 저희 연구진은 암 환자 관리 영역에서 사용 근거를 창출하기 위해서 전향적인 효용성 검증 플랫폼을 구축하고 있습니다. 저희가 이 플랫폼을 통해서 내년, 내후년에는 보다 더 흥미롭고 궁금한 여러 질문에 대한 답들을 만들어낼 수 있기를 기대합니다.

AI, 인공지능의 정의와 딥러닝

AI, 인공지능의 정의와 딥러닝
AI, 인공지능의 정의와 딥러닝

AI의 정의에 대해서 알아보도록 하겠습니다. 이 AI에 대한 정의를 알아보기 전에 우리나라의 정부에서 추진하고 있는 데이터 수집, 인공지능 사업에 대해서 살펴볼 필요가 있을 것 같은데요. 이미 수년 전부터 정부는 데이터를 모아야 되겠다는 생각은 가지고 있었습니다. 그래서 추진했던 것이 가상 분산형 빅데이터 구축이라고 하는 사업이었습니다. 그리고 또 하나 큰 사업이 있었는데 Doctor Answer, Doctor AI라는 별도의 프로젝트를 통해서 인공지능 사업을 추진하겠다고 밝힌 바 있습니다. 여기에는 당연히 많은 예산이 투자가 됐습니다. 보건의료 분야 인공지능 개발 상용화가 이루어지고 있는데요. 경쟁력 있는 다양한 바이오헬스 스타트업들이 그 대표적인 사례입니다. 루닛, 뷰노, 휴이노라는 대표적인 회사가 있는데요. 루닛이라고 하는 회사는 의료영상 AI 진단 치료 솔루션을 개발하는 회사입니다. 이미 200억 원의 벤처캐피탈의 자본을 확보했다고 뉴스에서 나오고 있습니다. 두 번째 회사는 뷰노라는 회사인데요. 딥러닝 기반으로 의료진단 보조 서비스를 개발한 회사입니다. 국내 첫 식약처 AI 기반 의료기기 허가를 받은 바가 있고요. 총 150억 원 이상의 투자를 유치했다고 합니다. 세 번째는 휴이노라는 회사인데, 아마 이 회사가 유명해진 거는 스마트워치 알고 계시죠? 스마트워치에서 심전도를 볼 수 있는데, 심전도를 볼 수 있는 장비는 이미 만들어놨는데 이게 우리나라 식품의약처에서 허가를 해주지 않아서 뒤늦게 규제 샌드박스라고 하는 그런 규제를 완화시켜주는 제도를 이용해서 신청했던 회사가 바로 휴이노입니다. 이 휴이노는 인공지능 기반의 웨어러블 심전도 장비를 개발했고, 최근에 83억 원 규모의 시리즈 A 투자를 유치했다고 합니다. 대규모 국책 과제도 현재 진행 중입니다. 2018년도, 조금 된 이야기이긴 하지만 그 당시에도 수십 억 원 규모의 국책 과제가 이미 만들어진 바가 있고요. 2019년도에는 규모가 더 커져서 거의 수백 억 단위의 연구과제가 나왔습니다. 하지만 그 사이에 뭐가 생겼습니까? 코로나가 생겼습니다. 코로나가 생긴 이후에 한국형 뉴딜이라고 얘기하면서 한국형 뉴딜 밑에 디지털 뉴딜이 있습니다. 디지털 뉴딜로 넘어오면서 거의 수백 억 이상의, 거의 천 억 가까운 규모의 국책 과제가 진행되고 있는 현실입니다. 거기에는 대부분 데이터를 모아서 램으로 만들겠다는 과제가 있습니다.

인공지능의 정의는 뭘까요?

사실 인공지능에 대한 정의는 학자들마다 해석하는 범위가 많이 다릅니다. 인간의 학습능력, 추론능력, 지각능력, 자연언어의 이해능력을 가지고 있는 컴퓨터 프로그램으로 실현한 기술이다. 굉장히 이상적인 얘기이긴 한데, '그래서 할 수 있는 것이 무엇이냐?'라고 얘기했을 때 지각 부분은 자연어 처리를 하고 영상을 인식하고 음성을 인식하는 부분이 지각 영역을 담당한다고 이야기합니다. 또 활용은 어떻게 하느냐? 에이전트 로봇처럼 실제로 대화를 하면서 상대방하고 인터랙션 할 수 있는 부분이 있고요. 또 다른 부분에는 추론 분류를 한다고 하는데 신경망이나 기계학습을 통해서 분류를 할 수 있는 그런 능력이 있다고 하는 부분이 있습니다. 하지만 이건 학자들마다 굉장히 정의가 다르기 때문에 또 다른 정의가 나올 수도 있다는 점을 알고 넘어가시도록 하겠습니다. 인공지능의 범주를 살펴볼까요? 인공지능의 범위는 모호하기는 합니다. 일반적인 알고리즘을 포함하는 건 당연하고요. If ~ then으로 구성되어 있는 Rule based의 알고리즘도 넓게 보면 인공지능에 포함시킬 수 있는 것 아니냐는 이야기도 나옵니다. 그런 인공지능 범주 안에 확실한 부분은 기계학습이라는 부분이 들어간다는 거죠. 기계학습이라는 건 제공된 데이터를 통해서 학습하는 거고, 많은 자료가 필요하다는 겁니다. 물론 기계학습에서도 Supervised Learning, 그러니까 누군가가 '이게 정답이야. '라고 알려주는 그런 기계학습도 있고, 알려주지 않는 Unsupervised Learning이라고 하는 그런 부분도 있습니다. 이건 너무 복잡하니까 넘어가시도록 하고요. 그 정답을 알려주지 않는 기계학습 중에 하나가 딥러닝이라고 할 수 있습니다.

딥러닝

딥러닝은 인공신경망 발전 형태로 우리가 흔히 얘기하는데, 사람이 사고하는 방식을 굉장히 따라했다고 해서 최근에 굉장히 핫하게 인기를 끌고 있는 연구 방법입니다. 인공지능 중에 하나인 거죠. 그 딥러닝 사례를 조금 더 설명 드리겠습니다. ImageNet Challenge라고 혹시 들어보셨습니까? 이게 기계학습을 하시는 분들한테는 굉장히 유명한 대회인데요. 이 ImageNet Challenge에는 수많은 사진들을 제공하고, 인공지능으로 분류를 누가 빠르고 정확하게 하는지 대회를 하는 겁니다. 1,000개의 클래스와 140만 장의 사진을 분류하는 작업이니까 사람이 한다고 해도 엄청난 시간이 걸리겠죠. 또 사람이기 때문에 실수가 있고 오류가 생길 수밖에 없습니다. 그게 인간이 했을 때 생기는 오류가 한 25%라고 나오고 있는데요. 이 그래프를 보면, 좌측 하단의 그래프를 보면 2012년 이전에는 오류가 25% 이상인 걸 볼 수 있습니다. 그런데 2012년도에 딥러닝을 가지고 분류하는 참가자가 있었습니다. 그때부터 오류율이 급속도로 줄어든 것을 볼 수 있습니다. 지금은 인간이 분류하는 것보다 더 정확하게 분류하고 있다는 것을 보실 수가 있습니다. 이런 인공지능이 상용화되면서 가장 먼저 우리가 접할 수 있는 장치는 아마 자율주행자동차일 겁니다. 많은 뉴스들이 있었습니다. 그 중에서 가장 먼저 상용화가 됐다고 할 수 있는 것은 미국의 사례일 겁니다. 테슬라가 먼저 생각나시는 분들도 있겠지만, 다른 한편으로는 구글이라는 회사가 택시 회사를 인수해서, 물론 엔지니어는 탑승을 하죠. 하지만 핸들은 잡지 않습니다. 자율주행을 해서 얼마나 잘 운전을 안전하게 하는지 테스트를 하고 있습니다. 그게 16,000,000km를 주행했다고 하고요. 일부 주(州)에서는 완전히 그게 상용화가 된 주도 있고, 일부 주에서는 부분적으로 허용된 주도 있습니다. 이게 점차적으로 더 기술이 발전되면 자율주행 트럭이 출시될 예정이라고 합니다. 미국 같은 경우에는 땅이 굉장히 넓기 때문에 트레일러를 가지고 운전해서 운송하는 그런 시스템이 굉장히 발달되어 있는데, 그것도 되게 좋은 직업으로 알려져 있었거든요. 그런데 많은 사람들이 일자리를 잃게 될 것이라고 걱정하는 목소리도 들을 수 있습니다. 이렇듯이 인공지능을 사용하는 사례들을 알아보았습니다.

AI에서 필요한 윤리

AI에서 필요한 윤리
AI에서 필요한 윤리

AI에서도 윤리가 필요한 것이 현실입니다. 문제가 되는 인공지능이 있기 때문인데요. 대표적인 사례를 한번 살펴보겠습니다. 아마 신문에서도 보신 기억이 있을 겁니다. '이력서를 AI가 살펴본다. '라는 기사 보신 적 있을 건데요. 해외 사례이긴 합니다만 아마존이라는 회사 알고 계시죠? 미국에 있는 유통회사인데 아마존에서 너무 이력서를 내는 사람이 많다 보니까 AI가 이력서를 검토해서 거기에서 나온 사람들을 최종 면접을 봤습니다. 그런데 그 결과를 보니까 놀랍게도 여성 참가자들이 현저히 적고, 특히 백인이 많았습니다. 그러니까 어떻게 보면 이런 인공지능을 만든 사람들의 편견이 들어가 있었던 거죠. 이게 문제가 돼서 사실 아마존은 더 이상 AI를 이용해서 면접을 보지 않습니다. 그럼에도 불구하고 많은 기업들이 AI가 이력서를 검토하면 더 정확할 것처럼 많이 호도하고 있습니다. 그 외의 사례를 한번 알아볼까요?

AI가 문제 되는 사례

영화 〈마이너리티 리포트〉의 현실화가 아닌가 하는 생각이 들 수 있는 사례가 있습니다. 피고인의 재범 가능성을 판단하는 인공지능 COMPASS라는 제품을 일부 주에서 활용을 해봤는데, 유사한 다른 범죄자들의 기록과 특정 범죄자의 정보의 빅데이터 분석을 통해서 범죄자의 재범 가능성을 계량화할 수 있다고 주장을 했습니다. 그런데 실제 사례를 보니까 사진에 보이는 것처럼 왼쪽 편에 백인이 보이죠? 이 백인의 재범률은 Low risk라고 나오고 3이라고 나옵니다. 그런데 오른쪽 편에 나오는 흑인의 risk는 High risk에 리스크 범죄 인덱스가 10이라고 나옵니다. 그런데 실제는 왼쪽 편의 사람은 범죄자였고, 오른쪽의 흑인은 그냥 선량한 시민이었습니다. 그러니까 얼굴, 인종, 다른 기록들이 우리 인간이 가지고 있는 편견이 녹아서 만들어진 것이 COMPASS라는 프로그램이었는데, 이런 것을 봤을 때 사실 인공지능이 정확하지만은 않다는 것을 알 수 있는 대표적인 사례라고 할 수 있습니다. 또 한 사례를 살펴볼까요? 2015년도에 있었던 일입니다. 구글 포토 좀 사용하시죠? 저도 구글 포토 잘 사용하고 있는데, 거기에 보면 자동으로 사진을 분류해주는 기능이 있습니다. 제가 비행기 안에서 사진을 찍으면 '비행기 안에서 찍은 사진이네? 여행 중 사진이네?'라고 자동으로 분류해주고, 자동으로 스토리를 만들어서 저한테 서비스를 해주는데요. 2015년도에 처음 이 서비스가 나왔을 때 굉장히 유명한 사건이 벌어졌습니다. 무엇이냐? 사람을 고릴라로 인식한 겁니다. 왜 그랬을까요? 추론컨대 많은 개발자들이 대부분 백인이었고, 흑인을 상정해서 '이 데이터가 흑인일 수도 있다. '라는 거를 인식하게 만들지 않았던 겁니다. 그래서 굉장히 항의를 했었고, 그다음에 프로그램을 대대적으로 수정을 하게 됩니다.

트위터 챗봇 Tay

오른쪽 사진을 보시면 이거는 마이크로소프트에서 만든 Tay라는 트위터 챗봇입니다. 자기가 스스로 생각해서 답변을 할 수 있는 그런 기능을 가지고 있는 트위터 챗봇이었는데요. 실제로 많은 악의적인 장난을 치려는 사람들이 몰려가서 나쁜 말을 가르치기 시작합니다. 나쁜 말을 가르치고, 인종 차별적인 말을 가르치고, 예를 들어서 '유대인들은 다 죽어야 돼. ' 이런 식의 폭력적인 말을 가르치다 보니까 이 Tay가 스스로 얘기하는 멘트, 말 자체가 굉장히 인종차별적이고 폭력적인 그런 성향을 보이게 됐습니다. 결국 서비스 오픈한 지 16시간 만에 중단하게 되었던 마이크로소프트의 흑역사라고 할 수 있죠. 그것뿐만이 아닙니다. 우리가 지금 자율주행 자동차를 이야기하고 있잖아요. 자율주행 자동차를 하려면 많은 표지판들을 보고 인식을 해야 됩니다. 그런데 이 표지판이 사소한 장난을 쳐 보면, 이 표지판을 완전히 엉뚱하게 인식하는 것을 볼 수 있습니다. 예를 들어 볼게요. 그림에서 보듯이 STOP 사인이 나오면 자동차가 서야 됩니다. 내가 손을 대지 않아도 기계가 스스로 판단해서 서야 되는 거죠. 그런데 저 STOP 사인에 스티커를 붙였습니다. 장난을 누가 친 거죠. 위에는 LOVE라는 스티커를 붙였고요. 밑에는 HATE라는 스티커를 붙였습니다. 그랬더니 기계가 인식을 '제한속도 50으로 달려라'라고 인식하고 서지 않고 그냥 지나가버리는 것을 알 수 있습니다. 또 하단에 보면 판다가 보이시죠? 이 판다도 노이즈를 가미했더니 판다와는 완전 다른 종인 원숭이로 인식하는 그런 것을 알 수 있습니다. 왜 이런 일이 벌어지느냐? 다 인공지능이라고 하는 것이 수학적인 확률로 가장 가까운 것을 선택하는 것이기 때문에 그렇습니다. 이것뿐만이 아닙니다. 하지도 않은 말이 화면에 나온다. 굉장히 황당하겠죠. 이게 실제로 있었습니다. 미국의 오바마 대통령이 본인의 정책 하고는 완전히 다른 말을 하는 거죠. 다른 말을 하는 영상을 만들어서 딥 페이크, 영상을 조작하는 인공지능을 만들어서 선보인 바가 있습니다. 물론 이런 것까지 가능하기 때문에 주의해야 된다는 정도로 홍보하는 그런 영상이었긴 했는데, 하지만 이게 실제 상용화되고 있습니다. 대표적인 게 요즘에 굉장히 유행하는 게 K-pop이잖아요. K-pop에 나오는 여 가수들이 딥 페이크로 해서 포르노에 등장하기도 했습니다. 그래서 최근에는 이게 딥 페이크로 만든 가짜 영상인지 아닌지 판단하는 인공지능이 나오기도 했죠. 이거는 만든 사람의 철학적, 윤리적 판단이 결여되어 있기 때문에 나오는 일이라고 할 수 있습니다. 현실 문제로 다가온 인공지능에 대해서 알아보도록 하겠습니다.

+ Recent posts