KIST 기술정책연구소

KIST 본원

THEME series

 1. 배


2016년 1월에 열린 제46회 다보스포럼에서는 “Industry 4.0의 이해”라는 주제로 급속도로 발전하는 정보기술이 인류에 가져올 변화에 대해 논의했다. 전문가들은 사물인터넷, 빅데이터, 인공지능, 블록체인 등에 관한 기술이 “4차 산업혁명”을 이뤄낼 것으로, 또 이들 기술을 중심으로 산업․경제․사회 패러다임이 변할 것으로 전망하고 있다. 이 기술들은 “사물인터넷과 블록체인의 융합”처럼 서로 융합되어 활용되는 경우가 많다. 따라서 이런 기술들로 실제 가치를 창출하고 국가 경쟁력을 강화하려면 4차 산업혁명 관련 융합 이슈를 상세하게 이해하는 것이 필수적이다.

하지만 4차 산업혁명이라는 개념의 포괄성과 모호성 때문에, “4차 산업혁명의 범위가 어디까지인지”, “4차 산업혁명에서 어떠한 기술들이 중요한지”, “관련 응용산업의 구체적 특성은 어떠한지”, 무엇보다 “이들 기술이 산업에 응용되기 위한 융합 이슈들이 무엇인지” 또렷하게 파악하기 어려웠다. 몇 사람의 전문가가 4차 산업혁명 관련 모든 정보를 수집하고 소화하기도 현실적으로 매우 어려운 일이다. 이에 본 연구는 텍스트 마이닝2)과 非지도 학습3) 알고리즘에 기반해 4차 산업혁명에 대한 개념과 범위 등을 분석하였다.


 2. 연구 내용


데이터 분석은 “4차 산업혁명”을 언급한 국제 저널 논문 660편과 영문 뉴스 기사 3,907건을 대상으로 했다. 논문은 주로 4차 산업혁명 관련 기술적 문제를, 기사는 주로 4차 산업혁명 관련 기술 응용과 사업, 산업, 사회적 이슈들을 다루고 있다. 논문 660편은 2018년 9월 8일까지 학술정보 데이터베이스인 웹 오브 사이언스 (Web of Science Core Collection)에 등록된 것으로, 이는 데이터 수집 시점까지 “4차 산업혁명”을 언급하고 있는 전체에 해당한다. 이들 논문이 게재된 저널은 SCIE (Science Citation Index Expanded), SSCI (Social Science Citation Index), A&HCI (Arts&Humanities Citation Index), ECI (Emerging Sources Citation Index)로 분류된다. 언론기사 3,907개는 2018년 9월 17일까지 렉시스 넥시스 비즈니스 및 산업 뉴스(LexisNexis Business & Industry News)의 데이터베이스에 등록된 것으로, 이는 데이터
수집 시점까지 “4차 산업혁명”을 언급하고 있는 전체에 해당한다. 연구는 이러한 데이터를 몇가지 비지도 학습 알고리즘에 기반해 분석한 결과로 4차 산업혁명의 주요 연구 분야와 기술 응용 이슈들을 파악했다 (그림1 참조). 나아가 주요 연구 분야 간 네트워크 분석, 논문과 기사에 대한 상세 리뷰를 통해 4차 산업혁명의 주요 융합 R&D 이슈를 파악했다. 예를 들어 연구 분야별로 SCIE, SSCI, A&HCI 논문 분포 분석과 내용에 대한 정성적 리뷰에 기반해 “공학•과학”과 “인문학•사회학” 간 융합 R&D 이슈를 파악했다.


 3. 문헌 데이터로부터의 시사점: 4차 산업혁명의 5개 레벨 및 19개 주요 연구분야


인공지능의 해석을 정리한 결과, 4차 산업혁명은 ‘연결 인프라 구축 (1단계), 데이터 활용 인공지능 개발 (2단계), 시스템 및 프로세스 최적화 (3단계)를 통한 산업 혁신 (4단계)과 사회 발전 (5단계)을 이루는 사례들을 집약한 총체’라고 정의된다. 또 4차 산업혁명 실현을 위한 다섯 단계별 19개의 주요 연구 분야도 분류할 수 있었다(그림2 참조).



그림 2에 이들 19개 주요 연구분야간 관계를 5개 레벨에 대한 color coding 하여 나타내었다. 한 node는 그 node와 가장 관련이 깊은 세 개 nodes와 연결되었으며(cosine similarity), node의 크기는 여러 nodes와 관계가 깊을수록 크게 시각화하였다. 네트워크에 나타난 관계를 보면 맨 아래 3개의 lightgray nodes가 1단계 “인프라 기술”로서 4차 산업혁명의 기반을 제공하고, 좌상단 lightblue nodes가 2단계 “인공지능 기술”로서 4차 산업혁명을 위한 도구를 제공하며, 가운데 및 상단의 lightyellow nodes가 1, 2단계 기술에 기반해 만들어지는 3단계 “시스템 및 프로세스 최적화” 사례들을 나타내며, 우상단 및 좌측의 lightskyblue nodes가 이러한 사례들을 아우르는 4단계 “산업 혁신”을, 마지막으로 우측의 lightgreen nodes가 이 모두를 아우르는 5단계 “사회 발전”을 나타낸다. 그림에 나타났듯이, 3단계 nodes가 네트워크 중심에 있으며 4, 5단계 nodes는 3단계 nodes를 통해 1, 2 단계 nodes와 연결된다. 이는 4차 산업혁명을 위한 사례 개발의 핵심이 시스템과 프로세스 최적화임을 나타내며, 연결 인프라 기술, 인공지능 기술을 통해 이루고, 이에 기반해 산업 혁신과 사회 발전이 이루어짐을 나타낸다.

보다 구체적으로 서술하자면, 4차 산업혁명의 첫 번째 레벨은 “연결 인프라 구축”으로, (1) 센싱 및 무선 통신 기술개발, (2) 보안 기술 개발, (3) 가상현실 기술 개발 등을 망라한다. 두 번째 레벨은 “데이터 활용 인공지능 개발”로, (4) 빅데이터 수집 및 관리, (5) 예측 모델 개발, (6) 최적화 모델 및 알고리즘 개발 등을 포함한다. 여기서 인공지능이란 최근 등장한 머신러닝, 딥러닝 알고리즘 류에 국한되지 않으며, 인간이 데이터를 활용해 최적의 의사결정을 내리는 데에 도움을 주는 알고리즘 모두를 포괄한다. 스스로 의사결정을 내리고 행동하는 범위의 제어 시스템은 아래 세 번째 레벨에 해당한다.

세 번째 레벨은 “시스템 및 프로세스 최적화”로, (7) 인간과 협동하는 로봇 개발 (여기서 로봇이란 하드웨어, 소프트웨어 모두 포괄), (8) 특정 프로세스 모니터링 및 제어 (예: 품질 제고를 위한 공정 프로세스 제어), (9) 특정 시스템 제어 및 자동화 (예: 온도 제어가 자동화된 스마트 빌딩), (10) 시스템 설계 (예: 새로운 스마트홈 시스템 아키텍쳐설계), (11) 가상물리시스템 개발 (예: 디지털화된 공정 시스템에 대한 모니터링), (12) 스마트 시스템 개발 (예: 스마트 공장 및 에너지 시스템 개발), (13) 스마트 서비스 모델 설계 (예: 의류산업을 위한 사물인터넷 기반의 새로운 서비스 비즈니스 모델 설계) 등을 포괄한다.

네 번째 레벨은 “산업 혁신”으로, (14) 제조 산업 혁신 (예: 최적화되고 자동화된 제조), (15) 발전된 공급사슬망관리 방식 (예: 사물인터넷 기반의 물류 흐름 분석), (16) 에너지 산업 발전 (스마트 그리드 개발), (17) 산업 혁신 과정 분석(예: 4차 산업혁명 시대 중소기업들의 중요성 및 현황에 대한 분석) 등을 포괄한다. 다섯 번째 레벨은 “사회 발전”으로, 관련 논문들은 (18) 4차 산업혁명 현상에 대한 사회학적 연구, (19) 스마트시티 등 사회 전체의 디지털 트랜스포메이션 등을 다루는 것을 확인할 수 있었다.


요약하면, “산업 혁신”과 “사회 발전” 이슈는 4차 산업혁명의 목표를 (상위 계층), “시스템 및 프로세스 최적화” 이슈는 목표 달성을 위한 방식을 (중위 계층), “연결 인프라 구축”과 “데이터 활용 인공지능 개발”은 방식 이행을 위해 필요한 기반•수단 (하위 계층)을 나타낸다.


 4. 뉴스 데이터로부터의 시사점: 4차 산업혁명 관련 기술, 응용산업, 기업, 국가, 사회적 이슈


3,907개 뉴스가 포괄하는 토픽들은 크게 4차산업혁명 관련 (1) 최신기술, (2) 응용산업, (3) 기업, (4) 국가 현황, (5) 사회적 이슈로 분류된다. 첫째, 최신기술 토픽으로는 센싱, 사물인터넷, 빅데이터, 인공지능, 사이버안보, 로봇, 클라우드, 블록체인 등이 있었으며, 이는 문헌 데이터 분석 결과와 상당히 일치함을 볼 수 있다. 한가지 주목할 점은 아직까지 블록체인 관련 연구논문들은 많지 않아 문헌 데이터 분석으로부터는 그 중요성을 뚜렷이 확인할 수 없었다. 그러나 최근 부상한 기술이니만큼 뉴스 데이터 분석으로부터는 그를 확인할 수 있었다.

둘째, 응용산업 토픽으로는 암호화폐(Cryptocurrency), 핀테크(Fintech), 최신제조(Advanced Manufacturing), Fashion Supply Chain Management, Energy, Transportation 등을 찾을 수 있었으며, 이로부터 4차 산업혁명 기술들이 금융, 제조, 패션, 에너지, 교통 산업에 응용됨을 확인할 수 있었다. 이러한 발견 역시 문헌 데이터 분석 결과와 일관적이며, 다만 그 차이는 뉴스 데이터는 보다 여러 개의, 세분화된 응용분야를 보여줬다는 점이다.


셋째, 기업 토픽으로는 IBM, Huawei, Bosch, SAP, Ericsson, Nokia, Siemens, Startups등을 찾을 수 있었으며, 예를 들어 IBM의 경우 클라우드 솔루션 기술 개발에서, Huawei의 경우 5G 기술 개발에서, SAP의 경우 데이터 관리 및 분석 기술 개발에서, Siemens의 경우 Advanced Manufacturing 분야에서 앞장서고 있음을 확인하였다. 특히, 4차 산업혁명 맥락에서 여러 스타트업 기업들이 금융, 패션, 에너지 분야 등에서 등장하고 있는 것을 확인할 수 있었다. 이러한 세부적 기업 활동에 관한 정보는 문헌 데이터는 가지지 못한 것으로, 뉴스 데이터로부터만 확인될 수 있었다.

넷째, 국가 현황 토픽으로는 China, Singapore, UK, Australia, Korea 등의 국가에서 일어나는 4차 산업혁명 관련 동향이 있었다. 이처럼 4차 산업혁명 언급 뉴스기사가 여러 국가 현황을 다루고 있는 것은 4차 산업혁명의 사회적 중요성, 이에 대한 많은 국가의 관심을 말해준다. 또한, 4차 산업혁명은 급격히 발전하는 기술을 다루니만큼 정책적 지원 및 제한이 중요함을, 이것은 국가마다의 환경, 맥락에 따라 다름을 확인할 수 있었다. 이러한 정보 역시 문헌 데이터는 가지지 못한 것으로, 뉴스 데이터로부터만 확인될 수 있었다.

다섯째, 사회적 이슈 토픽으로는 4th Industrial Revolution, Digital Transformation, Smart City, Education 등을 확인할 수 있었으며, 이 중 첫 번째, 두 번째 토픽의 발견은 문헌 데이터 분석 결과와 일치한다. 세 번째, 네 번째 토픽은 뉴스 데이터로부터만 확인될 수 있었으며, 4차 산업혁명이 궁극적으로 사람들의 삶의 질 향상에 기여해야 함을, 4차 산업혁명 시대 적합한 교육방법 개발이 필요함을 나타낸다.


 5. 문헌, 뉴스 데이터로부터의 시사점: 4차 산업혁명을 위한 융합의 6Cs 차원


4차 산업혁명의 주요 융합 R&D 이슈를 도출하기에 앞서, “4차 산업혁명을 위한 융합”을 앞서 기술한 문헌, 뉴스 데이터로부터의 시사점을 종합해 정의하였다. 문헌, 뉴스 데이터 분석 과정, 분석 결과 해석 과정, 관련 문헌 분석을 종합해 그림 3과 같은 프레임워크를 개발할 수 있었다. 앞서 밝힌 연결 인프라 기술, 인공지능 기술은 특정 시스템 혹은 프로세스 최적화를 통해 문제를 해결하고 관련 이해관계자에게 가치를 창출하며, 이는 산업 혁신, 사회 발전에 기여한다. 이에 4차 산업혁명은 “사람, 사물, 조직을 연결해 (Connection), 관심 시스템 및 프로세스로부터 데이터를 수집하고 (Collection), 통신하며 (Communications), 그것이 함의한 정보를 인공지능으로 계산 (Computation)해내, 관심 시스템 및 프로세스의 최적 제어 (Control)에 활용하여 가치를 창출하는 (Creation) 사례들을 집약”한다는 특징을 갖는다. 이들 6Cs 차원은 앞서 기술된 시사점과 관련이 깊다. Connection은 사물인터넷 기술, Collection은 센서 기술, Communications는 5G 기술, Computation은 인공지능 기술, Control은 제어 기술 등과, 즉 이들 차원은 공학•과학과 관련이 깊다. Creation의 경우 산업 혁신과 사회 발전의 핵심 목적인 만큼 인문학•사회학과 밀접한 관련이 있다. 본 보고서에서 말하는 “융합”이란 이들 6Cs 중 2개 이상의 결합을 말하며, 앞으로 서술할 4차 산업혁명의 융합 R&D 이슈는 이러한 관점에서 도출, 서술되었다.

 6. 4차 산업혁명의 주요 융합 R&D 이슈


앞서 설명한 설명한 시사점들은 정량적 텍스트마이닝 결과 및 정성적 논문, 뉴스 리뷰에 기반한다. 여기서 한걸음 더 나아가, 4차 산업혁명의 주요 융합 R&D 이슈 파악을 위해 연구분야 별 논문의 출처 정보 분석, 뉴스가 함의하는 실용적 연구 이슈 파악을 시도하였다. 연구분야 별 논문의 출처 정보 분석은 같은 연구분야 내 논문들이 어떠한 SCIE 혹은 SCI 저널에서 나왔는지에 대한 분석, 출처 및 연구주제가 다양할 경우 이들을 꿰는 융합 R&D 이슈가 무엇인지에 대한 고민을 수반하였다. 뉴스가 함의하는 실용적 연구 이슈 파악은 뉴스에서 소개된 사례, 현황 정보가 다른 맥락에서 응용될 수 있을지 (예: 패션 분야 블록체인 활용 사례가 다른 산업에서 응용될 수 있을지), 여러 뉴스를 포괄하는 융합 R&D 이슈가 무엇인지에 대한 고민을 수반하였다. 결과적으로 표 1과 같은 융합 R&D 이슈들을 도출할 수 있었다. 각 이슈에 대한 추가 정보는 ‘융합연구리뷰 (ISSN: 2465-8456) 2018년도 11월호’에서 확인할 수 있다.


다섯 개 레벨 전체를 아우르는 시사점은 다음과 같다. 레벨 1의 이슈들은 주로 Connection, Collection, Communications 기술과 관련이 깊다. 이에 따라 관련 논문들은 공학•과학 분야 SCIE, ECI 저널들로부터 나왔다. 즉, 이들 이슈는 공학•과학 중심의 융합과 관련이 깊다. 레벨 2의 이슈들 역시 Collection, Communications,
Computation 기술과 관련이 깊은 만큼 공학•과학 중심의 융합과 관련이 깊지만, 경영 문제 해결을 위한 데이터 활용 등 공학•과학•인문학•사회학 전체의 융합에도 기여한다. 한편 레벨 3의 이슈들은 수집된 데이터 분석으로부터 얻어진 정보를 활용한, 인공지능 기반 제어 (Computation, Control)를 통한 가치 창출 (Creation) 사례 개발을
다룬다. 즉 이들 이슈는 공학•과학•인문학•사회학 전체의 융합과 관련이 깊다. 레벨 4의 이슈들 역시, 이때부터 연구 대상의 범위가 광범위해짐에 따라 공학•과학•인문학•사회학 전체의 융합과 관련이 깊다. 특히 산업과 경영의 실제 문제 해결을 위한 융합과 관련이 깊다. 레벨 5 이슈들의 경우 관련 논문들은 대부분 인문학•사회학
분야 SSCI, SCI 저널들로부터 나왔다. 즉, 이들 이슈는 인문학•사회학 중심의 융합 연구를 다룬다. 종합하면, 레벨 1부터 레벨 5까지의 이슈들은 공학•과학부터 인문학•사회학까지의 융합 스펙트럼을 형성한다. 이 스펙트럼에 따라, 그림 4에 4차 산업혁명을 위한 융합 관련 특징 및 융합 촉진 방안에 대한 아이디어를 서술하였다.


 7. 결 론


본 연구는 4차 산업혁명의 개념 및 범위에 대한 명확화에 기여하며, 관련 융합 R&D를 촉진할 것이다. 구체적으로 본 연구의 의의는 다음과 같다: 본 연구는 4차 산업혁명을 직접적으로 언급하는 문헌 및 뉴스 데이터 대부분을 분석했다는 점에서 포괄성을 가지며, 그 분석 방법이 정량적 방법론에 기반한다는 점에서 객관성을 가진다. 정량적 분석의 한계를 극복하기 위해 연구진은 데이터를 직접 정성적으로 리뷰하고 관련 문헌을 참조하고자 노력하였다. 최종적으로 도출된 융합 R&D 이슈는 이러한 통합적 접근에 기반해 도출되었다는 데에, 4차 산업혁명의 5개 레벨에 따라 체계적으로 구조화되고 서술되었다는 데에 의의를 가진다. 물론 본 기사에 기술된 연구 결과 및 토의는 연구진 내에서 정리되었다는 점에서 한계를 가진다. 하지만 연구진은 도출된 28개 융합 R&D 이슈가 완전한 (exhaustive) 리스트라고 생각하지 않으며, 이는 미래 연구들을 통해 지속적으로 정제, 확장되어야 한다. 예를 들어 보다 많은 키워드들을 활용해 수집한 데이터를 분석할 수 있을 것이며, 특정 연구분야의 텍스트데이터에 집중해 연구분야 별 융합 R&D이슈를 세분화할 수 있을 것이며, 시간에 따른 4차 산업혁명 관련 문헌 및 뉴스의 발전•확장을 관찰할 수 있을 것이다. 데이터 분석 방법론 역시 개선될 수 있다. 예를 들어 본 연구는 문헌 및 뉴스 데이터로부터 추출된 토픽들을 연구진이 정성적으로 종합하였으나, 이 작업은 데이터와 뉴스 데이터가 개별적으로 구성하는 토픽 공간의 관계 분석에 기반해 정량적으로 시도될 수 있다. 끝으로, 도출된 이슈들에 대한 각계 전문가들의 의견을 설문•인터뷰해 이슈들을 평가, 보완, 확장할 수 있을 것이다.

많은 사람들이 4차 산업혁명을 말하지만, 이것이 무엇인지 또 앞으로 4차 산업혁명에 대응하려면 어떻게 해야 하는지 명확하지 않은 상황이다. 본 연구는 이런 사회적 갈증을 해소하고자 시도되었다. 본 연구의 결과는 국내외 4차 산업혁명 관련 논의와 일관적•상호보완적으로 나타났으며 (예: 대통령 직속 4차 산업혁명 위원회, World Manufacturing Forum에서의 논의), 이는 본 연구가 취하는 “문서 빅데이터 분석 기반의 접근”이 다양한 분야 다수 전문가들의 의견종합 결과를 근거하고 보완할 수 있음을, 매우 효율적인 접근임을 나타낸다. 또한 본 연구는 지식 발전을 위한 인간과 인공지능의 협력 가능성을 보여준 사례라는 의의를 가진다. 연구진은 본 연구의 결과가 4차 산업혁명 이해 및 촉진을 위한 주요 레퍼런스로 활용될 수 있으리라 생각하며, 이것이 융합을 통한 국내 기업•산업 경쟁력 강화에, 사회 발전에, 정부 및 국내 학계가 4차 산업혁명 관련 분야의 국제적 우위를 선점하는 데에 기여하길 희망한다.