안녕하세요 에듀몬입니다. 지난 시간에는 인공지능을 통한 기계적 학습의 시작인 머신 러닝에 대해 알아보았습니다. 이번 시간에는 머신러닝의 한 종류이며, 인간의 뇌와 조금 더 닮아 있는 딥러닝에 대해 알아보도록 하겠습니다.
1. 딥러닝의 개념
딥러닝은 새로운 개념이 아닌 기존 인공신경망(Artificial Neural Network)의 한 종류이며, 인공신경망의 여러 한계점을 극복하여 문제를 해결한 알고리즘입니다. 인공신경망은 두뇌의 신경세포를 모방하여 수학적으로 모델링한 것이며, 데이터를 학습시켜 분류 및 예측의 최적화를 진행하는 머신러닝의 한 분야에 속합니다. 앞선 머신러닝은 기계에게 방대한 양의 데이터와 그것을 처리하기 위한 모델을 제시하고, 훈련시키는 형태라고 말씀을 드렸는데, 딥러닝은 인공신경망을 통해 인간이 하는 행위, 즉 모델을 제시하고 훈련시키는 과정을 기계가 '인공 신경망'을 통해 직접 한다고 볼 수 있습니다. 즉 기계가 직접 데이터로부터 결과 도출을 위한 의사결정을 하고, 이를 스스로 추출하는 과정을 이릅니다. 그리고 머신러닝에서 주로 정형 데이터를 다루는 반면, 딥러닝은 이미지나 음성, 영상 같은 비정형 데이터를 주로 다루고 있습니다. 이를 도식화하면 아래의 그림과 같습니다.
<딥러닝은 인공신경망을 통해 스스로 학습합니다>
딥러닝을 이용한 방법이 자연어 처리, 이미지 처리 등 다양한 분야에서 좋은 결과를 내는 이유는 딥러닝이 학습을 진행하면서 학습에 사용되는 데이터로부터 분석 목적에 적합한 데이터의 비선형적 특징을 추출하여 사용하기 때문이며 이를 표현학습이라고 합니다. 아래의 그림처럼 고양이 사진 수만 장을 본 딥러닝은 스스로 인공신경망을 통해 학습하여 고양이의 특징을 알아내고, 이와 관련한 정보도 연결시킬 수 있습니다.
기존 기계학습은 분석자가 분야에 대한 경험을 기반으로 데이터의 특징을 추출하여 분석을 수행합니다. 반면 딥러닝은 구조의 하위층에서 데이터로부터 단순한 특징을 추출하고 상위층으로 갈수록 하위층에서 추출된 특징들을 조합하여 보다 복잡하고 추상적인 특징들을 추출하게 됩니다. 추상적 특징을 자동 추출하는 과정을 통해 표현학습이 가능해지게 됨에 따라 다양한 분야에서 데이터에 적합한 전 처리과정 없이 좋은 성능을 낼 수 있게 됩니다.
2. 인공신경망
인공신경망은 인간의 두뇌를 구성하는 신경세포 즉, 뉴런(Neuron)의 형태 및 동작원리를 모방하여 만든 모델이며, 인공신경망을 이해하기 이전에 생물학적 뉴런의 원리를 먼저 파악하는 것이 좋습니다. 인간의 두뇌는 1,000억 개가 넘는 뉴런이 100조 개 이상의 시냅스를 통해 병렬적으로 연결되어 있습니다. 각각의 뉴런은 수상돌기(Dendrite)를 통하여 다른 뉴런으로부터 신호를 입력받아 축색돌기 (Axon)를 통해 다른 뉴런으로 신호를 내보내며, 출력 신호는 입력된 신호가 모여 서 일정한 용량을 넘어설 때 일어나게 됩니다. 아래의 그림은 생물학적 신경세포의 구성과 이를 모방한 인공신경망의 원리를 나타내고 있습니다.
<생물학적 신경세포 구성과 이를 모방한 인공신경망의 원리>
인공신경망의 학습원리는 그림의 오른쪽과 같이 변수를 입력하면 입력 층에서 각각의 입력변수 x의 값을 가진 노드들이 임의의 값을 갖는 가중치 w와 결합하여 새로운 노드를 생성하게 되는 원리로 학습이 진행됩니다. 이때 입력 변수 x와 가중치 w이 결합한 값에 편향 값을 뜻하는 bias가 더해져 활성화 함수와 결합하게 되며, 이러한 과정을 모두 거친 최종 값이 다음 노드로 출력됩니다.
인공신경망의 장점은 기존의 데이터를 기반으로 학습하기 때문에 과거의 통계 학적인 분석방법에 비해 수학적으로 해결이 어려운 복잡한 문제에 대하여 분석이 용이하고 분석시간이 비교적 짧습니다. 또한 패턴 인식, 예측, 분류 등의 문제에 특화되어 있으며, 이를 적용하여 해결할 수 있는 문제의 분야 및 범위에 대한 제약이 적습니다.
그러나 입력변수로 들어가는 데이터의 품질에 따라 결과가 달라질 수 있으며, 모델을 구성하는 다양한 하이퍼 파라미터의 선택에 따라 학습 성능에 큰 영향을 미칩니다. 또한 도출된 결괏값에 대한 이론적인 설명이 어려우며, 제한된 은닉층과 학습의 복잡도로 인하여 과대 적합(Overfitting), 과소 적합(Underfitting) 등의 학습성능 문제와 학습과정 중 기울기가 소실되는 문제(Vanishing gradient) 등의 단점을 가집니다.
※ 참고문헌
딥러닝을 이용한 해석 가능한 함수 추정에 관한 연구(송낙윤, 2018)
딥러닝 알고리즘을 이용한 건설공사 공기예측의 적정성 분석(안현주, 2020)
'교육이슈' 카테고리의 다른 글
학교생활적응의 개념과 구성요인(초등학교) (0) | 2020.11.19 |
---|---|
머신러닝과 딥러닝 차이점 알아보기 (0) | 2020.09.23 |
머신러닝이란?(개념 및 유형) (0) | 2020.09.21 |
페스탈로치의 교육사상(전인교육 원리, 방법) (0) | 2020.09.09 |
스팀(STEAM)교육이란?(개념, 기능) (1) | 2020.09.02 |