• 화. 10월 20th, 2020

인공신경망은 사람의 뇌 신경

Avatar

Byadmin

8월 25, 2020

인공신경망은 사람의 뇌 신경 회로를 묘사하여 만든 데이터 마이닝 기법이다. 데이터를 입력 받는 입력층, 클래스 분류 결과를 출력하는 출력층, 그리고 입력층과 출력층 사이의 은닉층, 3 종류의 층들로 구성되어 있다. 학습과정에서 각 층들간의 Weight 및 Bias가 학습데이 터의 클래스를 예측할 수 있도록 조정되고, 분류 과정에 서는 분류하고자 하는 데이터가 학습된 인공신경망의 입력층과 은닉층들을 통과하면서 출력층에서 클래스가 분류된다.

Patidar et al.은 신용카드 이상 거래 탐지에 서 인공신경망이 높은 정확도를 가짐을 보였다 데이터 마이닝에서 기법의 정확도 향상, 연산 속도 향 상 및 시각화 등을 위한 적절한 차원축소는 필수적이다. 도메인 지식을 미리 가지고 있는 분야라면, 분석가가 직 접 비교적 중요성이 떨어지는 변수를 배제할 수 있다. 그 렇지만 도메인 지식에 기반한 방식은 변수의 내재된 중 요성을 판단하지 못할 수 있으며, 변수 간의 결합이 유의 미한 의미를 지닐 경우, 이를 쉽게 포착하지 못한다. 관련 도메인 지식에 의존하지 않고, 가장 많이 사용되 는 고차원의 데이터를 저차원으로 축소시키는 방법으로 는 주성분 분석이 있다.

주성분 분석은 데이터 변수 축 들의 선형 결합으로 이루어진 새로운 축들 중 데이터를 사상시켰을 때 분산이 가장 커지는 축, 즉 데이터의 주 성분을 찾아내는 방식이다. 주성분 분석을 사용함으로써 데이터를 가장 잘 설명할 수 있는 새로운 변수 혹은 특 성을 추출할 수 있다[8]. 그러나 주성분 분석은 기존 변 수들간의 선형 결합만을 추출할 수 있다는 단점이 있다. 만약 변수들 간의 관계가 지수, 혹은 Sigmoid 형식이라면 주성분 분석은 이러한 특징을 정확히 잡아낼 수 없다. 오토인코더는 출력층의 결과물이 입력층에 입력되는 데이터를 완벽하게 복구하는 것이 목적인 인공신경망이 다.

그림 1은 오토인코더의 형태를 보여준다. 5개의 입 력 노드들은 입력 데이터가 총 5개의 변수를 가지고 있 음을 의미하는데, 이는 5차원의 데이터로 볼 수 있다. 5 차원의 데이터들은 그림 1의 A부분을 통과하면서 3개의 은닉 노드들을 가진 은닉층에서 3차원으로 압축된다. 고차원의 입력 데이터가 저차원의 은닉층에서 압축되는 이러한 부분을 ‘인코더’라고 한다. 그림 1의 B부분에서 는 3차원으로 압축된 데이터가 5차원으로 차원이 다시 확장된다. 은닉층에서 저차원으로 압축된 데이터를 원래 차원의 데이터로 복구시키는 이러한 작업을 ‘디코더’라 고 한다. 이렇게 차원이 압축되었다가 다시 확장된 데이 터가 원본 데이터와 동일하도록 만드는 것이 오토인코 더의 목적이다. 인공신경망의 Activation Function으로 Sigmoid, Tanh, Rectified Linear Unit(ReLU) 등을 사 용함으로써, 변수들 간의 조합을 선형조합 이상의 복잡 한 조합을 만들 수 있다. Hinton et al.은 가로 및 세로가 각각 28 pixel인 784 차원의 숫자 및 사람 얼굴 사진 표본들을 PCA를 사용 하여 차원을 압축하였다가 복구시킨 사진들과 오토인코 더를 사용하여 차원을 압축하였다가 복구시킨 사진들을 비교하였는데, PCA방식에 비해 오토인코더 방식이 더 원본 이미지에 가깝게 복구됨을 보여 주었다[9]

출처 : 파워볼사이트 ( https://locki.io/ )

댓글 남기기