[DL] Chapter 2: 퍼셉트론 (Perceptron)
카테고리: Deep Learning
태그: AI
밑바닥부터 시작하는 딥러닝1를 읽고 정리한 내용입니다✏️.
1. 퍼셉트론 (Perceptron)
퍼셉트론 : 다수의 신호를 입력으로 받아 하나의 신호를 출력
입력 신호가 뉴런에 보내질 때는 각각의 고유한 가중치가 곱해진다. (\(w_1x_1\), \(w_2x_2\))
뉴런에서 보내온 신호의 총합이 정해진 한계(임계값 \(\theta\))를 넘을 때 1을 출력한다. (뉴런이 활성화한다.)
퍼셉트론은 복수의 입력 신호 각각에 고유한 가중치를 부여한다.
가중치는 각 신호의 결과에 주는 영향력을 조절하는 요소로 작용한다.
⇒ 가중치가 클수록 해당 신호가 그만큼 더 중요하다는 뜻
퍼셉트론의 매개변수 값을 정하는 것은 컴퓨터가 아닌 인간이 한다.
기계학습 문제는 이 매개변수의 값을 정하는 작업을 컴퓨터가 자동으로 하도록 한다.
학습이란 적절한 매개변수 값을 정하는 작업이며, 사람은 퍼셉트론의 구조(모델)를 고민하고 컴퓨터에 학습할 데이터를 주는 일을 한다.
편향(bias)을 추가하면 다음과 같이 나타낼 수 있다.
가중치(Weight)는 각 입력 신호가 결과에 주는 영향력(중요도)을 조절하는 매개변수
편향(Bias)는 뉴런이 얼마나 쉽게 활성화(결과로 1을 출력)하는냐를 조절하는 매개변수
2. 다층 퍼셉트론(Multi-layer perceptron)
위 그림과 같이 단층 퍼셉트론으로는 XOR을 선형적으로 나타낼 수 없다.
즉 퍼셉트론은 직선 하나로 나눈 영역만 표현할 수 있다는 한계가 있다. (단층 퍼셉트론으로는 비선형 영역을 분리할 수 없다.)
이를 해결하기 위해 퍼셉트론을 층을 쌓아 다층 퍼셉트론을 만들 수 있다.
- 0층의 두 뉴런이 입력 신호를 받아 1층의 뉴런으로 신호를 보낸다.
- 1층의 뉴런이 2층의 뉴런으로 신호를 보내고, 2층의 뉴런은 y를 출력한다.
단층 퍼셉트론으로는 표현하지 못한 것을 층을 하나 늘려 구현할 수 있게 됐다.
댓글남기기