본문 바로가기

딥러닝

(13)
모두의 딥러닝 (4) - 참 거짓 판단 장치 : 로지스틱 회귀 간혹 건강검진을 받을 때 예(참), 아니오(거짓)로만 대답해야 할 때가 있다. 그때 확실하게 고를 수 있는 문항도 있지만 아닐 때는 정말 골치가 아프다. 이와 같은 과정이 전달받은 정보를 놓고 참과 거짓 중에 하나를 판단해 다음 단계로 넘기는 장치들이 딥러닝 내부에서 쉬지 않고 작동한다! 이렇게 참, 거짓 중에 하나를 내놓는 과정은 로지스틱 회귀의 원리를 거쳐 이루어진다. 참인지 거짓인지를 구분하는 로지스틱 회귀의 원리를 이용해 '참, 거짓 판단 장치'를 만들어 주어진 입력 값의 특징을 추출하고 이를 저장해 '모델'을 만든다. 그런 다음 누군가 비슷한 질문(문항)을 해도 만들어 놓은 이 모델을 꺼내 답을 하는 것이 바로 딥러닝의 동작 원리!! 로지스틱 회귀는 선형 회귀와 마찬가지로 적절한 선을 그려가는 ..
모두의 딥러닝 (3) - 오차 수정하기 : 경사 하강법 저번 장에서 오차를 확인하는 최소제곱법, 평균 제곱근 오차에 대해 공부했다면 이번 장에서는 그 오차를 계속 수정하면서 오차를 최소화 시키는 방법인 경사 하강법에 대해서 배우겠습니다! 위 그림을 보면 x가 p일 때 오차가 제일 작다. 즉, x가 p와 가까워질수록 오차가 점점 작아진다는 것!! 그러면 만약 x가 p와 멀리 떨어져 있을때 오차를 줄이면 되는데 그것을 하기 위해서는 현재 있는 지점이 다음에 진행될 지점와 비교해 p와 어느정도 떨어져 있는지 컴퓨터가 알아야 한다! 하지만 우리는 어느 지점이 우리가 원하는 p 값인지 모르게 때문에 '미분'을 사용! 현재 있는 지점에서 미분을 하면 그 기울기가 나오는데 x가 p에 가까울수록 미분된 기울기가 0에 가까워진다. 위 그림으로 좀 더 자세히 설명을 드리자면 ..
모두의 딥러닝 (2) - 가장 훌륭한 예측선 긋기: 선형 회귀 인간의 몸을 이해하려면 몸을 구성하는 기본 단위인 세포의 역할을 이해하듯이 딥러닝의 가장 말단에서 이루어지는 가장 기본적인 두 가지 계산 원리를 알아야 한다! 그것이 바로 선형 회귀와 로지스틱 회귀! 먼저 선형회귀란 가장 훌륭한 예측선 긋기라는 의미와 동일한데 예를 들어 사람은 ------를 해야 키가 크다. 라는 말이 있다. 여기서 ------는 독립변수(X), 큰 키는 종속변수(Y)이다. 우리가 알고 있는 키가 크기 위한 요인들은 유전, 식습관, 수면시간 등등이 있는데 여기서 말한 요인들이 독립변수이다. 만약 수집해온 데이터들을 가지고 실제 큰 키를 형성하는 요인들을 확실히 분석할 수 있다면 독립변수가 종속변수에 얼마나 영향을 주는 지의 정도를 알 수 있을 것이다. 이때 사용되는 대표적 방법이 바로 ..
모두의 딥러닝 (1) - 처음 해보는 딥러닝 이 책에서는 딥러닝을 처음에 간략하게 소개하기 위해 초장부터 직접 데이터셋을 가져와 딥러닝을 구현한다. 데이터셋은 2013년 외국 외과대학에서 공개한 폐암 수술 환자의 수술 전 진단 데이터와 수술 후 생존 결과를 기록한 실제 의료 기록 데이터다. 470개의 라인으로 이루어져 있고 17개의 속성 그리고 하나의 클래스로 구성되어 있다. 속성들은 예를 들어 종양의 유형, 흡연 등등의 환자 특성을 기록했고 클래스는 생존이면 1 사망이면 0을 기록해 폐암 환자의 수술 후 생존율을 예측하는 모델이다. 이제 시작해보자! 먼저 딥러닝을 구동하기 위해 필요한 케라스 함수들을 불러온다. 케라스는 딥러닝을 할 때 제일 많이 쓰이고 있는 라이브러리 "TensorFlow"를 쫓고 있는 유망한 딥러닝 라이브러리다. 텐서플로우로는..
모두의 딥러닝 데이터 입문을 시작할 때 사용한 첫 번째 책이다. 추천받은 책으로는 알고리즘, 수학, 밑바닥부터 시작하는 딥러닝 등등이 있었는데 그렇게 들어가면 초장부터 어려워질까봐 이 책으로 시작하였다. 책에는 그림도 많고 설명도 간략하게 잘 되어있다. 부족한 부분은 찾았어야 했지만 너무 간략하게 하지도 않고 너무 어렵게 설명하지도 않아 데이터쪽 특히 요즘 핫한 딥러닝은 무엇인가?(저처럼..)라는 생각에 한번 알아보고 싶으시면 이 책을 추천! 그래서 이 책을 공부할 때 Jupyter Notebook을 처음 사용했다. 시각화된 결과도 보면서 코멘트도 달고 싶어서 사용했는데 코멘트를 달면서 정리를 좀 해놨었다. 사실 그때 블로그에 올릴 생각이였다.. 어쨌든 그때 정리한 내용을 이번에 수정도 하면서 블로그에 차근차근 올릴 ..