전체 글 (20) 썸네일형 리스트형 모두의 딥러닝 (7) - 데이터 다루기 빅데이터는 머신러닝과 딥러닝을 통해 사람에 버금가는 판단과 지능을 가지게 했지만 빅데이터의 의미 자체로 데이터 양이 많다고 좋은 결과를 얻을 수 있는 건 아니다. 제일 중요한 건 그 데이터들이 필요한지에 중점을 둬야 한다. 즉 자기가 원하는 목적에 맞춰 데이터를 모았다면 이를 머신러닝, 딥러닝에서 사용할 수 있게 잘 정제된 데이터 형식으로 바꿔야 한다. => 머신러닝 프로젝트의 첫 단추 ! 지금부터 딥러닝 실습 시작을 할텐데 모든 실습은 데이터를 분석, 조사하는 것부터 시작하므로 데이터 분석에 가장 많이 사용되는 파이썬 라이브러리인 panda, matplotlib 등을 사용해 데이터가 어떤 내용을 담고 있는지 확인하며 딥러닝의 핵심 기술을 구현해보자! 활용할 데이터 -> 피마 인디언 - 피마 인디언은 1.. 모두의 딥러닝 (6) - 오차 역전파 지금까지 우리는 입력 값, 출력 값을 알고 있는 상태에서 정답에 해당하는 가중치와 편향을 직접 집어넣었는데 실제 프로젝트에서는 이미 배웠던 '경사 하강법'을 통해 임의의 가중치를 선언하고 결괏값을 이용해 오차를 구한 뒤 오차가 최소인 지점으로 계속 이동! 하지만 저번에 배운 경사 하강법은 입력과 출력이 하나일 때, 즉 '단일 퍼셉트론'일 경우였고 이번에는 숨어 있는 층이 하나 생겼으므로 계산이 복잡해졌지만 원리는 똑같다! 단일 퍼셉트론에서 결괏값을 얻으면 오차를 통해 앞에서 정한 가중치를 조정하는 것처럼 다중 퍼셉트론 역시 결괏값의 오차를 구해 하나 앞선 가중치를 차례로 거슬러 올라가며 조정하는 데 그러다 보니 최적화의 계산 방향이 출력층에서 시작해 앞으로 진행된다. 그래서 다층 퍼셉트론에서의 최적화 과.. 모두의 딥러닝 (5) - 퍼셉트론 인간의 뇌는 치밀하게 연결된 약 천억개의 뉴런으로 이루어져 있다. 뉴런과 뉴런 사이에는 시냅스라는 연결 부위가 있는데, 신경 말단에서 자극을 받으면 시냅스에서 화학 물질이 나와 전위 변화를 일으킨다. 전위가 임계 값을 넘으면 다음 뉴런을 신호를 전달하고 그렇지 않으면 아무것도 하지 않는다. 지금까지 배운 과정과 비슷하다고 생각하다면 GOOD JOB!! 즉 인간의 뇌의 메커니즘을 바탕으로 딥러닝이 만들어 졌따. 즉 뉴런과 비슷한 메커니즘을 사용하면 인공적으로 '생각'하는 무언가를 만들지 않겠냐는 생각으로 딥러닝이 만들어 졌다. 그 첫 연구가 바로 인공 신경망(Artificial Neural Network) 연구다. 이 사진은 뉴런과 퍼셉트론을 비교한 사진인데 뉴런이 자극을 받아 시냅스라는 연결 부위를 통해.. 모두의 딥러닝 (4) - 참 거짓 판단 장치 : 로지스틱 회귀 간혹 건강검진을 받을 때 예(참), 아니오(거짓)로만 대답해야 할 때가 있다. 그때 확실하게 고를 수 있는 문항도 있지만 아닐 때는 정말 골치가 아프다. 이와 같은 과정이 전달받은 정보를 놓고 참과 거짓 중에 하나를 판단해 다음 단계로 넘기는 장치들이 딥러닝 내부에서 쉬지 않고 작동한다! 이렇게 참, 거짓 중에 하나를 내놓는 과정은 로지스틱 회귀의 원리를 거쳐 이루어진다. 참인지 거짓인지를 구분하는 로지스틱 회귀의 원리를 이용해 '참, 거짓 판단 장치'를 만들어 주어진 입력 값의 특징을 추출하고 이를 저장해 '모델'을 만든다. 그런 다음 누군가 비슷한 질문(문항)을 해도 만들어 놓은 이 모델을 꺼내 답을 하는 것이 바로 딥러닝의 동작 원리!! 로지스틱 회귀는 선형 회귀와 마찬가지로 적절한 선을 그려가는 .. 모두의 딥러닝 (3) - 오차 수정하기 : 경사 하강법 저번 장에서 오차를 확인하는 최소제곱법, 평균 제곱근 오차에 대해 공부했다면 이번 장에서는 그 오차를 계속 수정하면서 오차를 최소화 시키는 방법인 경사 하강법에 대해서 배우겠습니다! 위 그림을 보면 x가 p일 때 오차가 제일 작다. 즉, x가 p와 가까워질수록 오차가 점점 작아진다는 것!! 그러면 만약 x가 p와 멀리 떨어져 있을때 오차를 줄이면 되는데 그것을 하기 위해서는 현재 있는 지점이 다음에 진행될 지점와 비교해 p와 어느정도 떨어져 있는지 컴퓨터가 알아야 한다! 하지만 우리는 어느 지점이 우리가 원하는 p 값인지 모르게 때문에 '미분'을 사용! 현재 있는 지점에서 미분을 하면 그 기울기가 나오는데 x가 p에 가까울수록 미분된 기울기가 0에 가까워진다. 위 그림으로 좀 더 자세히 설명을 드리자면 .. 졸업선물 http://book.naver.com/bookdb/book_detail.nhn?bid=10153120 졸업선물 진짜 시험은 졸업 후 시작된다 지극히 현실적인 사회생활 생존 꿀팁 공학박사이자 삼성디스플레이 책임연구원 출신 저자가 갓 돌이 된 딸아이와 딸의 상사가 될 지금의 20대, 30대 젊은이들에게 선물하는 지극히 현실적인 사회생활 생존 꿀팁. 어떻게 하면 독서를 똑바로 할 것인가? 어떻게 인간관계를 가질 것인가? 신문기사는 어떻게 공부해야 되나? 목표는 어떻게 찾아야 되나? 내가 알고 있는 개념들은 올바른 것인가? 나는 어떻게 훌륭한 리더가 될 것인가? 공부를 book.naver.com 이 책을 읽게 된 계기는 지인의 선물로부터 비롯되었다. 부산에 살았던 어릴적에는 아버지 친구분들과 그 밑의 형, 누.. 모두의 딥러닝 (2) - 가장 훌륭한 예측선 긋기: 선형 회귀 인간의 몸을 이해하려면 몸을 구성하는 기본 단위인 세포의 역할을 이해하듯이 딥러닝의 가장 말단에서 이루어지는 가장 기본적인 두 가지 계산 원리를 알아야 한다! 그것이 바로 선형 회귀와 로지스틱 회귀! 먼저 선형회귀란 가장 훌륭한 예측선 긋기라는 의미와 동일한데 예를 들어 사람은 ------를 해야 키가 크다. 라는 말이 있다. 여기서 ------는 독립변수(X), 큰 키는 종속변수(Y)이다. 우리가 알고 있는 키가 크기 위한 요인들은 유전, 식습관, 수면시간 등등이 있는데 여기서 말한 요인들이 독립변수이다. 만약 수집해온 데이터들을 가지고 실제 큰 키를 형성하는 요인들을 확실히 분석할 수 있다면 독립변수가 종속변수에 얼마나 영향을 주는 지의 정도를 알 수 있을 것이다. 이때 사용되는 대표적 방법이 바로 .. 모두의 딥러닝 (1) - 처음 해보는 딥러닝 이 책에서는 딥러닝을 처음에 간략하게 소개하기 위해 초장부터 직접 데이터셋을 가져와 딥러닝을 구현한다. 데이터셋은 2013년 외국 외과대학에서 공개한 폐암 수술 환자의 수술 전 진단 데이터와 수술 후 생존 결과를 기록한 실제 의료 기록 데이터다. 470개의 라인으로 이루어져 있고 17개의 속성 그리고 하나의 클래스로 구성되어 있다. 속성들은 예를 들어 종양의 유형, 흡연 등등의 환자 특성을 기록했고 클래스는 생존이면 1 사망이면 0을 기록해 폐암 환자의 수술 후 생존율을 예측하는 모델이다. 이제 시작해보자! 먼저 딥러닝을 구동하기 위해 필요한 케라스 함수들을 불러온다. 케라스는 딥러닝을 할 때 제일 많이 쓰이고 있는 라이브러리 "TensorFlow"를 쫓고 있는 유망한 딥러닝 라이브러리다. 텐서플로우로는.. 이전 1 2 3 다음 목록 더보기