뉴럴 네트워크는 기존의 기계학습이 분류한다고 말하는 기능을 우아한 방법으로 실현 하려는것인데 반해서 뉴럴 네트워크는 인간의 뇌신경 회로를 흉내내 매우 복잡한 구조의 힘을 통해 분류 하려는 것이다.

인간의 뇌는 뉴런의 네트워크로 구성되어 있어서 각 뉴런은 시냅스를 통해 서로 전기 자극을 전달한다. 여기엔 임계값 이라는 개념이 있는데, 자극이 일정 임계값을 넘지 못하면 전기신호가 발화되지 않아 그값이 0이되고 발화하면 1이되어 정보를 전달하는 방식이 뉴런사이에서 일어난다.


뉴럴 네트워크는 이러한 생체 뉴런의 정보 전달방식을 모사하였으며, 각 노드는 시냅스를 모방하고 있다고 보면된다. 아래층 뉴런으로부터 받은 값에 가중치를 곱하고, 그합을 시그모이드 함수(S자 곡선)을 거쳐 출력한다.

(시그모이드 함수는 온-오프를 수학적으로 취급하기 쉽도록 하기 위한 함수이다.)


일련의 흐름중에서 중요시 되는것은 가중치의 부여로, 인간의 뉴런이 학습에 의해 시냅스의 결합 강도를 변화시키듯이 학습하는 과정에서 중요성의 부여를 변화시켜 최적인 값을 출력하여 조정하는 것으로 정밀도를 높여간다. 결과적으로 훈련 데이터를 통해 이 가중치값들이 결정되면 이들의 결정된 네트워크를 통해 입력 데이터를 분류하는것이 바로 뉴럴 네트워크이다.

예를 들면

돈을 빌리는 사람의 경제상황과 상환할 수 있는가, 아닌가?

어떤문서가 외설인가, 그렇지 않은가?

어떤 이미지에 수상한 인물이 비치고있는가, 아닌가?

어떤 사람의 성적과 그 사람이 대학에 합격할 것인가, 아닌가?

어떤 고객의 정보와 그 사람이 단골손님이 될것인가, 아닌가?

연구실에서는 신입생들에게 자신이 좋아하는 데이터로 분리방법을 연구해 컴퓨터에 학습시켜 자동적으로 분류하시오라는 과제를 내고있다.


시간이 걸리는 학습, 순식간인 예측

기계 학습은 뉴럴 네트워크를 만드는 학습페이즈와 완성된 뉴럴 네트워크를 사용해서 정답을 내는 예측 페이즈 2개로 나뉜다. 학습 페이즈는 1,000건으로부터 100만건정도의 대량의 데이터를 입력하고, 서로 답변 맞춤을 하여 틀릴때마다 W1과 W2를 적절한 값으로 수정하는 작업을 일괄적으로 되풀이한다. 이 작업은 8만개의 가중을 수정하기 위해서 7만장의 이미지를 계속 입력하는 셈이어서 정말로 시간이 많이 걸린다. 통상 몇초 부터 길때는며칠 걸리는 것도 있다. 그러나일단 완료 되면 사용할 때는 간단해서 그저 완성된 가중치를 이용해 새로운 입력데이터를 이가중치 네트워크에 통과 시켜주기만 하면된다,. 이 작업은 순식간에 끝난다.


학습페이즈와 예측페이즈 사진 올리기

'Artificial Intelligence > Deep Learning' 카테고리의 다른 글

딥러닝 다계층  (0) 2016.01.22
딥러닝  (0) 2016.01.22
기계 학습  (0) 2016.01.21
인공지능 발전 역사  (0) 2016.01.21
인공지능과 딥러닝 이란?  (0) 2016.01.21
Posted by MIDDLE
,

기계 학습은 제 2차 AI붐에서는 지식을 많이 받아 들일수록 그만큼 행동할 수는 있었지만 기본적으로 입력한 지식 이상의 것을 할 수  없었다. 그릭 입력하는 지식이 보다실용적이어야 하고, 예외에도 대응할수 있도록 만들려면 방대해져서 언제까지나 입력시킬수는 없었다. 근본적으로는 기호와 그것이 가리키는 의미가 결부 되지 않았고, 컴퓨터가 의미를 취급하는것은 매우 어려웠다.

이러한 폐쇄갑 속에 차근차근 힘을 키워온것이 기계학습이란 기술이며, 그 배경에는문자 식별등의 패턴인식 분야에서 오랜세월 축적되어온 기반 기술과 증가하는데이터의 존재가 있었다.

특히 인터넷상에 있는 웹페이지의 존재는 강렬해서 웹페이지의 텍스트를 다루는 것이 가능한장연어 처리(Natural Language Process)와 기계 학습의 연구가 크게 발전했다.

그결과 통계적 자연어 처리(Statistical Natural Language Process)라고 불리는 영역이 빠른 속도로 발전했다. 이것은 예를 들어 번역을생각 할때에 문법 구조나의미 구조를 생각하지 않고, 단지 기계적으로 번역되는 확률이 높은 것을적용시켜 나가면 된다는 사고방식이었다.


기계학습에서 학습한다는 것은 분류 한다는 의미로 통한다.

기계학습이란 인공지능 프로그램 자신이 학습하는 구조를 말한다. 도대체 학습은 무엇인가? 어떻게 하면 학습 했다고 말할 수 있는 것인가?

학습의 근간을 두는 것은 '분류한다'라는 처리이다. (물론 회귀 등의 작업도 있지만 여기에선 분류에 초점을 맞춰 설명한다.) 잘 분류할 수 있으면 사물을 이해할 수도있고 판단해서 행동할 수도 있을것이다. 분류라는 것은 그러한 학습과정중 가장 기본단계인데. 다시말해 Yes냐 No 로 대답하는 문제이다.

예를 들어 어떤것을 보았을때 그것이 만져도 되는것인지 아닌지 알고 싶다고하자. 이것을 Yes or No 문제이다. 


기계 학습은 크게 지도학습 (Supervised Learning) 비지도 학습(unsupervised Learning)으로 나눌 수 있다.

지도학습은 입력과 올바른 출력이 세트가 된 훈련 데이터를 미리 준비하고, 어떤 입력이 주어졌을때 올바른 출력이 나오도록 컴퓨터에 학습을 시킨다.

통상적으로 인간이 교사욕할을 하며 올바른 훈련 데이터에 한해 올바른 분류의 결과를 알려준다. 예를 들어 문서 분류라면 할당해야 할 라벨은 이문서는 '정치 분야', 이문서는 '경제 분야'라는 문서의 카테고리가 될 것이며, 이미지 인식이라면 이 이미지는 '요트', 이미지는 '꽃'이라는 라벨이필요 할것이다. 이렇게 라벨링이 되어있는 데이터 세트로는 로이터통신의 데이터 세트라는것이 유명한다. 2만개 신문 기사데이터에 135개의 카테고리가부여되어 있어서 문서 분류 연구에서 잘 사용되고 있다.


비지도 학습은 입력용 데이터만 주고 라벨링 없이 데이터에 내재하는 구조를 파악하기 위해서 이용할 수 있다. 데이터속에 있는 일정한 패턴이나 룰을 추출하는 것이 목적이다. 정체의데이터를 공통 항목을 가지는 군집으로 나누거나(클러스터링), 빈출 패턴을 찾는것이 대표적인 비지도 학습 태스크이다. 예를 들면 어떤 슈퍼 마켓의 구매데이터로 먼곳에서 물건을 사러오고 평균 구매단가가 높은 그룹과 근처에서 사러와서 구매단가가 낮은 그룹을 데이터 분포를 통해 밝혀내는것은 클러스터링의 한예라고 할 수 있다.

또한, 기저귀와 맥주를 함께 구매하는 경우가 많다라는 것을 발견하는것이 빈출 패턴 마이닝 혹은 상관 룰 추출이라고 불리는 처리이다. 이와같이 비지도 학습은 인간의 라벨링 없이도 데이터 분포만으로 그패턴을 인식하는 학습 방법 말한다.


'Artificial Intelligence > Deep Learning' 카테고리의 다른 글

딥러닝 다계층  (0) 2016.01.22
딥러닝  (0) 2016.01.22
뉴럴 네트워크  (0) 2016.01.21
인공지능 발전 역사  (0) 2016.01.21
인공지능과 딥러닝 이란?  (0) 2016.01.21
Posted by MIDDLE
,

인공지능은 지금까지 총 3번의 붐이 일어났다.

제 1차 AI붐은 1950년 후반~1960년대를 말한다.

컴퓨터 추론 탐색을 하는 것으로 특정한 문제를 푸는 연구가 진행되었다.


제 2차AI붐은 1980년대 이며 컴퓨터에 지식을 넣으면 똑똑해진다는 접근법이 전성기를 맞이하고, 익스퍼트 시스템이라 불리는 실용적인 시스템이 많이 만들어졌다. 그러나 지식을 서술하고 관리하는 것이 엄청나게 방대하다는 것이 밝혀 지면서 AI는 1995년 다시 겨울 시대로 돌입하였다.


제3차 AI붐은 현재 2000년대부터 웹이으로 대량의 데이터를 이용한 기계학습이 조용히 퍼져왔다. 그리고 AI연구는 3번째 붐으로 도달했다. 빅데이터 시대에 널리 퍼진 기계 학습과 기술적으로 크게발전한 딥러닝(특징표현 학습) 등 2개의 큰 파도가 겹쳐지면서 탄생하였다.


인공지능 연구 평면도 사진추가

'Artificial Intelligence > Deep Learning' 카테고리의 다른 글

딥러닝 다계층  (0) 2016.01.22
딥러닝  (0) 2016.01.22
뉴럴 네트워크  (0) 2016.01.21
기계 학습  (0) 2016.01.21
인공지능과 딥러닝 이란?  (0) 2016.01.21
Posted by MIDDLE
,