기계 학습은 제 2차 AI붐에서는 지식을 많이 받아 들일수록 그만큼 행동할 수는 있었지만 기본적으로 입력한 지식 이상의 것을 할 수  없었다. 그릭 입력하는 지식이 보다실용적이어야 하고, 예외에도 대응할수 있도록 만들려면 방대해져서 언제까지나 입력시킬수는 없었다. 근본적으로는 기호와 그것이 가리키는 의미가 결부 되지 않았고, 컴퓨터가 의미를 취급하는것은 매우 어려웠다.

이러한 폐쇄갑 속에 차근차근 힘을 키워온것이 기계학습이란 기술이며, 그 배경에는문자 식별등의 패턴인식 분야에서 오랜세월 축적되어온 기반 기술과 증가하는데이터의 존재가 있었다.

특히 인터넷상에 있는 웹페이지의 존재는 강렬해서 웹페이지의 텍스트를 다루는 것이 가능한장연어 처리(Natural Language Process)와 기계 학습의 연구가 크게 발전했다.

그결과 통계적 자연어 처리(Statistical Natural Language Process)라고 불리는 영역이 빠른 속도로 발전했다. 이것은 예를 들어 번역을생각 할때에 문법 구조나의미 구조를 생각하지 않고, 단지 기계적으로 번역되는 확률이 높은 것을적용시켜 나가면 된다는 사고방식이었다.


기계학습에서 학습한다는 것은 분류 한다는 의미로 통한다.

기계학습이란 인공지능 프로그램 자신이 학습하는 구조를 말한다. 도대체 학습은 무엇인가? 어떻게 하면 학습 했다고 말할 수 있는 것인가?

학습의 근간을 두는 것은 '분류한다'라는 처리이다. (물론 회귀 등의 작업도 있지만 여기에선 분류에 초점을 맞춰 설명한다.) 잘 분류할 수 있으면 사물을 이해할 수도있고 판단해서 행동할 수도 있을것이다. 분류라는 것은 그러한 학습과정중 가장 기본단계인데. 다시말해 Yes냐 No 로 대답하는 문제이다.

예를 들어 어떤것을 보았을때 그것이 만져도 되는것인지 아닌지 알고 싶다고하자. 이것을 Yes or No 문제이다. 


기계 학습은 크게 지도학습 (Supervised Learning) 비지도 학습(unsupervised Learning)으로 나눌 수 있다.

지도학습은 입력과 올바른 출력이 세트가 된 훈련 데이터를 미리 준비하고, 어떤 입력이 주어졌을때 올바른 출력이 나오도록 컴퓨터에 학습을 시킨다.

통상적으로 인간이 교사욕할을 하며 올바른 훈련 데이터에 한해 올바른 분류의 결과를 알려준다. 예를 들어 문서 분류라면 할당해야 할 라벨은 이문서는 '정치 분야', 이문서는 '경제 분야'라는 문서의 카테고리가 될 것이며, 이미지 인식이라면 이 이미지는 '요트', 이미지는 '꽃'이라는 라벨이필요 할것이다. 이렇게 라벨링이 되어있는 데이터 세트로는 로이터통신의 데이터 세트라는것이 유명한다. 2만개 신문 기사데이터에 135개의 카테고리가부여되어 있어서 문서 분류 연구에서 잘 사용되고 있다.


비지도 학습은 입력용 데이터만 주고 라벨링 없이 데이터에 내재하는 구조를 파악하기 위해서 이용할 수 있다. 데이터속에 있는 일정한 패턴이나 룰을 추출하는 것이 목적이다. 정체의데이터를 공통 항목을 가지는 군집으로 나누거나(클러스터링), 빈출 패턴을 찾는것이 대표적인 비지도 학습 태스크이다. 예를 들면 어떤 슈퍼 마켓의 구매데이터로 먼곳에서 물건을 사러오고 평균 구매단가가 높은 그룹과 근처에서 사러와서 구매단가가 낮은 그룹을 데이터 분포를 통해 밝혀내는것은 클러스터링의 한예라고 할 수 있다.

또한, 기저귀와 맥주를 함께 구매하는 경우가 많다라는 것을 발견하는것이 빈출 패턴 마이닝 혹은 상관 룰 추출이라고 불리는 처리이다. 이와같이 비지도 학습은 인간의 라벨링 없이도 데이터 분포만으로 그패턴을 인식하는 학습 방법 말한다.


'Artificial Intelligence > Deep Learning' 카테고리의 다른 글

딥러닝 다계층  (0) 2016.01.22
딥러닝  (0) 2016.01.22
뉴럴 네트워크  (0) 2016.01.21
인공지능 발전 역사  (0) 2016.01.21
인공지능과 딥러닝 이란?  (0) 2016.01.21
Posted by MIDDLE
,