Mathpresso 머신 러닝 스터디 - 1. 머신 러닝(Machine Learning)이란? by 매스프레소(콴다)

세계 최고의 Edutech 기업을 바라보는 Mathpresso의 머신 러닝 스터디를 정리 및 공유하고자 합니다.

누군가에게 도움이 될 수 있기를 바라며 정리를 시작하겠습니다.

Machine Learning이란?

누군가에게 머신 러닝이 무엇이다! 라고 설명하는 것은 굉장히 난감합니다.

아주 다행스럽게도 프로그래머의 친구이자 선생님인 구글에서 이러한 고민을 쉽게 해결해주었습니다.

“AlphaGo”

2016년 3월 9일부터 15일까지 한국의 이세돌 프로기사와의 대결을 펼쳐 4:1의 스코어로 승리를 거둔 알파고는 전세계에 큰 충격을 주었습니다.

이 알파고는 인간이 아닌 컴퓨터로 수많은 바둑 결과를 스스로 학습하여 강해지는 컴퓨터 바둑 기사입니다.

컴퓨터가 스스로 학습한다… SF 영화에나 나올만한 이야기입니다.

이 사건을 계기로 머신 러닝에 대해 전혀 알지 못하던 사람들도 관심을 갖게 되었고 공학계에서는 난관의 돌파구로 머신 러닝을 찾게 되었습니다.

Machine Learning

그렇다면 머신 러닝의 기술적인 원리는 무엇일까요?

일단 위키피디아를 살펴보겠습니다.

머신 러닝(영어: machine learning) 또는 기계 학습(機械學習)은 인공 지능의 한 분야로, 컴퓨터가 학습할 수 있도록 하는 알고리즘과 기술을 개발하는 분야를 말한다. 가령, 기계 학습을 통해서 수신한 이메일이 스팸인지 아닌지를 구분할 수 있도록 훈련할 수 있다. 1959년, 아서 사무엘은 기계 학습을 “컴퓨터에게 배울 수 있는 능력, 즉 코드로 정의하지 않은 동작을 실행하는 능력에 대한 연구 분야”라고 정의하였다.

출처 — 위키피디아(wikipedia)

오 역시 위키피디아는 똑똑하군요!

여기서 주목할 점은 두가지입니다.

첫번째. 컴퓨터가 학습할 수 있는 알고리즘 두번째. 1959년

첫번째는 굉장히 놀랍지만 간단한 원리입니다.

사람이 무언가를 판단할 때 기준을 갖습니다.

예를 들어 수능 성적을 받고 자신의 등급이 무엇인지 아는 것은 간단합니다.

기준이 있기 때문이죠.

몇 점 이상은 1등급, 몇 점 이상은 2등급 하는 기준 말입니다.

그렇다면 한 학생이 실제로 수학을 잘하는지는 어떻게 판단할까요?? 수능 성적도 한가지 기준이 될 수 있지만 이것이 그 학생을 평가하는 모든 기준은 아닙니다. (그 날만 실수했을 수도 있지 않을까요??!!!)

이때 중요한 것은 인간은 이러한 기준을 머릿속에 갖고 있습니다. 내가 혹은 내 친구가 수학을 잘하는지 못하는지는 대충 알고있다는 것입니다. 그러면 이것을 어떻게 프로그래밍으로 표현할 것인가…..

사람의 데이터를 쉽게 수치화 할 수 없기 때문에 일반적인 방법으로는 높은 정확도를 가질 수 없을 것입니다. (다양한 사람을 프로그래밍 한다는 것은 쉽지 않죠)

이때 바로 머신 러닝이 등장합니다.

컴퓨터가 기준을 학습할 수 있는 알고리즘을 짜는 것입니다.

오늘은 첫 스터디이기에 그 알고리즘은 학습자의 상상에 맞기겠지만 머신 러닝을 이용해서 앞서 말한 학생의 수학 실력을 판단할 수 있는 것입니다.

이런 것들이 어떻게 가능하고 언제부터 가능해진 것인지를 알아보기 위해 두번째로 넘어가겠습니다.

두번째.1959년

말도 안된다고 생각하실수 있겠지만 이러한 머신 러닝은 대략 60년 전부터 존재하고 연구 되어온 분야입니다.

수많은 학자들이 컴퓨터를 학습시킬 수 있을 거라고 생각했고 실제로 많은 성과들을 거두었죠.

그런데 왜!

이러한 기술이 대중들에게 알려지지 않은 것일까요??

바로 머신 러닝에는 어마어마한 양의 데이터가 필요하고 엄청난 컴퓨터 성능을 요구하기 때문입니다.

인간이 태어나서 수많은 시간들을 보고 듣고 느끼면서 생겨난 기준들을 달랑 수백개의 데이터로 얻어낼 수 있다면 세상은 정말 많이 바뀌었겠지만 아쉽게도 머신 러닝이 그렇게 해주지는 않습니다.

앞서 언급했던 ‘AlphaGo’ 시스템은 무려 16만개의 데이터를 확보했고 3000만개 이상의 착점을 학습했다고 합니다. 알파고는 하루에 3만 번의 대국을 두며 알파고에게 1달은 바둑 기사의 시간으로 1000년 이라고 합니다….

일반인의 상식으로는 가늠할 수 없는(저도 마찬가지 입니다) 수치들이기에 이제서야 빛을 보게 된 것입니다.

구글과 같은 검색 엔진 뿐만 아니라 정보를 얻고자 하면 수많은 데이터를 수집할 수 있는 환경과 엄청난 컴퓨터 성능을 보유하게 된 현재, 머신 러닝 결과를 눈으로 볼 수 있는 시대로 넘어온 것 이죠.

인간과 AI가 공존하는 세상 — 오버워치

무엇을 할까?

이러한 기술에 대한 구체적인 이야기로 들어가기 전에 우리는 이것으로 무엇을 할 수 있을지 알아야 합니다.

먼저 머신 러닝은 무엇이든 할 수 있어! 라고 말하고 싶습니다.

간단하게 스팸 메일을 분류하는 것 부터 마치 인간인 것처럼 대화를 하게 할 수도 있습니다.

펀드매니저를 대신해서 주식 투자를 하게 할 수도 있고 최근에는 인간의 감정이나 편견까지도(좋은 건 아닌데…)학습할 수 있는 것으로 보입니다.

먼 미래에는 AI(인공지능)가 가능하지 않을까 하는 막연한 호기심도 생깁니다.

하지만 머신 러닝은 만능이 아니야! 라고도 말하고 싶습니다.

아직 머신 러닝으로 효과를 보고 있는 분야는 자연어 의미 분석, 상품 추천, 영상 처리 등등 빅데이터를 활용하는 분야 중 일부에 해당합니다.

또한 인간이 감정이 개입하는 부분에서 사용하는 것이 부적합하다고 많은 분들이 생각하고 있습니다.

머신 러닝을 이용해서 새로운 가치를 발견하는 것은 매우 어려운 부분입니다.

반대로 말하면 새로운 가치를 발견한다면 당신은 알파고와 같은 충격을 가지고 올 수 있을 것 입니다.

첫 스터디를 마치고 앞으로 기술적인 부분에 대한 이야기를 시작하겠습니다.

cf) 오탈자 혹은 잘못된 개념에 대한 피드백은 항상 환영합니다.