제8화. 머신러닝(Machine Learning) 그것이 알고싶다? - AMORE STORIES
#Digital
2017.03.29
10 LIKE
2,450 VIEW
  • 메일 공유
  • https://stories.amorepacific.com/%ec%a0%9c8%ed%99%94-%eb%a8%b8%ec%8b%a0%eb%9f%ac%eb%8b%9dmachine-learni

제8화. 머신러닝(Machine Learning) 그것이 알고싶다?

최신 디지털 기술에 대해 소개하는 칼럼입니다

칼럼니스트아모레퍼시픽 디지털 정보혁신팀 최문규 님

 구글, 페이스북과 같은 기업이 머신러닝(Machine Learning)을 사용해 자동차를 운전하고 음성을 인식하고 이미지를 분류한다는 이야기는 사우 여러분도 뉴스나 본 디지털 칼럼을 통해 들어보셨을 것입니다. 그런데 머신러닝이 과연 우리 회사 비즈니스와 무슨 관계가 있을까요?

# 머신러닝 그 인기의 비결은?

 기계는 인간의 일을 모두 대체하게 될까? 구글의 인공지능 '알파고'가 이세돌과의 바둑 대국에서 4대 1로 승리를 거두면서, 머신러닝(Machine Learning)이 인간의 지위를 위협할 수 있다는 가설에 많은 이들이 주목하게 되었습니다. 특히 인공지능에 대한 관심이 적었던 한국 사회에 보내준 충격은 가히 충격적이라고 할 수 있었습니다. 과거의 인공지능이 인간이 가르친 규칙을 더 많이 저장하고 정해진 룰(Rule)을 더 빨리 대답하는 '단순한 기계'였다면, 미래의 인공지능은 인간의 도움 없이도 직접 인지하고 추론하고 생각하는 정보를 기반으로 학습하고 유추하는 인공지능입니다. 머신러닝은 무궁무진한 가능성을 가지고 벌써 사회 곳곳에서 변화를 만들어 내고 있습니다.

# 머신러닝이란?

 머신러닝, 즉 '기계 학습'이란 문제를 해결하기 위한 일련의 데이터에 대해 무언가 흥미로운 것을 알려줄 수 있는 일반 알고리즘(generic algorithms)이 있다는 아이디어로 코드를 작성하는 대신, 데이터를 일반 알고리즘에 공급하면 데이터를 기반으로 한 로직을 만드는 것입니다.

 예를 들어, 이러한 알고리즘의 한 종류가 분류(classification) 알고리즘입니다. 이 알고리즘을 사용하면 데이터를 서로 다른 그룹으로 분류할 수 있습니다. 손으로 쓴 숫자를 인식하는 데 사용 된 것과 동일한 분류 알고리즘을 그대로 코드 변경없이 사용해서, 이메일을 스팸과 스팸이 아닌 것으로 분류 할 수도 있습니다. 결국 동일한 알고리즘이지만 다른 학습 데이터를 제공하면 다른 '분류 로직'이 자동으로 만들어지게 됩니다.
  • 출처 : https://medium.com/@ageitgey/machine-learning-is-fun-80ea3ec3c471


# 머신러닝 알고리즘?

 머신러닝의 알고리즘은 수백 가지가 존재합니다. 이중 기계 학습 알고리즘은 지도 학습(Supervised learning)과 비지도 학습(Unsupervised learning) 그리고 강화 학습(Re-enforcement learning) 세 가지 주요 범주 중 하나로 분류될 수 있습니다.
  • 참고 : https://swalloow.github.io/pyml-intro1

1) 지도 학습(Supervised learning)

 지도 학습은 결과에 대한 사전 지식이 필요한 학습방법으로, 쉬운 예로 당신이 부동산 중개인이라고 가정해 보면, 비즈니스가 성장함에 따라 당신을 도와줄 수 있는 수습 직원을 고용하려고 합니다. 그런데 문제가 있습니다. 전문가는 주택을 보기만해도 얼마의 가치가 있는지 잘 알수 있으나 수습 직원들은 전문가와 같은 경험이 없으므로 어떻게 주택 가격을 책정해야 하는지 잘 알지 못합니다. 이 문제를 해결하기 위해 주택을 팔 때마다 각 주택의 방의 개수, 평방 크기, 지역, 가격 등 세부 정보를 기록하고 이 훈련 데이터를 사용해서 해당 지역의 다른 주택이 얼마의 가치가 있는지 추정 할 수 있는 강력한 도구를 만들 수 있게 됩니다.

2) 비지도 학습(Unsupervised learning)

 비지도 학습은 앞에서 언급한 것 처럼 기록(라벨링)이 되어 있지 않은 데이터로부터 미래를 예측하는 학습 방법입니다. 평가되어 있지 않은 데이터로부터 숨어있는 패턴이나 형태를 찾아야 하기 때문에 당연히 더 어려운 방법이며, 현실에서도 이벤트의 '최종' 결과를 알지 못하는 경우가 많습니다. 이러한 비지도 학습은 구체적인 결과에 대한 사전 지식이 없지만 데이터를 통해 유의미한 지식을 얻고자 하는 경우 이용할 수 있습니다.

3) 강화 학습(Re-enforcement learning)

 마지막으로 데이터가 정답이 있는 것도 아니며, 심지어 주어진 데이터가 없을 수도 있습니다. 강화 학습이란, 자신이 한 행동에 대한 "보상"을 알 수 있어서 그로부터 학습하는 것을 말합니다. 보통 게임 인공지능을 많이 예시로 드는데, 여기에서 학습 대상(agent)은 움직이면서 적을 물리치면 보상(reward)을 받게 됩니다. 이러한 과정을 반복 학습(Trial and Error) 하면서 점수를 최대화하는 것이 목표입니다. 이를 훈련에 응용한 학습방법 입니다.

 대표적인 학습 알고리즘은 아래와 같습니다.

지도 학습 기법 주요 내용
일반화 선형 모델
(Generalized Linear Models, GLM)
선형 회귀(Linear Regression)의 발전적 형태, 다양한 가능성 분산과 연결함수를 지원
의사결정 트리
(Decision Trees)
모 집단을 대상 변수에 대해 동질적인 더 작은 조각으로 점진적으로 분할하는 규칙 집합을 학습하는 방법
랜덤 포레스트
(Random forests)
다수의 의사결정 트리를 학습 후, 드리 전반에 걸친 평균을 구해 예측을 산출하는 방법
그래디언트 부스팅 머신
(Gradient boosting Machine, GBM)
의사결정 트리의 시퀀스 교육을 통해 예측모델을 생성, 연속되는 트리가 이진 트리의 예측오류 수정
딥 러닝
(Deep Learning)
데이터의 고수준 패턴을 복합적인 다계층 네트워크로 모델링 하는 방법. 머신러닝의 가장 어려운 문제를 해결할 잠재력을 지닌 학습 기법
클러스터링
(Clustering)
개체를 다수의 메트릭스에서 상호 유사항 세그먼트 또는 클러스터로 그룹화하는 기법
비정상 탐지
(Anomaly detection)
예상치 못한 이벤트 또는 결과를 식별하는 학습 방법
차원축소
(Dimension reduction)
고려 대상 변수의 수를 줄이는 학습 방법

출처 : 2017 IDG Machine Learning Guide

 데이터 과학자가 더 적은 시간에 더 많은 방법을 시도하기 위해서는 높은 성능이 필수적이며, 일부 머신러닝 기법이 다른 기법에 비해 지속적으로 좋은 결과를 내는 경우도 있지만, 특정 문제에 대해 어느 기법이 가장 효과적인지 사전에 판단할 수 있는 경우는 극히 드물다고 합니다.

# 머신러닝의 실제 사용 사례?

 세계 주요 기업들은 앞다투어 머신 러닝에 대한 연구가 진행되고 있습니다. 우리나라의 NHN, 다음카카오 등도 머신러닝을 활용한 검색 서비스를 하고 있으며, 삼성, 현대, SK 등은 서비스 분석을 위한 머신러닝 관련 조직을 운영 중이기도 합니다. 우리나라의 경우 빅데이터를 활용하는 데만 초점이 맞추어져 있고, 글로벌의 경우는 머신러닝 기술을 이용해 다양한 산업에 서비스를 새롭게 만들어 가는 수준입니다.
  • 출처 : 소프트웨어정책연구소


 머신러닝은 다양한 산업 영역으로 진출해 신시장 창출을 할 것으로 기대되고 있습니다.

응용분야 활용 예시
자율주행 - 자율주행차 신규 제조업체 등장 예상
- 새로운 자율주행 보험 및 여행서비스 등장
차세대 제조업 - 운송 트럭/차량 내 자동 제조
- AI 기반의 맞춤형 제조가 새로운 BM으로
인텔리전트 스마트홈 지능형 스마트 가전이 삶을 편리하게 거주 공간의 지능화로 노인케어에도 변화
인텔리전트 메디커레어 - 바이타데이터 및 유전자 정보 활용 건강 관리
- 의료진 대상 지적 서포트 서비스 등장
인텔리전트 인프라 - 전력, 수도, 가스 등의 AI 기반 자동 조절
- 다리, 발전소 등 공공인프라 이상 감지
AI 기반 스마트 농업 - 농작업 자동화 및 드론 이용한 정밀 농업
- AI기반 기상예측 및 농업보험 등장
자율 배송, 유통 - 자율화물배송, 무인화물선, 드론 자율 배달
- 물류 창고 내 AI 로봇 이용
인텔리전트 커머스 - 점포에서 얼굴 인식으로 자동 추천 서비스
- 구매 데이터 분석으로 맞춤형 광고 제공
AI 기반 핀테크 - 주식, 투자상품의 로보어드바이저
- 은행 대출 업무, 금융 상품 지원 업무
자율형 안전보장 로봇 - 재해 지역에서 구조 활동
- 극한 환경 등에서 자율적으로 행동
맞충형 스마트 교육 - 학생 개별 개별에 맞는 교육 콘텐츠 제공
- AI기반 대학 커리큘럼 설계 지원
인텔리전트 시큐리티 - 빅데이터 분석에 따른 범죄 예측/예방
- 사람 행동 분석으로 이상 행동 사전 감지
비즈니스 업무 환경 변화 - 서류 관리 및 데이터 분석 등 AI기반 자동화
- 고 전문성 업무에 AI 도입 활발 (번역, 법률 등)

출처 : CIO Summit 2016


# 머신러닝의 미래?

 머신러닝은 지금의 검색처럼 보편화되고 사용하기 쉬워지고 강력해질 것으로 기대를 높이고 습니다. 특히 구글, 야후를 비롯한 여러 기업들은 무수히 많은 페이지에서 관련된 결과를 손쉽게 찾을 수 있도록 함으로써 일반적인 사용자에게 웹의 강력한 힘을 제공할 수 있을 것으로 많은 투자와 연구를 진행하고 있습니다.

 마찬가지로 머신러닝은 가치있는 통창력을 손쉽게 얻을 수 있도록 함으로써 모든 형태의 기업에게 현대 데이터 셋이 지닌 강력한 힘을 제공하게 될 것으로 기업의 경쟁력을 강화하기 위한 핵심역량으로 자리 잡을 것으로 믿어지고 있습니다. 이를 위해 각 기업은 머신러닝의 비즈니스 활용에 투자와 시도를 적극적으로 확대해 나갈 것입니다.

 머신러닝의 발전을 통해 지금까지 통용돼 왔던 경쟁의 개념이 바뀔 것이며 그 경쟁의 변화를 먼저 준비하고 비즈니스에 적용하는 쪽은 살아남고 그 변화를 하지 못한 쪽은 공룡이 멸종하듯이 비즈니스에서 패자로 사라질 지 모릅니다.

# 머신러닝, 아모레퍼시픽은 어떻게 준비해 갈 것인가?

 아모레퍼시픽은 머신러닝을 어떻게 활용하고 또 준비해야 할 것일까요? 물론 정답은 없습니다. 하지만 이미 무한 경쟁 시대의 디지털 세상에서 미리 준비하고 실행하는 것만큼 중요한 원칙은 없다고 생각합니다. 그 준비를 위해 당장 우리는 머신러닝을 알아가는 것도 필요하지만, 실제 활용을 통해 아모레퍼시픽을 위한 머신러닝 사례를 만들어 가기 위한 시도를 Test & Learn을 해야하며, 그 시도에서 실패와 성공을 반복하여 해답을 찾아야 합니다.

  • 좋아해

    10
  • 추천해

    0
  • 칭찬해

    0
  • 응원해

    0
  • 후속기사 강추

    0
TOP

Follow us:

FB TW IG