Supervised Learning, Unsupervised Learning & Reinforcement Learning explained by Ni Lao @ Mosaix

기술 부분에 대해 이야기 해 봅시다 그래서 기계 학습 카테고리에는 감독 학습, 감독되지 않은 학습, 그리고 강화 학습이 있습니다

기계 학습 알고리즘의 혁명을 통해 우리를 간단하게 안내 할 수 있습니까? 예, 그러고 싶습니다 그래서이 세 가지 개념은 매우 외국적인 것처럼 들리지만 실제로는 매우 강력한 개념입니다 그리고 모두가 조금씩 배우기 때문에 모든 사람들이 서로 관련 될 수 있어야합니다 매일 슈퍼 마리오 게임을 배우기를 원한다고 가정 해보십시오

감독 학습을한다면, 인간이 기계를 단계별로 가르 칠 필요가 있음을 의미합니다 무엇을해야 할 필요가 있습니다 그리고 슈퍼 마리오의 경우는 마치 앞에서 거북이를 본다면 뛰어 넘어야합니다 만약 너라면 너 앞에서 동전을 보면, 앞으로 나아가 야지 – 그런 종류의 지시, 그렇지? 그럼 많은 지침을 줄 필요가 있고 규칙을 많이 작성해야하고 인간의 라벨링 아무도 그렇게하지 않으면 효과가 없을 것입니다 또는 Google이나 Apple과 같은 많은 돈이있는 경우 작동합니다

그리고 나서 보강 학습이 있습니다 강화 학습의 아이디어는 전략을 탐색 할 기계를 갖추는 것입니다 그래서 당신은 매우 높은 레벨의 목표를 정의합니다 무대를 통과하거나 더 많은 동전을 얻는다고 가정 해 봅시다 그리고 기계는 다른 것들을 시도하고 실제로 어떤 것을 볼 것입니다

당신이 원하는 것을 제공합니다 그런 다음 전략을 강화하십시오 그리고 시간이 지남에 따라 거북이를 걷어차는 법을 배우게됩니다 그러나 이것은 또한 제한적입니다 우리가 한 일은 아주 좋았습니다

AlphaGo 나 Atari Games와 같았습니다 인간이 탐험하지 못한 공간을 탐험하고 새로운 전략을 찾는다 기본적으로 인간을 초월 할 수 있습니다 그러나 두 가지 문제가 있습니다 하나는 – 먼저, 기계가 검색 할 수있는 공간을 찾아야합니다

그것은 큰 문제입니다 Go는 스페이스가 보드이기 때문에 더 쉽습니다 그러나자가 운전 차량이나 슈퍼 마리오 게임과 같은 다른 경우에는 다음과 같이 정의해야합니다 학습을위한 더 많은 수퍼 공간 극단적 인 경우를 가정 해 보겠습니다

규칙은 게임의 전체 이미지를 기반으로합니다 성능을 달성하기 위해 무한한 규칙을 작성해야한다는 것입니다 두 번째 문제는 사람들이 너무 많은 학습 이론을 강화에 적용하지 않았다는 것입니다 학습, 그래서 최적화 절차는 효율적이지 못하고, 수렴하는데 아주 오랜 시간이 걸리고, 좋은 성능을 얻으려면 많은 양의 데이터를 가져 가야합니다 낭비 적이기 때문에 시간이 지남에 따라 개선 할 수 있습니다

세 번째는 감독되지 않은 훈련입니다 저는 그것이 강화 학습에서의 문제를 해결하는 열쇠라고 생각합니다 예를 들어 ImageNet 데이터 세트와 같은 이미지 분류의 경우 수천 개의 고양이 이미지에서 고양이 답을 가르치고 싶습니까? 그러나 이것을 아이에게 가르치고 싶다면, 아이가 필요합니다 그러므로 어린이들에게 "고양이"라는 단어를 가르치기 전에 이미 그 표현이 있습니다 모든 고양이는 서로 가깝고 다른 동물들과 아주 멀리 떨어져 있습니다

맞습니까? 그래서 모든 부모님은 거기에 레이블을 붙이는 것입니다 그래서 많은 학습이 이미 끝났습니다 그렇기 때문에 수퍼바이저 교육이 기계 학습에 중요한 이유입니다