Introduction to Runway: Machine Learning for Creators (Part 2)

[철도 휘파람] 다른 비디오 자습서에 오신 것을 환영합니다 Runway 작업 및 기계 학습 모델 실행에 대한 정보 활주로 자체에서 이 비디오 자습서를보기 전에 전에 활주로를 사용한 적이 없다면 돌아가서 내 소개를보고 싶을 수도 있습니다

활주로에 다운로드하고 설치하는 방법 그러나 솔직히 말해서, 당신은 아마 그것을 알아낼 수 있습니다 runwaymlcom으로 이동하여 베타 다운로드를 클릭하십시오 활주로 소프트웨어를 다운로드하여 열어야합니다 그런 다음 모델 찾아보기로 이동합니다

모션 아래로 가서 PoseNet을 클릭하겠습니다 그리고 당신은 바로 여기에 자신을 찾을 수 있습니다 이것이 바로 내가있는 곳입니다 Runway를 설치했습니다 다운로드했습니다

그리고 PoseNet의 Runway 소프트웨어 페이지에 있습니다 기계 학습 모델 자, PoseNet은 무엇입니까? PoseNet은 기계 학습 모델입니다 한 명 이상의 사람에 대한 실시간 골격 추적을 수행합니다 그리고 무엇을 추측합니까? 나는 사람이고, 활주로가 여기에 달려 있습니다 PoseNet과 함께

그래서 나는 그것을 실행할 것입니다 먼저 작업 공간에 추가를 클릭하십시오 그래서 이미 가지고있는 작업 공간이 있습니다 코딩 기차 라이브라는 이전 비디오에서 만든 흐름 입력 소스를 선택하고 싶습니다 나는 그것이 나의 웹캠이되기를 원한다

그렇습니다, 활주로가 바로 나아갑니다 그런 다음 출력 소스를 선택하고 싶습니다 내가 원하기 때문에 처리하고 싶다 이 기계 학습 모델을 실행 한 결과를 얻기 위해 PoseNet 자체 처리 하지만 지금은 미리보기를 클릭하겠습니다 미리보기를 클릭합니다

아, 그리고 나는 달려야한다 하지만 그거 알아? 이것은 이전 비디오에서 보여준 것과 다릅니다 로컬로 실행 옵션이 있습니다 실제로이 모델은 로컬에서만 실행할 수 있습니다 클라우드에서 이것을 실행하는 것은 어리석은 일입니다

이 모든 시간을 보내야했기 때문에 네트워크를 통한 데이터 그리고 실행하기가 매우 쉽습니다 이것은 매우 작고 빠른 모델입니다 대부분의 최신 컴퓨터에서 실행할 수 있습니다 로컬로 실행을 클릭하겠습니다

따라서 GPU 크레딧이 필요하지 않습니다 물론 무료로 사용할 수 있습니다 그리고 우리는 그곳에가는 것을 볼 수 있습니다 지금 실행 중입니다 다양한 요점을 추측합니다

내 골격의 출력에 내 몸에 있습니다 볼 수있는 이하 그래서 일에 대한 좋은 점 중 하나 활주로와 그 모델은 많이 모델마다 다른 매개 변수와 값이 있습니다 조정하고 변경하여 실행할 수있는 것들 다른 방법으로 그리고 이것들은 일종의 하이퍼 파라미터로 알려져 있습니다 기계 학습 모델에 그래서 그들 중 일부는 실제로 모델 실행을 중단 한 다음 나는 그것을 가지고 시작할 수 있습니다

예를 들어이 아키텍처는 실제로 모델을 더 작게 만들 수 있습니다 정확도는 떨어질 수 있지만 더 빨리 실행됩니다 그러나 예를 들어, 나는 단지 가고 있습니다 대신 075로 변경하십시오 다시 실행하겠습니다

그러나 이러한 매개 변수 중 일부는 실제로 실시간으로 조정됩니다 예를 들어 너비와 높이를 변경할 수 있습니다 실제로 변화하는 이미지의 웹캠 자체의 이미지 해상도 원하는 경우 그레이 스케일을 더 만들 수 있습니다 실제로 여러 가지 작업을 수행하여 실제로 조정할 수 있습니다 들어가기 전에 이미지

그러나 이것은 중요한 부분이 아닙니다 이 비디오에서하고 싶은 일을 이 비디오에서하고 싶은 것은 여기서 Runway에서 모델을 실행하는 순간이 있습니다 나는 그것을 가지고 놀 수 있고, 조정하고, 정확하게 얻습니다 내가 원하는 방식으로 작동합니다 다음 단계로 넘어 가고 싶습니다 결과를 볼 수 있도록 여기에서 실행하도록 내 자신의 소프트웨어에서 그렇게하겠습니다

이것을 시도하는 데 사용할 소프트웨어 프로세싱이라고합니다 이 크기는 출력의 활주로에서 640×362, 처리 코드에서 수행 할 작업 캔버스 크기를 640 x 362로 설정합니다 무효 그리기 배경 0 이제 처리 스케치가 있습니다

내가 여기서 뛰고 있습니다 결과, 모델의 결과를 어떻게 볼 수 있습니까 내 프로세싱 스케치에서? 다양한 네트워크 프로토콜이 있습니다 활주로가 지원합니다 그리고 나는 그들에 대해 여기에서 찾을 수 있습니다 이 네트워크 탭을 클릭하여 그리고 처리 작업에 사용하고 싶은 것 OSC입니다 여러 가지 이유가 있습니다 한 프로토콜을 다른 프로토콜보다 선택하십시오

그것은 실제로 당신이하고있는 것에 달려 있습니다 하나의 이미지를 얻고 자하는 경우 HTTP 요청이 가장 적합합니다 그리고 다른 비디오에서 할게요 Runway에서 스타일로 다시 작업하는 방법을 보여 드리겠습니다 하지만 지금은 클릭합니다 OSC에서 처리와 잘 작동합니다 그리고 여기에 많은 정보가 있습니다

이 말은 서버 주소입니다 이것이 내가 활주로에서 필요한 가장 중요한 것입니다 내가 말하고자하는 것은 Processing이 유일한 IP라는 것입니다 로컬 IP 인 주소 이 컴퓨터의 주소와 포트 번호 OSC 메시지를 얻을 수 있습니다 여기를 클릭하겠습니다 그리고 ip와 같은 문자열을 만들 것입니다

나는 아마 갈거야 확신 별도의 변수에 포트 번호를 원합니다 그리고 이와 같은 포트 번호를 만들 것입니다 이제 여기 앉아서 모든 코드를 작성할 수 있습니다 이것을 위해, 나는 보통 코딩 기차 비디오에서 할 수 있습니다 그러나 이것은 상당히 다른 상황입니다 정말 예제를보고 싶어요 실행하고이를 수행하는 방법을 보여줍니다

그리고 Runway 작업에 대한 좋은 점 중 하나 미리 만들어진 예가 많이 있습니까? 다른 플랫폼과 소프트웨어를 사용하는 경우 그 중 하나가 처리 중입니다 그래서 당신이 실제로 어떻게하는지 보여 드리겠습니다 현실 세계에서이 작업을 수행하는 방법 지금하는 방법입니다 Runway ML GitHub에 가면 실제로 한 단계 뒤로 돌아 가야합니다 Runway ML 아래로 이동하십시오 Runway 소프트웨어에 대한 GitHub 페이지는 다음과 같습니다 그리고 많은 정보가 있습니다

높은 수준의 물건과 같은 것이 있습니다 머신 러닝 모델을 이식하는 방법 활주로 자체 자신의 모델을 훈련했거나 Runway에서 지원하지 않는 모델을 찾으십시오 당신이 그것을 추가 할 수있는 방법 그러나 그것은 우리가 여기서 실제로하고있는 것이 아닙니다

내가 찾고 싶은 것은 여기 Processing, Runway 그리고 가공 여기를 클릭하면이 저장소에 프로세싱과 함께 Runway를 사용하는 많은 예제 attnGAN에 StreetView가있는 것을 볼 수 있습니다 얼굴 랜드 마크, im2txt 및 voila, PoseNet 이것은 내가 일하고있는 것입니다

이 예를 살펴 보겠습니다 나는 이것이 오픈 소스 프로젝트라고 말해야한다 프로세싱은 오픈 소스 프로젝트입니다 내가 말했던 것에 관여 다른 많은 비디오에서 다른 모델을 찾으면 활주로에서 당신이 일을하고 기여하고 싶어 여기에 처리 예제가 있으므로 권장합니다 Runway의 창립자이자 제작자 중 한 명인 Chris는 그리고 나는 가공에 대해 이야기하고있다 활주로 도서관

그리고 최근에 두 개의 비디오 자습서를 만들었습니다 Processing Java 라이브러리를 만드는 방법에 대해 설명합니다 앞으로 처리 될 프로젝트를 보게됩니다 활주로 도서관 그러니 그 일에 참여하고 싶다면 의견을 적어 알려주세요 그리고 아마도이를 위해 GitHub 저장소를 만들 것입니다

좋아, PoseNet 아래로 가야겠다 그리고 posenetpde 아래에서 여기를 클릭하겠습니다 붙여 넣기 만하면됩니다 하지만 한 조각 씩 갈 것입니다

그리고 이미 활주로 호스트와 활주로 포트를 볼 수 있습니다 그래서 코드에서 실수를했습니다 그래서 저는-01을 놓쳤습니다 채팅에 대해 이미 이야기하고 있습니다

그리고 여기에 여분의 1이 있습니다 그리고 이것은 정수 여야합니다 그리고 이것은 실제로 호스트입니다 사실 같은 변수를 사용하겠습니다 이름은 runwayHost 및 runwayPort입니다 좋아, 지금 당장 얻은 것 같아

이제 예제가 작동하려면 처리 OSC가 있는지 확인해야합니다 라이브러리가 설치되었습니다 여기 와서 복사하면 이 수입 명세서를 붙여 넣습니다 꼭 필요한 OSC 객체를 붙여 넣을 수 있습니다 그리고 우리는 내가 OscP5 클래스가 존재하지 않는 오류가 있습니다

프로세싱 OSC를 설치하지 않았기 때문입니다 도서관 사용하기 때문에 이미 설치했을 수 있습니다 다른 프로젝트로 그러나 나는 여기에 갈 수 있었다 Sketch, Import Library, 라이브러리, OSC를 추가하여 검색하십시오

이것은 내가 찾고있는 라이브러리입니다 oscP5 설치를 클릭하겠습니다 이제 오류 메시지가 사라지는 것을 볼 수 있습니다 다음으로하고 싶은 것은 객체를 만드는 것입니다 OSC 메시지를 수신합니다 그리고 나는 이것을 새로운 OscP5 객체로 만들 수 있다고 생각합니다

이 특정 스케치에 대한 참조를 제공해야합니다 스케치에서 이벤트를 트리거해야하기 때문에 사용 가능한 데이터가있을 때 그런 다음 포트 번호를 지정하십시오 이것을 runwayPort라고합니다 활주로 예제를 보면 실제로 OscProperties라는이 개체를 사용하고 있습니다 좀 더 정교합니다

원격 주소, 수신 포트, 데이터 그램 크기와 다른 것들 아마도 이것을 내 예제에 붙여 넣을 것입니다 그러나 그것이 더 많은 종류의 것들과 함께 작동하는지 궁금합니다 방금 말한 단순화 된 기본 OscP5 객체 이것과 특정 포트 그러나 나는 이것을 필요로한다

방송 위치가 필요합니다 왜냐하면 런웨이에게 메시지를 보내야합니다 연결되어 있거나 연결이 끊어졌습니다 여기에는 두 가지가 있습니다 프로세싱 소프트웨어가 있습니다

그리고 Runway 소프트웨어가 있습니다 둘 다 내 컴퓨터에서 로컬로 실행 중입니다 이제 다른 시나리오에서 클라우드 GPU도 포함될 수 있습니다 활주로는 메시지를주고받습니다 그리고 이것은 내가 가고있는 것입니다 다음 예제에서해야 할 일 StyleGAN이라는 이름으로 Runway가 클라우드 GPU 와도 대화하도록하겠습니다

그러나 여기서 일어나지 않습니다 PoseNet은 실제로 내부에서 실행되고 있습니다 기본적으로 Runway 자체에 로컬로 래핑됩니다 PoseNet은 여기서 Runway에서 로컬로 실행됩니다 처리 중이 connect와 같은 메시지를 보내는 중입니다

나도 정보를 듣고 싶어 그것은 일회성 메시지입니다 그런 다음 Runway는 OSC를 통해 지속적으로 데이터를 보냅니다 PoseNet으로 감지하는 포즈 처리 웹캠 입력에서 모델 그래서 내가 원한다면 아마도 방법을 알아낼 수있을 것입니다 카메라 입력을 처리로 가져 오려면 이미지를 활주로로 보내고 활주로 결과를 다시 보냅니다 하지만 런웨이는 카메라에 직접 연결할 수 있습니다 아주 간단하기 때문에 그렇게 할 수도 있습니다

그래서 여기에도 같은 것을 넣어야합니다 웹캠처럼 여기에 약간의 메모를하면 웹캠이 런웨이와 대화 중입니다 나는 또한 처리와 이야기 할 수 있습니다 처리 결과도 표시하려면 이것이이 특정 예에서 진행되고있는 것입니다 이 브로드 캐스트 위치를 만들고 싶습니다 네트 주소 개체입니다 여기에 넣어야합니다

그리고 내가하고 싶은 첫 번째 일은 연결 메시지를 보내면됩니다 복사해서 여기에 붙여넣고 연결이라고하겠습니다 처리를 시작할 때 내가하고있는 일은 connect 함수를 호출합니까? OSC 메시지를 작성합니다 모든 단일 OSC 메시지는 두 부분으로 구성됩니다 이 두 부분은 주소이며 보통 경로처럼 일종의 문자열로 표시됩니다

이것이 서버 / 연결임을 알 수 있습니다 그게 주소 야 아니면 거의 메시지처럼 생각할 수도 있습니다 내가 생각하는 방식으로 그런 다음 데이터 이 경우에는 실제로 주소 자체가 메시지이므로 데이터가 없습니다 이것은 매우 단순화 된 것입니다 이 연결 메시지가있는 곳입니다

연결 중입니다 메시지 이름, 주소, 거기에 있어야 할 유일한 것입니다 데이터가 없습니다 그러나 Runway가 데이터를 다시 보내면 데이터 또는 요점과 같은 메시지 이름을 갖습니다 또는 포즈, 그런 것

그리고 그것은 많은 양의 데이터와 함께 패키지 될 것입니다 모든 xy의 모든 위치와 같습니다 자, 이것을 실행하고 무슨 일이 일어나는지 봅시다 예, 꽤 좋습니다 오류가 없습니다

연결되었으므로 메시지를 듣고 싶습니다 그리고 그 방법은 OSC 이벤트라는 이벤트를 사용하는 것입니다 마우스 누르는 것과 비슷합니다 또는 키 누르기 또는 직렬 이벤트 또는 캡처 이벤트 이것은 매우 특별한 이름을 가진 Processing의 함수입니다 OSC 이벤트라고합니다

그리고 oscP5 라이브러리는 그 함수를 호출하는 것을 알고 있습니다 데이터가 들어올 때 붙여 넣기 만하면됩니다 그리고 여기에 넣겠습니다 그리고 제가하려고하는 것 – 이것을 보도록합시다 그것을 통과 한 OSC 이벤트가 있습니다 OSC 메시지 이 메시지를 메시지로 변경하겠습니다 메시지에 해당 데이터가 있다면 주소와 같습니다

기억? 주소에는 데이터가 있으며, 이것이 우리가 찾고있는 주소입니다 그렇지 않은 경우 여기서 나가십시오 그래서 들어오는 다른 메시지를 무시하고 싶습니다 그런 다음 내가하고 싶은 일은 데이터 자체를 얻는 것입니다 따라서 메시지의 데이터는 실제로 문자열로 제공됩니다

그러나 문자열은 JSON으로 형식이 지정됩니다 JavaScript 객체 표기법입니다 JSON이 무엇인지 모른다면 JSON이 무엇인지 설명하는 다른 비디오로 JSON은 JavaScript에서 정말 잘 작동합니다 그것으로 작업하는 것은 조금 어색합니다 처리가 Java이므로 처리 중입니다

기본적으로 JavaScript를 사용하지 않습니다 그러나 우리는 그것을 작동시킬 것입니다 메시지의 첫 번째 자체는 JSON 데이터의 큰 문자열이며 JSON입니다 Processing의 parseJSONObject로 파싱 할 수있는 객체 기능 그런 다음 콘솔에서 볼 수 있습니다

실제로 데이터를 가져 오는지 봅시다 아무것도 얻지 못했습니다 왜 그런지 궁금합니다 그리고 실제로 이유를 알고 있습니다 우선, 여기에 실마리가 있습니다

데이터 그램 소켓을 만들 수 없습니다 포트 5100은 이미 사용 중이기 때문에 그리고 나는 여기에 이상한 일이 있다는 것을 잊었다 OSC를 사용하여 둘 사이에서 통신하는 경우 별도의 컴퓨터, 같은 포트 번호를 사용할 수 있습니다 각 개별 컴퓨터에서 하나의 포트 번호 하지만 여기서 활주로에 데이터를 보낼 수 있어야합니다 특정 포트에서 처리로 데이터를 수신 같은 포트가 될 수없는 다른 포트에서 그렇지 않으면 충돌이 발생합니다 제가 방송하는 포트는 57100입니다

이것이 Runway에 나와 있습니다 하지만 메시지를 받고 싶은 실제 포트 57200입니다 그리고 Runway는 자동으로 100을 추가하는 것을 알고 있습니다 무대 뒤에서 그러나 이것은 Runway의 기본 설정입니다

데이터 수신을 위해 다른 포트가 필요합니다 내가 보내는 포트로 코드에서 의미하는 바를 보여 드리겠습니다 이것이 바로 활주로 포트 5757입니다 그것이 내가 방송하고 싶은 포트입니다

그리고 그것은 내 방송 위치의 일부입니다 그것이 내가 방송하는 곳입니다 그러나 메시지를 받고 싶은 곳은 실제로 57200입니다 이제 이것을 실행하면 실제로 메시지가 수신됩니다 하지만 새로운 오류가 있습니다

ArrayIndexOutOfBoundsException입니다 따라서 이것은 런웨이 데이터가 이 포즈를 모두 보내는 것은 실제로 상당히 큽니다 그리고 필요한 것은 더 많은 공간입니다 더 큰 패킷 크기가 필요합니다 그렇기 때문에 Runway 예제에서 이 여분의 OSC 속성이있었습니다 더 큰 데이터 그램 크기를 설정할 수있는 개체입니다

청취 포트는 57200입니다 기본적으로 OscP5를 사용하기 전에 이럴 필요는 없지만 난 복사하여 붙여 넣습니다 이걸 다시 여기에 넣고 이것을 속성으로 변경하겠습니다 저는 이제 모든 조각을 가지고 있다고 생각합니다 내가보아야 할 것은, 우리가 간다, 많은 것들

이것 좀 봐 자, 저는 확신을 가지고 정확하게 처리했습니다 점수– 왼쪽 발목이 보이지 않습니다 왼쪽 발목을 카메라로 볼 수 없기 때문입니다 그래서 그 신뢰 점수가 너무 낮은 이유입니다 위로 스크롤하고 오른쪽 귀를 좋아합시다 매우 높은 신뢰 점수와 x 및 ay를 얻었습니다

내 오른쪽 귀를 위해 이제 저는이 데이터를 실제로 사용할 수있는 시점에 있습니다 런웨이 예제로 돌아가서 여기에 매우 정교한 루프가 있음을 알 수 있습니다 JSON을 파싱하고 모든 다른 핵심 포인트에서 감지하는 모든 것의 모든 다른 위치 지금 훨씬 더 간단한 일을하려고합니다 나는 오른쪽 눈과 왼쪽 눈을 얻을 것입니다

우리가 알아낼 수 있는지 봅시다 우리가 이것에 접근 할 수있는 한 가지 방법은 이 데이터 변수를 전역 변수로 만들 수 있습니다 이 JSON 객체를 사용하겠습니다 저는 이것을 전역 변수로 만들 것입니다 데이터라고하겠습니다

그런 다음 드로우 루프에서 나는 단지 데이터가 널이 아닌 한 Java에 있다는 것을 잊었습니다 그냥 할 수있어 데이터는 Runway로부터 무언가를받을 때까지 null이됩니다 런웨이에서 무언가를 받자 마자 내가해야 할 일은이 JSON을 구문 분석하는 것입니다 조금 더 쉽게하기 위해 내가 한 일 방금 JSON을 가져 와서 인쇄합니다 프로세싱 콘솔에 그것을 JSON 파일에 붙여 넣었습니다

Visual Studio Code에서 볼 수있는 그래서 참조 할 것이 있습니다 그래서 나는 포즈라고 불리는 것을 얻어야한다는 것을 알고 있습니다 가장 먼저 원하는 것은 poses 배열입니다 프로세싱에서 정말 이상한 것 중 하나는 JSON을 사용하면 데이터가 있는지 여부를 지정해야합니다 보는 것은 JSON 객체 또는 JSON 배열입니다

그리고이 포즈 데이터는 표시된대로 배열입니다 이 대괄호로 JSONArray의 포즈가 같다고 말하겠습니다 datagetJSONArray 문자열 포즈 그런 다음 키 포인트 배열을 얻고 싶습니다

아, 둘 이상의 포즈가있을 수 있기 때문에 하지만 포즈가 하나만 있다고 가정하겠습니다 그런 다음 포즈입니다 그럼 요점은 배열이 동일한 posesget 0 이것이 배열의 첫 번째 요소입니다

이제 핵심 포인트라는 새로운 배열을 얻습니다 JSON 배열 요점을 얻습니다 좋은 소식은 런웨이 예제입니다 거기에이 모든 것이 포함되어 있습니다 제가 잘못하면 키 포인트 get element 0이라고 말할 수 없기 때문에 여기에 오류가 있습니다

요소 0은 무엇입니까? JSON 객체입니다 우리는 거기에 갈 이제 핵심 사항이 있습니다 첫 번째 JSON 객체에서 키 포인트라는 JSON 배열입니다 인덱스 0

그렇다면 무엇을 찾고 싶습니까? 이제 핵심 포인트 배열에 있습니다 이것은 요소 0입니다 내가 왼쪽을 알고 있었다면- 아, 이건 쉬워요 코, 왼쪽 눈, 오른쪽 눈을 봅시다 0, 1 및 2, 완벽합니다

그래서 JSONObject nose equals를 얻고 싶습니다 keypointsgetJSONObject 0 그리고 우리는이 중 세 가지를 할 것입니다 왼쪽 눈-나는 이것을 조금하고있다 활주로 예제와 다릅니다

그런 다음 오른쪽 눈 다음에 활주로를 예로 들어 보겠습니다 확실히, 나는 여기서 루프를 사용할 수 있습니다 코, 왼쪽 눈, 오른쪽 눈 그런 다음 입장을 취해야합니다 nosePos는 nos

getJSONObject와 같습니다 코만하면 돼 난 그냥 코를 할거야 여기서 더 간단하게 유지하십시오 외삽하여 알아낼 수 있습니다 왼쪽 눈과 오른쪽 눈을하는 방법- nosegetJSON 객체 위치 그리고 x는 이 코 위치를 호출합니다

코 위치는 x를 얻습니다 이것이 옳다는 것을 확신하십시오 그리고 y는 nosePositionget y와 같습니다 알았어, 내가 뭘 잘못 봤니? getFloat

다시 한번, 저는 Java에 있습니다 유형을 지정해야합니다 내가 모든 것을 올바르게했다면 첫 번째 포즈의 모든 요점을 얻었습니다 코에 대한 모든 데이터가있는 객체를 얻었습니다 그런 다음 해당 물체에서 코 위치를 뺀 다음 x 그리고 그 물체에서 y

휴 이제 2020 년에 타원 x라고 말하겠습니다 그리고 그것을 빨간 코로 만들어 봅시다 25500을 채 웁니다

이것을 실행시켜 봅시다 그리고 우리는 간다 나는 지금 코를 제어하고 있습니다 활주로에서 OSC 메시지 처리로 놀랄 만한

자, 이것으로이 비디오 튜토리얼을 마치겠습니다 확실히, 당신이하고 싶은 일 전체 골격을 참조하십시오 PoseNet을 효과적으로 사용하려면 카메라가 당신으로부터 약 6 피트 정도 떨어져 있기를 원합니다 백업하고 전체 양식을 볼 수 있도록 허용하려고합니다 당신은 또한 이미지를 전달하고 포즈를 취할 수 있습니다

이미지에서 할 수있는 일이 많이 있습니다 그리고 확실히, 나는 추천 할 것입니다 Runway GitHub 리포지토리의 예제를 확인하십시오 이것은 모두 통과하는 멋진 루프가 있습니다 다른 위치의

실제로이 작은 매핑도 그들 사이의 모든 연결이 무엇입니까 실제 골격 자체에 약간의 운동으로 오른쪽 눈과 왼쪽 눈을 갖기 위해 내가 한 일을 확장 할 수 있습니다 그러나 그럼에도 불구하고 Runway 예제 자체를 얻을 수 있습니다 그러나 이것은 어떻게 Runway 자체에서 찾을 수있는 특정 모델 채팅에 참여한 사람이 방금 밀도에 대해 묻고있었습니다 예를 들어 OSC를 통해 활주로에서 통신 할 수있는 자세 처리합니다 하지만 다른 많은 경우에는 웹 소켓이나 HTTP 연결을 사용하고 싶습니다 특히 작업중인 경우 의사 소통 JavaScript로 브라우저에서

다음 비디오에서하려고하는 것은 보고 싶다면 StyleGAN을 실행하여 무지개를 생성하십시오 이미지를 P5에 전달 브라우저 자체에서 렌더링합니다 그리고 대화에서 뉴스 속보, Damien SRSP는 동일한 포트에서 보내기 및 받기를 나타냅니다 기본적으로 OSC 패킷은 수신 및 전송되지 않습니다 보내거나 받아야 할 경우 동일한 포트로 같은 포트에서 어쩌면 내가 실제로 무언가를 할 수 있었을 것입니다 포트 번호와 함께

나도 몰라 나는 사람들이 의견에 그것에 대해 쓸 것이라고 확신합니다 그러나이 코드는 작동합니다 Runway GitHub 리포지토리의 코드가 작동합니다 너무 재밌어요 그걸 써

그것으로 무언가를 만드십시오 나에게 공유하십시오 프로세싱에 대한이 튜토리얼을 즐기 셨기를 바랍니다 활주로 및 로컬에서 실행되는 PoseNet 모델 컴퓨터에서 안녕

[철도 휘파람] [음악 재생]

Introduction to Runway: Machine Learning for Creators (Part 1)

[땡땡] 여보세요 새로운 튜토리얼 시리즈에 오신 것을 환영합니다 소프트웨어에 대한 코딩 트레인 활주로라고 런웨이 란? 런웨이와 땜장이 종류를 다운로드하고 설치하는 방법 주위에? 이것이이 특정 비디오에서 할 것입니다

런웨이는 내가 만든 것이 아닙니다 활주로는 회사, 새로운 회사에 의해 만들어집니다 활주로 자체 그리고 그것은 소프트웨어의 한 조각입니다 사용하고 무료로 다운로드 할 수 있습니다 무료로 사용할 수 있습니다

클라우드 GPU 크레딧이 필요한 측면이 있습니다 나중에 살펴 보겠습니다 그리고 무료 크레딧과 쿠폰 코드를 얻을 수 있습니다 이 비디오의 설명에서 찾을 수 있습니다 하지만 난 정말 당신과 이야기하고 싶어 그게 너무 흥분되어서 앞으로 사용할 계획입니다 미래의 많은 튜토리얼과 코딩 문제, 그리고 교육 내가 할 일

그리고 나는 또한 내가 회사 활주로 자체의 고문입니다 그래서 저는 그 능력에 관여하고 있습니다 괜찮아 런웨이 란? 바로 여기에는 광고 소재에 대한 머신 러닝이 있습니다 인공 지능의 힘을 가져 오십시오 직관적이고 간단한 방법으로 창의적인 프로젝트에 시각적 인 인터페이스

오늘 새로운 제작 방법을 탐색하십시오 이것이 나에게있어 활주로의 핵심입니다 저는 창의적인 코더 인 사람입니다 처리 및 P5JS 작업 중입니다 다른 소프트웨어를 사용하고있을 수 있습니다

그것은 단지 상용 소프트웨어, 코딩 환경입니다 당신은 당신의 자신의 소프트웨어를 작성하고 있습니다 그리고 당신은 최근의 진보를 활용하고 싶습니다 기계 학습에서 이 모델에 대해 읽었습니다 이 모델에 대한이 YouTube 비디오를 보았습니다

당신은 당신의 일에 그것을 사용할 수 있습니까? 글쎄, 활주로 전에 당신이 한 일 중 하나 GitHub 리포지토리로가는 길을 찾으십시오 이 매우 긴 ReadMe를 좋아했습니다 설치 및 구성해야 할 다양한 종속성 그런 다음이 파일을 다운로드하여 설치 한 다음 이 라이브러리를 빌드하십시오 그리고 당신은 정말 오랫동안 거기에 갇힐 수 있습니다 따라서 Runway는 하나의 소프트웨어로 구성됩니다 기본적으로 머신 러닝을 실행하는 인터페이스 당신을위한 모델, 설치 및 구성 다른 일을하지 않아도 Install이라는 버튼을 누릅니다

그리고 그것은 당신에게 그 모델들을 가지고 놀 수있는 인터페이스를 제공합니다 해당 모델을 실험 한 다음 브로드 캐스트 이러한 모델의 결과를 다른 소프트웨어에 적용합니다 그리고 당신은 다양한 방법이 있습니다 HTTP 요청을 통해 방송을 할 수 있습니다 OSC 메시지를 통해 그리고이 모든 것이 말이되지 않을 수도 있습니다 당신에게, 그것은 완전히 괜찮습니다 나는 그들을 통해 찌르고 당신을 보여줄 것입니다 적어도 당신을 보여주기 위해 그들이 어떻게 작동하는지 활주로와 처리 방법 Runway와 P5JS를 페어링하는 방법, 그리고 다른 많은 예제가있는 곳을 보여 드리겠습니다 다른 플랫폼으로 할 수있는 것들과 같은 것들

첫 번째 단계는 여기를 클릭하는 것입니다 런웨이 베타 다운로드에서 자동으로 다운로드를 시작합니다 Mac OS, Windows 또는 Linux 용 실제로 Runway를 이미 다운로드하여 설치했습니다 이 단계를 건너 뛰겠습니다 실제로는 이제 소프트웨어를 실행하십시오 아 이제 런웨이에 오신 것을 환영합니다

시작하려면 로그인하세요 승인 이미 계정이 있다면 당신은 당신의 계정으로 로그인 할 수 있습니다 이미 계정이 있습니다 하지만 저는 새로운 것을 만들려고합니다

과정을 따르십시오 그래서 나는 여기에 갈 것입니다 계정을 만드십시오 이메일 주소를 입력하겠습니다 daniel@thecodingtrain

com에게 아무에게도 말하지 마십시오 그런 다음 사용자 이름과 비밀번호를 만들겠습니다 매우 강력한 비밀번호를 입력 했으므로 다음을 클릭하겠습니다 다니엘 쉬프 먼은 코딩 기차 계정을 만드십시오

아 인증 코드를 제공합니다 daniel@thecodingtraincom으로 계정이 생성되었으며 시작을 클릭 할 수 있습니다 일단 다운로드하고 Runway를 설치하고 가입하면 계정으로 로그인 한 경우 이 화면이 나타납니다 런웨이를 오랫동안 사용했다면 그런 다음 열린 작업 공간을 클릭하여 여기에 올 수 있습니다

작업 공간은 수집 방법이기 때문에 당신이 다른 모델의 무리 특정 프로젝트에 작업 공간으로 사용하고 싶습니다 그러나 우리는 그 어떤 것도하지 않았습니다 제가 가장 먼저 할 일은 모델 찾아보기를 클릭하기 만하면됩니다 그래서 당신이 제안하는 첫 번째 일은 그냥 모델을 클릭하고 무엇을 참조하십시오 Runway 인터페이스 자체에서 게임을 할 수 있습니다 런웨이에서 정말 멋진 것 중 하나가 탐색 할 수있는 소프트웨어 및 인터페이스 모델을 실험하여 작동 방식을 이해하고 그것이 잘하는 것, 잘하지 않는 것, 시작하기 전에 무엇을 하는가 자신의 소프트웨어 나 프로젝트로 가져옵니다

저는이 스페이드 코코 모델을 고를 것입니다 전에 보았다 이것은 매우 합법적입니다 나는 그것을 클릭했을 때 어떤 일이 일어날 지 전혀 모른다 이제 여기에 더 많은 정보가 있습니다 모델에 대해

모델이 무엇을하는지 알 수 있습니까? 스케치와 낙서에서 사실적인 이미지를 생성합니다 모델에 대한 자세한 정보를 찾을 수 있습니다 예를 들어,이 모델을 설명하는 논문입니다 "공간적으로 적응하는 시맨틱 이미지 합성 COCO-Stuff 데이터 세트에 대한 정규화 " 누군가가 물었을 때 이것은 초보자를위한 튜토리얼이라는 것을 기억하십시오 글쎄, 당신이 초보자라는 점에서 초보자를위한 것입니다

여기 와서 놀 수 있습니다 하지만 논문을 찾으려면 아주 깊이 갈 수 있습니다 메모를 읽고 이해 이 모델에 대한 자세한 내용, 모델 작성 방법, 어떤 데이터를 훈련 받았는지 항상 당신이있을 때마다 물어 매우 중요한 질문 기계 학습 모델을 사용합니다 여기에 귀속이있는 것을 볼 수 있습니다 이것이 모델을 훈련시킨 조직입니다 이들은 논문의 저자입니다

크기가 만들어 졌을 때 CPU 및 GPU가 지원되는 경우 갤러리 아래로 갈 수도 있습니다 그리고 우리는 생성 된 일부 이미지 만 볼 수 있습니다 아이디어를 얻을 수 있습니다 이것은 무언가를 테마로 한 모델입니다

이미지 분할이라고합니다 여기에 이미지가 있습니다 이미지 세분화는 무엇을 의미합니까? 이 이미지는 여러 조각으로 나뉘어져 있습니다 다른 세그먼트의 이러한 세그먼트는 색상으로 표시됩니다

보라색 부분, 분홍색 부분이 있습니다 연한 녹색 세그먼트 그리고이 색상들은 모델의 레이블과 연결되어 있습니다 본질적으로, 그것은 일종의 일에 대해 알고 있습니다 그 영역에 그릴 수 있습니다

따라서 이미지 분할을 두 가지 방법으로 수행 할 수 있습니다 내 이미지처럼 기존 이미지를 가져올 수 있습니다 오, 나는 그것을 분류하려고합니다 여기가 내 머리입니다 여기가 내 손입니다

여기가 내 손입니다 또는 정렬별로 이미지를 생성 할 수 있습니다 빈 이미지에 그리기, 여기에 손을 넣어 말하는 여기 머리를 올려 이것이 바로 이미지 분할입니다 적어도 내가 이해하는 방식입니다 내가 지금까지 무엇을 했습니까? Runway를 다운로드했습니다

나는 모델을 찔렀습니다 그리고 방금 하나를 클릭했습니다 이제 그 모델을 사용하고 싶습니다 나는 그것을 가지고 놀고 싶다 나는 그것을보고 싶다

여기 작업 공간에 추가로갑니다 바로 여기에 있습니다 작업 공간에 추가하십시오 이제는 아직 작업 공간이 없습니다 그래서 하나를 만들어야합니다

이 작업 공간을 호출하겠습니다 코딩 기차 라이브 스트림을 말하겠습니다 그래서 저는 그렇게 할 것입니다 Create를 누르겠습니다 이제 작업 공간이 있습니다

보시다시피, 이것은 내 작업 공간입니다 이 작업 공간에 하나의 모델 만 추가했습니다 그리고 지금 당장해야 할 일을 강조하고 있습니다 입력 소스를 선택해야합니다 따라서 모든 기계 학습 모델이 다릅니다

그들 중 일부는 텍스트 입력을 기대합니다 그들 중 일부는 이미지 입력을 기대합니다 그들 중 일부는 입력을 기대할 수 있습니다 스프레드 시트에서 임의의 과학 데이터 그런 다음 모델은 입력을 받아 실행합니다

모델을 통해 출력합니다 그리고 그 출력은 숫자 일 수 있습니다 또는 이미지 일 수도 있습니다 또는 더 많은 텍스트 일 ​​수 있습니다 이제 우리는 사례별로 일종의 공간에 있습니다

그러나 이미지 분할을 올바르게 이해하면 나는 입력과 출력을 확신한다 둘 다 이미지가 될 것입니다 작은 다이어그램을 만들어 봅시다 우리는 이것을 가지고 있습니다 이 모델은 다시 무엇을 불렀습니까? 스페이드 코코 이 머신 러닝 모델이 있습니다

아마도 여기에는 신경망 아키텍처가 있습니다 어쩌면 컨볼 루션 레이어가있을 수도 있습니다 이것은 우리가 그 논문을 읽고 싶을 것입니다 자세한 내용을 알아보십시오 런웨이는 우리가 그것을 즉시 사용할 수있게 해줄 것입니다

그리고 나는 항상 추천합니다 사용 방법에 대해 자세히 알아 보려면 이에 대해 자세히 읽어보십시오 여기 내 가정은 내가 만들고 싶은 소프트웨어에 있습니다 소프트웨어의 그림 조각을 만들고 싶습니다 사용자가 이미지를 분할 할 수 있습니다 아마 당신은 내가 일종의 추첨을 할 것이라고 상상할 수 있습니다 한 가지 색입니다 다른 색의 마커를 사용할 수 있습니다

이 이미지를 무리로 채울 것입니다 다른 색상 그런 다음 모델에이를 공급할 것입니다 그리고 밖으로 이미지가 올 것이다 우리는 입력했습니다

그리고 우리는 출력했습니다 그리고 다시, 이것은 모든 모델마다 다를 것입니다 활주로에서 선택할 수 있습니다 그럼에도 불구하고 많은 규칙이 있습니다 많은 모델들이 이미지를 기대합니다 입력 및 출력 이미지로 그들 중 일부는 텍스트를 입력으로 기대하고 이미지를 출력합니다

또는 입력 및 출력 텍스트로 이미지 등등 그리고 등등 그리고 지금하고 싶은 것은 입력 소스를 선택하는 것입니다 모델의 활주로에서 세그먼트 화 된 이미지를 생성 할 것입니다

그래서 그것은 파일에서 올 수 있습니다 실제로 네트워크 연결에서 올 수 있습니다 앞으로의 비디오에 들어가서 또는 스스로 탐색 할 수 있습니다 난 그냥 세분화를 선택합니다 알아

이것은 가장 위대한 것입니다 방금 일어난 일은 이미지 분할입니다 머신 러닝 모델의 일반적인 기능입니다 활주로에 전체 드로잉 엔진이 내장되어 있으므로 이미지 세분화로 놀 수 있습니다 보시다시피, 이것은 다른 라벨의 색상입니다 많은 교통 수단 인 것 같습니다

어쩌면 내가 원하는 것은 시도하자 사람들을 그려 봅시다 [음악 재생] 비행기와 와인 글라스 비행 오버 헤드와 두 사람 승인 일은 잘되고 있니? 이제 출력을 선택하겠습니다 그리고 나는 단지 미리보기를 원합니다

권리? 미리보기는 지금 내 보내지 않아도됩니다 다른 곳에서는 사용할 필요가 없습니다 난 그냥 Runway 자체에서 놀고 싶습니다 미리보기를하겠습니다 이제 입력을 선택했습니다

세그먼트입니다 활주로 자체의 인터페이스 출력을 선택했습니다 미리보기입니다 이제 모델을 실행할 차례입니다

우리가 간다 원격으로 실행하십시오 따라서 원격 GPU가 활성화되었습니다 가입 만하면 볼 수 있습니다 Runway의 경우 원격 GPU 크레딧 10 달러 한 번만 얼마나 실행하는지 보는 것이 재미있을 것입니다 실제로 사용합니다

한 가지만 말씀 드리겠습니다 추가 크레딧을 받고 싶은데 여기로 갈 수 있습니다 이것은 내 프로필의 일종의 아이콘과 같습니다 클릭 할 수 있습니다 이제 여기로갑니다

더 많은 크레딧 받기로갑니다 그리고 이것은 나를 브라우저 페이지로 데려 갈 것입니다 그리고 더 많은 크레딧을 지불 할 수있었습니다 하지만 여기를 클릭하겠습니다 CODINGTRAIN을 말하여 크레딧을 사용하겠습니다

바로 여기에 따라서 10 달러의 크레딧을 추가로 받으려면 당신은 이것을 할 수 있습니다 그리고 우리는 지금 20 달러의 크레딧이 있어야한다는 것을 알 수 있습니다 여기이 아이콘이 표시되어 있습니다 여기이 아이콘은 작업 공간입니다

그 중 하나의 모델로 하나만 가지고 있습니다 원격 GPU에 연결되어 있습니다 다른 모델을보고 싶다면 이 아이콘으로갑니다 괜찮아 이제 원격 실행을 누르겠습니다

[드럼 롤] 모델을 원격으로 실행 우와! [TA-DA] 어머 아 너무 예뻐요 무아 믿을 수 없어 이것이 바로 스페이드 코코 머신 러닝입니다 모델 생성

여기서 결과를 보는 것은 정말 흥미 롭습니다 그래서 당신은 생각할 수, 아무것도 몰라 이 모델에 대해, 작동 방식과 기대하는 것, 당신은 그것으로 꽤 이상한 결과를 얻을 수 있습니다 아마도 내가 좀 더 사려 깊다면 아마도 전체 공간을 가득 채우고 아마 너무 많이 비워두고 또한 두 사람과 함께 거대한 와인 잔을 포함 시켰습니다 좀 소름 끼치 네요 비록 이런 종류의 저와 비슷하다고 생각합니다 이상한 방식으로 그리고 우리는 여기서 볼 수 있습니다

이것 좀봐 $ 005 제가 언급해야 할 것은 이유입니다 왜 오랜 시간이 걸 렸어요 서버와 실제로 시작할 모든 것 모델을 실행합니다 하지만 이제 실시간으로 실행되므로 훨씬 빨리 일어날 수 있습니다 작성해 봅시다

그렇다면 그것을 채우는 것이 좋은 것입니까? 바닥재를 사용해 봅시다 나무 바닥으로 채우도록하겠습니다 오 우와 그런 다음 과일을 넣으십시오 아 이것은 지금 훨씬 나아 보입니다 옆에 오렌지를 넣자

오렌지 몇 개를 넣고 작은 과일 그릇을 만들어 봅시다 와우 이건 미친 짓이야 와우 나는 멈춰야했다 꽤 놀랍습니다

다시 한 번, 여기 잠시 후 방법에 대해 조금 더 생각하는 이 모델은 실제로 작동합니다 그리고 잘 알려진 데이터 세트를 살펴보면 코코 이미지 데이터 세트가 아마 나에게 더 많은 정보를 줄거야 그것이 잘 될 일에 대해 생각합니다 그러나 당신은 그것이 어떻게 볼 수 있는지 볼 수 있습니다 여기 나무 배경에 과일의 작은 더미 거의 천처럼 보입니다

마치 테이블 위에 앉아있는 것처럼 말입니다 매우 현실적입니다 그리고 그렇습니다 찰리 잉글랜드는 지적합니다 이것은 GPU 크레딧을 계속 사용하고 있습니다

그래도 여전히 볼 수 있습니다 라이브 페인팅을 많이해도 방금 $ 010을 사용했습니다 무료 $ 10로 많은 것을 할 수 있습니다 그냥 놀면서

현명하게 입력하면, 여기에서 분할을 선택했습니다 그러나 파일을 사용할 수도 있습니다 컴퓨터에서 파일을 열려면 나는 그렇게 할 수 있었다 그런 다음 내보내기로 변경하면 출력 나는 또한 실제로 그것을 내보낼 수 있습니다 다양한 형식으로 하지만 물론 여기서도 바로 미리보기에서이 다운로드 저장 버튼을 클릭 할 수 있습니다

이제이 특정 이미지를 영원히 더 많이 저장하고 있습니다 파일로 자, 여기서 실제로 중요한 것은 여기서 더 중요한 것은 네트워크 아래입니다 네트워크에서 여기를 클릭하고 싶었다면 이것은 이제이 특정 기계와 통신 할 수 있다는 것을 의미합니다 내 소프트웨어에서 학습 모델 내가 다운로드했거나 구매 한 소프트웨어인지 여부 다른 사람이 말한 것을 이러한 특정 프로토콜 중 하나 또는 내가 쓰고있는 자체 소프트웨어 거의 모든 프로그래밍 언어 또는 환경 프레임 워크, 모듈 또는 라이브러리가있는 경우 또는 이러한 유형의 프로토콜을 지원하십시오 여기 JavaScript의 좋은 점 중 하나는 JavaScript를 클릭하면 실제로 여기에 약간의 코드가 있음을 알 수 있습니다

실제로 자바 스크립트에 복사 / 붙여 넣기 만하면됩니다 직접 다시 올게요 OSC는 또한 매우 인기있는 메시징 네트워크 프로토콜입니다 창조적 인 코더를 위해 Open Sound Control의 약자이며 응용 프로그램간에 데이터를 보내야합니다

별도의 동영상으로 다시 돌아오겠습니다 이 중 일부가 어떻게 작동하는지 보여줍니다 또한 귀하의 Runway 소프트웨어에 대해서도 언급해야합니다 자체는 소프트웨어와 매우 유사한 방식으로 작동합니다 익숙한 Wekinator라고합니다 Wekinator는 Rebecca Fiebrink가 만든 소프트웨어입니다 몇 년 전에 OSC 메시징을 통해 데이터가 전송되는 신경망 그리고 사실 후에 그 결과를 얻습니다 비록 여기서 중요한 차이점은 런웨이라고 생각합니다

정말 큰 보물을 지원하도록 설정되어 있습니다 사전 훈련 된 모델 Wekinator는 신경망 교육에 더 많은 반면 작은 비트의 데이터로 즉석에서 런웨이가 계획하고있는 것 중 하나는 아마 9 월에 나올 것입니다 자신의 모델을 훈련시키는 기능도 있습니다 이번 런웨이 소개를 시청 해 주셔서 감사합니다 다운로드 및 설치의 기본 사항 소프트웨어, 높은 수준의 관점에서 볼 때 인터페이스 작업의 특징, 무료 클라우드를 얻는 방법 크레딧 그리고 내가 당신에게 제안하는 것은 이 비디오가 다운로드 된 후 소프트웨어를 실행 한 후 이 모델 찾아보기 페이지로 이동하십시오

보시다시피, 다양한 모델이 있습니다 모션, 생성, 커뮤니티, 텍스트, 인식 여기를 클릭하십시오 이 인식을 시도해 봅시다 얼굴 인식 조밀 한 캡

여기 PoseNet은 어디에 있습니까? 동작이 어려울 수 있습니까? DensePose PoseNet 여기 PoseNet이라는 모델이 있습니다 한 명 이상의 사람에 대한 실시간 골격 추적을 수행합니다 이 모델을 다른 라이브러리에서 다루었습니다 TensorFlow JS가있는 ML5 JS 라이브러리와 같습니다

다음 비디오에서하려고하는 것은 내 웹캠으로 Runway에서이 모델 PoseNet을 사용하고 있습니까? 이 컴퓨터에서 로컬로 실행 클라우드 크레딧을 요구하지 않고 이 모델의 결과를 [? 처리?] 자체 전체 워크 플로우를 보여 드리겠습니다 그러나 찌르십시오 주위를 클릭하십시오 원하는 모델을 찾으십시오

의견에 대해 알려주십시오 당신이 만든 이미지를 공유하십시오 그리고 난 당신이 활주로로 무엇을보고 기대합니다 큰 시청 해 주셔서 감사합니다

[음악 재생]

Introduction to Machine Learning | What is Machine Learning | Intellipaat

온라인 쇼핑을 한 적이 있습니까? 예를 들어 Amazon에서 휴대 전화를 찾고 있다고 가정 해 보겠습니다 이제 사이트에서 동일한 가격의 휴대 전화를 권장한다는 사실을 알았을 것입니다

범위 또는 동일한 상표에 의해 이제 제품을 구입하지 않고 사이트를 떠난다면 광고를 추천받을 수 있습니다 방문하는 거의 모든 웹 사이트에서 동일한 제품을 구매하게됩니다 그래서, 어떻게 이런 일이 실제로 일어나고 있습니까? 글쎄,이 모든 것은 기계 학습 때문에 가능합니다 이제 매일 매일 사용되는 기계 학습의 실제 응용 프로그램이 수천 가지가 있습니다

고의로 또는 우연히 기초 혼란스러워! 자, 몇 가지 예제를 살펴 보겠습니다 그래서 여러분 모두는 Gmail 계정을 갖게됩니다 이제 Gmail에서 전자 메일을 다음과 같은 여러 폴더로 구분할 수 있다고 생각하십니까? 기본, 프로모션, 소셜, 스팸 등 또는 당신이 소파에 앉아서 넷플 릭스를 행복하게 둘러보고 있다고 가정 해 봅시다

따라서 과거의 시청 기록과 매우 유사한 영화 추천 목록을 얻을 수 있습니다 그럼 궁금하신 적 있나요? 어떻게 가능합니까? 기계가 귀하의 관심과 비슷한 영화를 개인적으로 제안한다는 것을 알고 있습니까? 운전 중에도 Google지도는 어떤 경로의 교통량이 더 많습니까? 어느 경로가 더 빨라질 수 있습니까? 그리고 얼마나 오래 걸릴까요? 목적지에 도달하려면, 그 길에서 계속한다면? 그렇다면 Google지도는 어떻게 생각하십니까? 이 모든 것들이 기계 학습의 응용 프로그램 일뿐입니다 그러나이 모든 후, 여기서 제기되는 문제는 정확히 기계 학습이란 무엇입니까? 로봇 만이 아닙니다 기계 학습은 주로 기계에 중점을 둔 인공 지능의 하위 분야입니다 그들의 경험을 통해 배우십시오 제가 당신에게 비유로 이것을 설명하겠습니다

따라서 처음에 아무것도 모르는 신생아를 생각해보십시오 그래서 그는 배움을 위해 학교에갑니다 이제 선생님은 알파벳으로 시작합니다 선생님은 편지에 A 편지를 보여줍니다 아이가 그에게 A

라고 말합니다 그는 학생이 모든 것을 배울 때까지 반복적으로 과정을 반복합니다 알파벳들 그래서 여기에서, 학생은 훈련 받고 있습니다 일단 훈련이 끝나면

교사는 학생이 얼마나 잘 배웠는지 확인하기 위해 시험을 실시합니다 이제 우리는 기계와 동일한 비유를 할 것입니다 그래서 처음에 우리는 절대적으로 아무것도 모르는 기계를 가지고 있습니다 그래서 우리는 비슷한 방식으로 기계를 훈련하기 시작합니다 그래서 기계는 A가 무엇인지 또는 B가 무엇인지 전혀 알지 못합니다

그래서 우리는 우리 기계에 문자 A의 다양한 그림을 보여주고 그것을 가르치기 시작합니다 A 훈련이 완료되면, 우리는 다른 글꼴과 스타일의 문자 A를 보여줌으로써 기계를 테스트합니다 그리고 기계가 정확하게 문자를 식별 할 수 있다면 기계는 잘 훈련되었다 그렇지 않다면 효율성을 높이기 위해 더 많은 이미지가있는 기계를 훈련해야합니다 A와 다른 글꼴 및 스타일을 다시 테스트하고 그 정확성을 확인하십시오

우리가 더 많은 훈련을할수록 우리 기계가 더 정확해질 것입니다 이것이 기계 학습의 개념입니다 이제 기계 학습을 크게 분류 할 수 있습니다 세 가지 범주로 나뉩니다 따라서 감독 학습, 감독되지 않은 학습 및 강화 학습이 있습니다

그래서 교수 학습에 관해서, 우리는 분류 된 데이터를 사용하여 기계를 가르칩니다 하자 우리는 과일 바구니를 가지고 있고 각 과일에는 라벨이 붙어 있다고합니다 이제 기계는이 라벨 데이터에 대해 교육을 받았습니다 따라서 일단 교육이 완료되면 테스트 데이터가 제공됩니다이 데이터는 훈련이 완료되었습니다

이제 교육 데이터에 연관된 레이블이없는 또 다른 사례를 살펴 보겠습니다 그것 여기서 기계는 유사한 데이터를 식별하기 위해 데이터의 기본 구조를 이해합니다 패턴 그리고 본질적으로 유사한 데이터는 함께 그룹화됩니다

그래서 여기서 기계는 모든 사과가 본질적으로 유사하다는 것을 이해합니다 함께 그룹화 바나나와 망고도 마찬가지입니다 따라서 이러한 유형의 기계 학습은 감독되지 않은 학습이라고합니다 마지막으로 우리는 알고리즘이 시스템을 통해 학습하는 곳에서 학습 학습을 강화합니다

보상과 처벌 Apple의 이미지를 컴퓨터에 입력하면 사과로 표시한다고 가정 해 봅시다 그것은 보상받을 것이다 그러나 사과를 파인애플이라고 표시하면 부정적인 포인트가 부여됩니다 보상 점이 점점 더 커지면서 탐구를 통해 수천 가지의 결정을 내릴 수 있습니다

그리고 이것은 기계가 훈련되는 방법입니다 그래서 이것은 기계 학습에 대한 간략한 소개였습니다 검색어가 있으면 채팅 섹션에 댓글을 달아주세요 도와 드리겠습니다 너나가

또한 인증 과정을 끝내는 데 관심이있는 경우 Intellipaat 포괄적으로 IBM과 연계하여 데이터 과학 석사 점수를 제공합니다 데이터 과학, 기계 학습, 심층 학습 및 빅 데이터에 대해 배웁니다 그래서 우리는 분석적인 R, SAS 및 Python과 같은 도구 tensorflow 및 keras와 같은 심화 학습 프레임 워크 하둡 (Hadoop), 스파크 (Spark), 몽고 (Mongo) DB와 같은 거대한 데이터 도구를 제공합니다

따라서 지금은 데이터 과학 분야에서 시작하는 것이 당연합니다

Linear Regression – Introduction to Machine Learning using Python and Scikit Learn Chapter 6 1

안녕하세요 모두 컴퓨터 소개 동영상 시리즈에 오신 것을 환영합니다

scikit을 사용하여 학습 – 이것이 6 장, 특히이 장을 배우십시오 우리는 첫 번째 기계 학습 알고리즘에 대해 이야기 할 것입니다 이 장에서 선형 회귀는 선형이 무엇인지를 이해할뿐만 아니라 회귀뿐만 아니라 기계 학습을 어떻게 호출 할 수 있는지도 이해합니다 scikit-learn에서 제공하는 기능 선형 회귀뿐만 아니라 다른 알고리즘을 사용해도 괜찮습니다 앞서서 선형 회귀는 감독 된 학습 방법이다

학습 사전 데이터에 기초하여 회귀 값을 예측하는 단계와, 선형 관계이므로 우리가 이해할 수있는이 정의에 대해 걱정하지 마십시오 이제 우리는 어떤 기계 학습 알고리즘으로 작업하기 위해 데이터가 필요합니다 밖에서 사용할 수있는 많은 데이터가 있지만이 경우에는 나는 단지 5 ~ 6 점으로 우리 자신의 데이터를 생성하기로 결정했다 선형 관계가 실제로 어떻게 나타나는지 실제로 이해하고 볼 수 있습니다 이러한 데이터 포인트와 내 기계 학습 모델이 이러한 데이터를 어떻게 처리하는지 그래서 나는이 데이터 세트를 학습을 위해 적어도 초기 학습은 데이터 세트가이 데이터 세트처럼 보이는 방식입니다

농산물에 대한 가격과 다른 위치에서의 가격 이 데이터 세트는 농부가 생산하는 농산물에 관한 것입니다 그것이 판매되는 곳과 그것이있는 곳의 거리 예를 들어 지역 농원 시장 인 농가에서 판매되는 4 대 농부들의 마일리지는 마을에서 10 달러에 살 수있는 것과 같은 것을 놓습니다 농장에서 12 마일 떨어진 곳에 있습니다 당신은 똑같은 물건을 28 달러에 살 수 있습니다 당신이 50을 위해 같은 것을 살 수있는 25 마일 인 소유주 마을 4 달러 농장에서 50 마일 떨어진 도시에서 살 수 있습니다

84 달러를위한 것 및 가동 불능 시간에서 60 마일 인 가동 불능 시간 너는 90 달러에 같은 물건을 살 수있다 우리는이 데이터를 가지고있다 우리의 x 축과 y 축 값을 만들어 보자 그 X는 마일 단위로 거리가 될 것이고 Y는 가격이 될 것입니다 내가 왜 numpy를 가져오고 있는지 묻고 있을지도 모릅니다

numpy는 어떤 것의 중추입니다 만약 당신이 있다면 기계 학습과 데이터 과학 파이썬 프로그래밍 언어 번호가 마음에 들지 않습니다 앞으로 나아가보고 싶을 것입니다 내 비디오 chapter 41 위의 숫자는 ok입니다

이제는 numpy 배열로 처리하고 있습니다 x 거리 및 Y 가격 확인 및 여기에 어떻게 지금처럼 보이는 나는 우리가 만든 배열은 수평 배열이지만, 내가 말한 것을 기억한다 이전 장에서는 기계 학습에서 특히 scikit-learn 또는 기계 학습을하는 데 중요합니다 알고리즘은 데이터의 수평 세트가 아닌 1 차원 데이터를 나타냅니다 열 벡터 인 세로 형 데이터 집합이므로이 값을 변경해야합니다

행 벡터를 열 벡터로 변환 이제 내 번호를 기억하고있을 것입니다 너는 우리가 재 형성 함수를 호출 할 수 있도록 내가 너에게 5와 1을 열이 데이터를 얻지 만 알려주지 한 가지는 원래 데이터를 변경하거나 변경 데이터를 작성한 것입니다 수평 거리를 다시 인쇄하면 다시 볼 수 있습니다 그래도 가로 데이터는 괜찮아요

그래서 우리는 numpy의 실제 치수를 바꿉니다 배열을 사용하여 파일 1로 직접 모양을 변경할 수 있으며이 경우 데이터는 열 벡터로 변경 이것은 numpy 배열 0의 속임수 중 하나입니다 새로운 번호를 만들지 않고 치수가 여기에있는 y와 똑같은 것에 존재한다 이제는 가격입니다이 x와 y를 사용하여 어떻게 보이는지 볼 수 있습니다

matplotlib 다시 수학 장에 익숙하지 않은 경우 42 장으로 돌아갑니다 도약하지 마라 나는 여기에 그렇게하지 않을 것이다 나는 이것이 단지 당신이 볼 수있는 방법 일 뿐이다

농부 자리에서 마일 떨어진 거리이며 이것은 지금 위치에서 가격입니다 먼저 scikit-learn에서 선형 회귀 메커니즘을 사용합니다 그런 다음 선형 회귀를 사용하는 방법을 디코드합니다 우리는 선형 모델로부터 선형 회귀 (linear regression)를 가져와야합니다 선형 회귀 알고리즘이 어떻게 수행되는지 이해하려면 매트릭스에서 미니 제곱 오류라는 것을 가져 오십시오 걱정하지 마십시오

나는이 두 가지에 대해 너희에게 각각과 모든 것을 말할 것이다 이제는 매우 중요한 한 가지 통합 된 기계 학습 인터페이스 scikit-scikit-learn에 관해 가장 좋은 것을 배웁니다 거의 모든 기계 학습을위한 통일 ​​된 인터페이스를 제공한다는 것입니다 알고리즘은 선형 회귀뿐만 아니라 내 기계로 당신을 배우기도합니다 3 줄의 코드를 호출하여 코드 세 줄을 작성해야합니다

통가의 인스턴스는 당신이 해제 된 함수를 반환합니다 이것은 함수입니다 어디에서 훈련이 일어 났는지 예측하고 싶을 때 예측을 부릅니다 선형 회귀를위한 함수입니다 같은 것을 부릅니다 KN을 위해 n 나중에 비디오에서 볼 수있는 것과 동일한 것을 호출 할 것입니다

우리 모두는 scikit-learn으로 할 것이므로 선형을 어떻게 사용할 수 있는지 보도록하겠습니다 회귀 나는 물론 선형 회귀의 인스턴스를 만듭니다 다양한 매개 변수를 제공 할 수 있지만이 특별한 경우에는 기본값은 선형 회귀의 인스턴스를 만들 정도로 좋아요 선형 회귀 함수를 호출하는 방법은 다음과 같습니다 교육이 실제로 완료되었습니다

이제 기계 학습 모델을 사용하여 가치를 예측하기 위해 똑같은 일을해야합니다 45 마일은 이제 내 목록에 45가 없다는 것을 기억한다 나는 52 살이지만 그렇지 않다 45 그러나 나는 같은 가격이면 첫 번째 가격은 무엇인지 알고 싶다 이제 우리는 이것을 41 마일에서 다시 팔고 있습니다

열 벡터가 동일한 통합 함수를 전달하고 그것이 말하는 예측을 봅니다 그 $ 73 $ 026는 지금 45 마일에 가격 일 것이다 원래 지점에 대해 플로팅하여 예측을 보도록하겠습니다 앞서와 음모 당신이 볼 수있는 45 마일에서 나는 그것을 위해 73 달러와 이 특정 그래프의 모양이 괜찮아 보입니다 좋아,이게 옳은 가격 인 것 같아

그 특정 지점은 이제 여러 값을 예측할 수도 있습니다 값을 학습 값보다 훨씬 더 많이 사용하며 열 벡터를 만듭니다 그것에서 나가고 신용 함수에있는이 란 벡터를 통과하고 나는 얻을 것이다 10 번째 마일에서의 모든 것의 예측 제 80 회 24 번째 입술 122 회 100 회 입술 149 등등을 볼 수 있습니다 나는 훈련 데이터가 여전히 60 마일이나 무엇인지 보자 마지막 훈련 데이터는 현재 60 마일이지만 100 마일을 요구하고 있습니다

마치 단순한 선형 관계를 제공하는 것처럼 보입니다 선형 회귀 분석이 선형 회귀 분석을 통해 무엇을 찾는 지 이해합니다 가장 잘 맞는 선은 일반적으로 직선을 설정하는 훈련 데이터를위한 직선 특히 2 점 만 있으면 괜찮아요 지금 가장 적합한 것이 무엇입니까? 최상의 적합은 최소 평균 제곱 오차를 갖는 라인으로 정의된다 우리는 미니 평방 오차를 가져 왔고 이것이 우리가 가지고있는 이유입니다 우리는 성능이 무엇인지 확인하기 위해 평균 제곱 오차를 가져 왔습니다

우리의 선형 회귀 분석에 대해 더 자세히 설명하기 전에 지금 시간을 대입 할 것입니다 선형 회귀가 그러한 것을 표시하지 않는다는 것을 말해 줄 게요 하지만 당신은 훈련 데이터에서 배웁니다 즉, 제가 훈련을하면 10 분의 1 마일 가격이 12 달러라고 말하는 데이터와 10 마일에 가격을 예측하면 그렇지 않을 수도 있기 때문에 $ 12 일 수도 있고 그렇지 않을 수도 있습니다 훈련 자료를 기억하지 못한다

훈련 자료는 10 분의 1이다 최악의 날짜 나는이 대답을 계속 지었다 원래의 교육 포인트를 제공하든 새로운 포인트를 사용하든 모델이 예측치에 직면하여 훈련 데이터 값을 기억하지 못합니다 왜 네가 사각형이 필요하기 때문에 내가 이것을 말하고 있는지 이해하는 것이 매우 중요하다 오류가 무엇인지 알 때만 오류를 계산할 수 있습니다

우리는 우리가 알고있는 평균 제곱 오차에 대한 예측과 비교할 수 있습니다 이미 훈련 데이터를 가지고 있으며 우리는 예측 데이터를 가지고 있거나 예측할 수 있습니다 교육용 수에서 얻은 데이터는 동일하게 처리하고 차이점을 비교합니다 이제이 둘 사이에서 원래의 데이터 요소를 예측해 봅시다 내 예측이 어떻게 생겼는지, 내가 원래대로 당신이 볼 수있는 데이터 포인트는 각각의 원래 데이터가이 두 포인트를 가리킨다는 것을 나타냅니다

상대적으로 가깝습니다 조금 멀었습니다 이것은 조금 더 의미가 있습니다 원래 값과 해당 값에 의해 예측 된 값 간의 오차 연령 차이 모델과 제곱의 제곱은 네거티브가 있으면 긍정적 인 가치 그래서 미니 평방 오류를 계산하자 미니 평방 오류 수 있습니다 원래 값과 예측 값을 전달하여 계산하면 26에서의 평균 제곱 오차는 지금이 26에 대한 최상의 평균 제곱 오차이다 선형 회귀를 사용하여 설정 한 특정 값이므로 선형 일 경우 자신 만의 회귀 분석을 통해 얻을 수있는 최상의 미니 스퀘어 오차 이제 26 일입니다

다음 비디오에서 나는이 특정 비디오에서 여기서 멈추게 될 것입니다 선형 회귀 분석의 수학과 그 원리에 대해 다룰 것입니다 그 비디오를 확인하는 것을 잊지 마십시오 이러한 데이터 세트는 내 github 페이지에서 이러한 것들을 업로드 할 것입니다 이 데이터는 일부 순열과 조합을 통해 어떻게 작동하는지 이해합니다

일단 그것이 어떻게 작동하는지 이해하면 우리 자신의 선형 세트를 쉽게 수행 할 수 있습니다 회귀는 실제로 심령술사에 의해 수행되고있는 것을 발견하게합니다 현장 괜찮아요 그래서이 비디오에 대한 모든 것이 제발 제발 다음 비디오에서 몇 가지 것을 시도해보십시오 선형 회귀 알고리즘 뒤에 수학 괜찮아 그리고 우리는 우리의 그때까지 다음 비디오에서 회귀가되는 자신의 구현 시청 해 주셔서 감사합니다

잠시 시간을내어 공유하고 구독하고 싶습니다 고마워요, 고마워

Introduction to Tensorflow & Keras for Deep Learning with Python (3.2)

안녕하세요, Jeff Heaton입니다 Deep Neural Networks의 애플리케이션에 오신 것을 환영합니다

워싱턴 대학 이 동영상에서는에 대한 소개가 있습니다 TensorFlow와 Keras를 살펴보고 TensorFlow를 사용하는 방법을 살펴 보겠습니다 수학적 계산을 직접 수행하고 Keras가 낮은 수준의 TensorFlow 컴퓨팅 엔진 위에있는 신경 네트워크 계층 를 위해 AI 과정 및 프로젝트에 관한 최신 소식은 SUBSCRIBE와 BELL 옆에 있습니다

모든 새 비디오에 대한 알림을받을 수 있습니다 TensorFlow와 Keras는 TensorFlow가 CPU, GPU 및 그리드에 대한 액세스를 제공하는 저수준 수학 라이브러리 컴퓨팅 기능과 Keras는 당신에게 높은 수준의 추상화 기능을 제공합니다 이러한 수학적 구성을 신경망으로 생각하십시오 나는 너에게 약간 연결을 준다 여기서 TensorFlow를 다루는데 유용한 다양한 위치를 가리킨다 Keras

가장 먼저해야 할 일 중 하나는 TensorFlow와 Google의 다른 버전이 많이 있습니다 (또는 경우에 따라 변경 될 수 있음) 매우 똑똑한 사람들이 많이 일하고 있습니다 TensorFlow는 API가 있어야하며 API가 무엇인지에 대해 매우 잘 알고 있습니다 서로 다른 파벌이 승리하고 각각의 전투를 잃고 파산합니다 변경 사항은 API에 발생합니다

새로운 변화는 새로운 버전이 기본적으로 이전 버전 용으로 작성된 이전 코드가 작동하지 않습니다 그들 사물의 이름을 바꾸십시오 그들은 사물의 자본화를 바꿉니다 많은 조금은 때로는 많이, 조금 성가신 것, 때로는 큰 구조로 변경 사항이 있으므로 TensionFlow 버전을 실행하는 것이 중요합니다 이 클래스에 대해 지정됩니다

이 비디오는 TensorFlow 20으로 녹음되었습니다 이 비디오가 녹화되면서 개발 단계에있었습니다 하지만 네가 가진만큼 버전은 20 이상입니다

강의 비디오를 업데이트 할 예정입니다 다른 부품, 결과로 무언가가 깨지는 경우 최신 TensorFlow 그래서 당신은 이것을 간단히 실행할 수 있으며 버전을 보여줍니다 네가 가진 것이 네 이제 TensorFlow를 설치하면, 저는 Windows에서 TensorFlow를 설치하는 방법에 대한 전체 비디오를 가지고 있습니다

Mac 용 또 다른 비디오 TensorFlow를 CPU와 함께 설치하면 문제가 해결됩니다 정말 좋은 성능을 GPU와 GPU를 사용해야합니다 GPU의 종류 실행될 과제 및 예제 중 일부 클래스에서 GPU가 필요하고 CPU에서 실행되지만 느려질 것입니다

GPU는 세계에서 가장 쉬운 것이 아닙니다 아마 비디오를 보겠습니다 대부분 개인적으로 GPU를 클라우드에서 깊게 학습합니다 내가 갖고 있지 않은 곳 모든 하드웨어 드라이버 및 기타 사항을 설치하지만 확실히 가능할 수 있습니다 끝난

이 수업에서 특히 과제 및 파트에 대해 권장하는 것은 무엇입니까? 이 수업에서 GPU가 필요한 것은 Google CoLab입니다 Google CoLab은 클라우드 기반의 Python이나 다른 어떤 것도 설치할 필요가 없습니다 완전히 온다 갈 준비 첫 번째 모듈에서 사용 방법에 관한 동영상이 있습니다

이 수업과 함께 Google CoLab을 살펴보고 첫 번째 주제에서 학급회의 그래서 이것은 아마도 실제로는 권장되는 방법 일 것입니다 모든 예제를 실행하고 과제를 완료하려면 Google CoLab을 사용하십시오 12 기가비트의 RAM이 있다고 믿는 듀얼 코어의 강력한 인스턴스입니다 및 GPU

너는 그걸 이길 수 없어 그게 내 추천 경로 야 이 수업을 듣기 위해 TensorFlow를 선택한 이유는 무엇입니까? TensorFlow는 Google에서 지원하며 Google Google에서 우수한 지원을 제공합니다 클라우드에는 훌륭한 CPU가 있습니다 CPU 및 GPU 지원은 파이썬에서 제공됩니다 파이썬 매우 빠른 속도로 일종의 상위 레벨이되었습니다 기계 학습 및 인공 지능을위한 언어 파이썬을 배우면서 잘 돌아 왔습니다 Keras 및 Python을 통한 심화 학습 학습 이제 너

TensorFlow를 직접 사용할 수 있으며 사용자 정의 유형을 작성하는 경우 기계 학습 모델, 그 길을 갈 수도 있지만,하지만 크게 방법 이 방법을 사용하려면 Keras를 통해 깊이있게 만듭니다 꽤 쉽게 배우기 쉽고 실제로 많이 배우지는 않습니다 단점이라면, 당신이 진정으로 기본 뉴런 네트워크의 계산, 그리고 나서 당신은 TensorFlow와 다른 깊은 학습 도구가 있습니다 여기에 나열되어 있습니다 특히 Java DeepLearning에 관심이 있다면 4J는 분명합니다

하나는 H2O로, TensorFlow는 적어도 이전 버전에서는 매우 그래프 지향적이어서 나중에 계산할 수 있습니다 큰 일은 TensorFlow 20은 당신의 실행으로 많은 변화를 일으켰습니다 많은 TensorFlow를 사용하기 전에 걱정하지 않으셔도됩니다

완전히 바뀌었다 어쨌든 이렇게, 이것은 당신을 위해 준비가 될 것입니다 최신 버전이며 Tensor Board를 통해 시각화에 도움이됩니다 당신이 만드는 신경 네트워크 우리는 어떻게 사용하는지 살펴볼 것입니다

TensorFlow를 직접 사용하면이 작업을 진행할 것입니다 이 비디오 나머지 동영상은 Keras에 완전히 포함될 것입니다 할 일은 만델 브로 트 음모라고하는 무언가를하는 것입니다 여기에서 볼 수 있습니다

만약 Mandelbrot 's와 함께 일해 본적이 있습니다 본질적으로 당신이 가지고있는 그 고전적인보고 음모 이 세트는 방정식, 매우 간단한 방정식으로 줌을 계속할 수 있습니다 이 영역은 거의 무한합니다 그리고 당신이 여기서 확대 할 수있는 아주 멋진 종류의 토지 탈출

기본적으로 Mandelbrot 플롯을 작성하는 코드를 작성했습니다 그것은 매우 간단합니다 그것이 만델 브로를 생산하는 코드입니다 기능 프랙탈 디스플레이 프랙탈 그것이 실제로 끝난 후에 실제로 사용됩니다

렌더링, TensorFlow에서 실제로하는 일은 우리가 본질적으로 정의하는 것입니다 복잡한 숫자 인 것처럼 복잡한 비행기이기 때문에 전체 비행기를 가로 지르는 만델 브로트 그리고 저는이 사실을 실제 상황에 적용하지 않을 것입니다 수학 및 만델 브로트 (Mandelbrot)에 관한 내용이 있지만 여기에는 많은 자습서가 있습니다 그리고 우리는 본질적으로이 전체 비행기 전체를 ​​훑어 보며, 우리는 200 그것의 iterations 그래서 그것이 그려진 때마다 200 회 그려집니다 약간 그려집니다

조금 낫지 만 반복되는 과정이므로 매번 이것은 Tensor로 보내집니다 처리를 위해 FPU를 GPU와 네가 원한다면 너무 빨라 정말 네가 필요 없어 이를 위해 실제 GPU가 필요하지 않습니다 CPU만으로도이 작업을 수행 할 수 있습니다 본질적으로 방정식은 실제로 계산되는 방정식입니다

만델 브로트 (Monelbrot)를 음모를 꾸미십시오 끝까지 진행하면서 이걸 실행하면 볼 수 있습니다 실제로는 매우 빨리 진행됩니다 이제 좀 더 정확하게 보도록하겠습니다 여기서도 TensorFlow를 직접 사용하여 여기에 두 개의 행렬을 만듭니다

그래서, 이것들은 실제로 벡터입니다 여러분은 이것을 행 행렬이라고 부를 것입니다 이것은 행렬입니다 왜냐하면이 행렬은 두 개, 두 개의 값 그것들은 서로 겹쳐서 행렬 곱셈을 할 것입니다 행렬 1에 의한 행렬 2 그리고 우리는 그것을 출력하고 여기서 결과를 볼 수 있습니다

행렬이 곱해지고 결과가 12가됩니다 당신이 주위에 텐서 장식을 느끼지 않도록 그것을 float로 바꾸십시오 그것들은 두 개의 상수였습니다 그래서 그것은 일정한 상수였습니다 당신을 말할 수있다 이것은 모두 매우 선형 대수학입니다

이제 우리는 두 가지 변수를 수행하고 있습니다 빼기, 상수로부터 변수를 뺀다 그리고 우리는 기본적으로 -2 음수, 1 행 행렬을 얻는 것을 볼 수 있습니다 Ee는 이제 X를 재 할당 할 수 있습니다 X가 변수이므로 재 할당하면 우리는 기본적으로 그 계산을 다시 계산하여 다른 가치

이것이 바로 함수입니다 이것은 빌딩 블록입니다 신경 네트워크가 구축되고 TensorFlow Keras를 사용하면 우리가 전에 가지고 있었던 것처럼 신경 네트워크의 층에 대해 생각하면 우리는 갤런 당 데이터 세트 인 클래식 데이터 세트를 사용할 것입니다 이것은 우리에게, 그 데이터 세트는 우리에게 다양한 자동차에 대한 통계 또는 계산을 제공하고 갤런 당 마일이 필요하므로 실린더 수를 사용하는 모델을 만드는 것이 좋습니다 차량에 대한 변위 및 기타 통계는 실제로 당 마일을 제시합니다

갤런 그래서 여기에서 우리는 기본적으로 읽을 모델을 만듭니다 갤런 당 자동차 마일에서 우리는 자동차 이름을 계속 지킬거야 그들 자신은 자동차의 이름은 예측할 수 없다 그들은 자동차 이름 일 뿐이다

마력에는 빠진 값들이 있으므로 우리는 중앙값 우리는 전에 이걸 보았습니다 그리고 나서 X와 Y 축을 예측 변수로 만듭니다 그래서 우리는 실린더, 변위, 마력, 중량, 가속도, 연도 및 원산지, 어떤 나라에서 생산 되었는가? 갤런 당 마일을 예측하려고합니다 그래서 이것은 당신의 X입니다

예측에 사용 된 값과 Y는 실제로 예측 한 값입니다 그리고이 Keras가 실제로 보이는 것입니다 Sequential을 만들면됩니다 순서대로 진행되는 레이어, 일단 우리가 첫 번째 밀집한 레이어를 만들면 밀집한 레이어 단순히 첫 번째 레이어의 모든 뉴런이 다음 레이어에 연결되는 레이어 일반적으로 레이어가 실제로 작동하는 방식은 매우 일반적입니다 특히 우리가 가진 것처럼 표 형식의 데이터를 위해

이제 우리가 얻을 때 이것은 다를 것입니다 이미지로 입력 된 치수는 X 모양이므로 이 X가있는 열의 수는 0이 될 입력 값입니다 하나의 행이 얼마나 많은 행인지를 나타냅니다 활성화가 정류 됨 선형 단위이고 우리에게는 25 개의 뉴런이 있습니다 우리는 다음 숨겨진 레이어에 10을 가지고 있습니다

우리가 가지고있는 입력이 얼마나 많은지 말할 필요가 없습니다 기본적으로 25부터입니다 이전 계층 및 활성화 또한 행 출력은 1에 불과합니다 회귀 신경망의 경우 출력은 항상 1입니다 회귀 신경망 당신은 항상 평균 제곱 오차가 귀하의 손실입니다

일반적으로 Atom을 사용할 최적화 프로그램입니다 이 수업에는 우리가 곧 볼 수있는 다른 것들은 우리가 가고자하는 것들에 맞습니다 100 신기원에 맞춰야합니다 신경망이 훈련되는 시간은 얼마입니까? 에 대한 우리가 얼마나 많은 것을 결정할 수 있는지는 나중에 알 수있을 것입니다 신기원은 실제로 충분합니다

Verbose는 우리가 갈 때 데이터를 출력하는 것을 의미하며, 실행하면 우리는 손실이 계속 될 때 축소되는 것을 볼 수 있습니다 점점 더 효과적입니다 이것이 바로 위에있는 장황한 가치입니다 그렇게하면 데이터의 양을 제어 할 수 있습니다 화면에 덤핑

지금은 특히 여기서는 좋지 않습니다 백은 아마 충분하지 않을 것입니다 실제로 이것은 꽤 좋은 예측을 얻고 우리는 평균 제곱근 평균 오차, 24 믿음이 특히 좋지 않음 갤런 당 마일이 그 범위이기 때문에 그렇게 할 수 있습니다 이것은 당신이 재교육 할 수있는 드문 것이 아닙니다 그것은 당신에게 더 나은 것을 줄지도 모릅니다

결과 그래, 그게 훨씬 더 나은 결과 야 예를 들어 나중에 자동으로 제어 할 수있는 방법을 살펴 보겠습니다 필요한시기 그리고 여기서 볼 수 있습니다 더 좋은 것은 그것이 좋은 것만 큼 당신이 가끔은 좋지 않은 것처럼 보일 것입니다

3으로, 그리고 나서 우리는 다양한 자동차와 갤런 당 그들의 마일을 출력 할 수있다 또는 예상 갤런 당 마일 그리고 네, 이제 그들은 많이 볼 수 있습니다 훨씬 더 가까이서도 분류를 할 수 있습니다 고전을 사용합니다

아이리스 (Iris) 데이터 세트는 4 가지 측정 값을 제공합니다 sepal 길이, sepal 너비를 사용하고 있습니다 홍채 꽃의 세 가지 유형의, 페달 길이와 꽃잎 폭 이것은 Keras 분류 신경 네트워크 보이는구나 그것은 매우 유사합니다 당신은 4 개의 입력이 될 입력을가집니다

숨겨진 하나 이상의 숨겨진 레이어가 있습니다 그러나 분류와 함께 특히 다중 클래스 분류는 두 개 이상을 의미합니다 클래스라면 softmax와 categorical cross-entropy를 할 것입니다 우리가 다음 모듈에서 볼 수있는 바이너리 분류는 여기서는 이진 손실 함수를 사용하는 것이 조금 다를 것이지만 우리는 우리가 그 훈련에 도달 할 때이 훈련을 볼 수있을 것입니다 손실을 줄이면 다른 종들을 인쇄 할 수 있습니다

우리가 분류하려고하는 바이러스의 종류 그리고 이것이 결과물입니다 그것에서 보인다 그것은 과학 표기법에 있습니다 읽을 수 없으면 사용하지 말라고 말할 수 있습니다

당신은 과학을 억제 할 수 있습니다 표기법이지만 본질적으로이 세 가지 값은 세 가지 홍채와 어느 쪽이든 가장 큰 것은이 것입니다 satosa 인 첫 아이리스는 과학 표기법을 억제 할 수 있습니다 그런 다음 하나 또는 적어도 아주 가까운 값을 볼 수 있습니다 이제 모든 일류 홍채 파일이 개인별로 정렬됩니다

홍채 때문에 파일의 맨 위에있는 모든 사람들이 모두 똑같습니다 이러한 예측을 숫자 값으로 전환 할 수도 있으므로 0을 의미합니다 첫 번째 홍채는 두 번째 홍채이고 두 번째 홍채는 세 번째 홍채입니다 문자 그대로 숫자를 원한다면 어떤 수업이 필요한지 알려줄 수 있습니다 실제로 예측했다

이 배열 표기법을 사용하여 인쇄 할 수도 있습니다 이 클래스의 홍채의 실제 텍스트 이름을 출력 할 수 있습니다 선택하면 정확도가 98 %라는 것을 알 수 있으므로 매우 좋습니다 특별 값으로 피드를 보내고 예측을 할 수도 있으므로 이것이 방법입니다 당신은 하나의 값을 먹을 것이고,이 측정을 위해 홍채 처녀 자리를 예측합니다

그리고 당신은 한 번에 그들에게 무리를 먹일 수 있습니다 이 비디오를 시청 해 주셔서 감사합니다 다음 동영상에서 우리는 Keras 신경망을로드하고 저장하십시오 이 콘텐츠는 자주 변경되므로 이 강좌 및 기타 주제에 대해 최신 정보를 얻기 위해 채널을 구독하고 인공 지능

Introduction to Pandas for Deep Learning (2.1)

안녕하세요, 제프 히튼입니다 딥 뉴럴 네트워크 응용 프로그램에 오신 것을 환영합니다

워싱턴 대학교와 이 비디오에서는 시리즈를 시작할 예정입니다 이 모듈을 위해 다음 5 개의 비디오, 팬더에 대해 이야기 할 것입니다 이제 신경망은 표 형식의 데이터를 받아 들일 수 있으며, Microsoft Excel에서 볼 수있는 데이터입니다 많은 전통적인 데이터 과학 문제들이 이런 방식으로 설정됩니다

Kaggle에 대한 많은 대회가이 방법으로 설정됩니다 우리는 이미지와 오디오 처리에 들어갈 것입니다 텍스트 및 자연 언어 처리, 나중에이 과정에서 우리는 팬더를 사용하지 않을 것입니다 그러나 처음에는, 기존의 데이터 세트 중 일부를 다룰 때, pandas는 데이터 세트를 다루는데 매우 유용합니다 열로 나눌 수 있습니다

AI 과정과 프로젝트에 대한 최신 정보는 구독하고 그 옆의 종을 클릭하십시오 모든 새 비디오에 대한 알림을받을 수 있습니다 신경망, 다양한 데이터 수신 에 대해 예언하기 읽는 데이터의 한 유형은 CSV 파일입니다 그리고 이것은 표 형식의 데이터를 다룹니다

우리는 표 형식의 데이터에 대해 몇 가지 수업 시간을 보냅니다 몇 개의 모듈, 그러나 우리는 또한 많은 것을 이미지로 얻을 것입니다 기타 고급 입력 신경 네트워크가 처리 할 수있는, 신경 네트워크가 특히 좋습니다 하지만 지금은 팬더를 살펴볼 것입니다 표 형식의 데이터를 처리하는 방법을 살펴보십시오

여기서 우리는 팬더 read_csv를합니다 우리가 다른 데이터 세트를 읽을 때 많이 보게 될 것입니다 나는 이것을 웹에서 읽고있다 콜 랩에서 작동해야합니다 또한 로컬에서 실행하는 경우에도 마찬가지입니다

그리고 DataFrame의 덤프를 출력합니다 어쨌든 그것의 처음 다섯 줄 디스플레이 기능을 사용할 수도 있습니다 조금 더 멋지게 인쇄합니다 따라서 갤런 당 데이터 세트 수를 보여줍니다

이것은 고전적인 데이터 세트입니다 당신은 많은 기계 학습 문학에서 보았습니다 우리는 그것을 많이 사용하지는 않지만 많이 사용합니다 그것은 갤런 당 마일을 보여줍니다 이들 다양한 자동차 각각에 대해, 특히 1970 년대에 만들어진 자동차

갤런 당 마일의 이러한 값, 이 다른 값을 사용하여 예측하려고합니다 당신이 여기에서 볼 수 있습니다 이것은 몇 가지 기본 통계를 인쇄 할 수있는 방법을 보여줍니다 이 값에 그리고 그것은 당신이 어떤 팬더와 어떻게 일하는지를 보여줍니다

이 프로그램을 실행하면 기본적으로 각 필드가 제공됩니다 그래서 현장은 갤런 당 마일로 명명됩니다 다음 필드는 cylinders 등으로 명명됩니다 그리고 이것은 당신에게 통계의 일부를 제공합니다 평균, 분산, 표준 편차 등

읽는 것이 어렵지만 읽는 것이 더 쉬워 질 것입니다 잠시 우리가 어떻게 실제로 이것을하는지 봅시다 우리는 DataFrame 우리는 데이터 형식 만 사용하고 있습니다 정수이고 실수입니다

그것은 효과적으로 이름을 떨어 뜨리고 있습니다 그런 다음이 값들의 헤더를 얻습니다 필드라고하는 빈 목록을 만듭니다 그리고 우리는 각 필드를 반복 할 것입니다 칼럼에 그래서 우리가 반복 할 각 열, 우리는 필드에 추가 할 것입니다

우리는 단지 날고있는 사전입니다 그리고이 사전에는 네 가지 요소가 있습니다 4 개의 항목 이름은 우리가있는 분야 일뿐입니다 평균은 DataFrame이며, 이것은 DataFrame에서 열의 평균을 취하는 방법입니다

mean, variance 및 standarddeviation 당신은 중앙값, 통계 값의 전체 무리를 할 수 있습니다

사용할 수 있습니다 그리고 나서 우리는 그들을 출력합니다 이것은 좋은 예입니다 사전 목록을 작성하는 방법, 이것은 사용하기에 매우 보편적 인 구조입니다 이것은 마치 데이터베이스 테이블과 같습니다

그리고 이것은 정확히 형식입니다 데이터를 저장할 수있는 직접 DataFrame에로드 할 수 있습니다 여기에서 우리는이 데이터를 취할 수 있음을 알게 될 것입니다 여기에서 생성하여 판다 DataFrame으로 바꾸십시오 매우 편리합니다

이제 우리는 멋지게 표현할 수 있습니다 그래서 우리는 기본적으로 처음부터 DataFrame을 만들었습니다 이 모든 평균값, 이름, 표준 편차 및 분산 그래서 우리가 하나씩 추가하고있는이 사전은, 그것들은이 특정 표의 행과 같습니다 우리가 만들고있는 것

자, 누락 된 가치 현실은, 데이터 과학자로서 다루는 데이터 항상 문제가 있습니다 사실, 데이터가 완벽하다면, 문제가 있다는게 거의 두렵다 나는 보지 못했다 여기서 우리는 갤런 당 오토 마일로 다시로드 할 것입니다

그것은 동일한 데이터 세트입니다 그러나 우리는 여기서 NA 값 NA와 물음표, 몇 가지 물음표가 있기 때문에 이 특정 데이터 세트에서 누락 된 마력의 가치가 있습니다 그래서 네가 이걸 실행하면 너에게 그걸 보여줄거야 예, 마력에는 NA 값이 있습니다 그런 다음 누락 된 값을 채 웁니다

우리는 중간 값을 취합니다 이제 중앙값은 일반적으로 더 나은 가치입니다 평균보다 누락 된 값을 넣는다 중간 값은 특이 치에 민감하지 않기 때문에, 반면에 평균은이다 거대한 외계인 가치가있는 경우, 그것은 당신의 평균에 영향을 미칠 것입니다

그러나 그것은 당신의 중앙값에 영향을 미치지 않을 것입니다 그래서 우리는 마력을 가져 간다 그리고 우리는 실종자를 채운다 NA 값, 그 중앙값으로 누락 된 값 NA 값도 드롭 할 수 있습니다

네가 원한다면 NA 값을 가진 전체 행이 삭제됩니다 그리고 이제 우리는 마력을 출력합니다 우리가 그것을 채웠기 때문에 참으로 NA가 없습니다 외이 값은 또 다른 것입니다

당신은 잠재적으로 다루어야 만합니다 다른 방법으로 제거하거나 처리 할 수 ​​있습니다 여기에서 그들을 제거하는 방법을 보여 드리겠습니다 우리는 이상 치를 정의하고있다 높은 숫자 인 것으로서, 어쩌면 둘 이상의 표준 편차가있을 수 있습니다

2 개는 약간 가깝지만 3 개 이상일 수 있습니다 그러나 이것은 당신에게 제거하는 방법, 우리는 공정한 금액을 제거하고 싶다 그래서 우리는 아무것도 제거하지 않을거야 즉 표준 편차가 두 개 이상입니다 평균보다 높거나 낮습니다

우리가 제일 먼저하는 일은 우리의 낙하 행은 무엇입니까 그래서 우리는 근본적으로 값 목록을 요구하고 있습니다 여기서 절대 값 각각의 개별 값들 중, 이름이 칼럼이다 우리가 이상 치를 계산하고 있다고 평균에서 빼기 우리는 그것이 아닌지 확인합니다

그 표준 편차의 양 그런 다음이 행을 삭제합니다 우리는 모든 색인을 얻었습니다 축을 0으로 사용합니다 왜냐하면 우리는 열이 아니라 행을 다루기 때문입니다

열을 삭제하지 않습니다 Inplace는 실제 DataFrame을 수정한다는 것을 의미합니다 두 번째 DataFrame을 반환하지 않습니다 함수를 실행하여 메모리에 저장하십시오 그러면 동일한 데이터 세트가로드됩니다

특징 벡터를 생성한다 마력을 중앙값으로 바꾸면됩니다 우리는 필요가 없기 때문에 이름을 없앨 것입니다 이 예제에서는별로 중요하지 않습니다 그리고 우리는 갤런 당 마일의 길이를 봅니다

우리가 그 값들을 버리기 전에 그리고 우리는 398에서 388로 갔다 여기에 몇 가지 데이터를 보여줍니다 당신은 아마 필드를 떨어 뜨리는 것을 볼 수 없을 것입니다 판다에 들판을 떨어 뜨리는 것은 꽤 쉽습니다

이름 필드를 삭제하려면이 작업을 수행하기 만하면됩니다 그리고 그것은 전후의 열 수를 알려줍니다 또는 실제 열 당신은 이름이 거기에 있음을 볼 수 있습니다, 이제는 삭제할 수있어 매우 편리합니다 DataFrame의 전체 열

우리는 함께 사물을 연결할 수도 있습니다 이것은 매우 유용하게된다 더미 변수 생성을 시작할 때 및 기타 변수들 DataFrame에 'em'을 추가해야합니다 이것이 무엇을 할 것인가? 기본적으로 새로운 DataFrame을 만들 것입니다 그것은 단지 두 가지 값의 합입니다

그래서 이것은 단지 이름과 마력을 만들어내는 것입니다 그래서 우리가하는 일은 마력을 추출하는 것입니다 우리는 이름을 추출하고 있습니다 그 두 개를 열로 연결합니다 축 1은 항상 열을 의미합니다

그리고 당신은이 결과를 얻습니다 우리는 단지 처음 다섯 행을 표시하고 있습니다 하지만이 방법을 사용하면 하위 선택, 어쨌든 그들 중 하나, 하위 선택하실 수 있습니다 처음부터 DataFrames를 구축하십시오 과제 중 일부는 당신이하기를 원할 것입니다

이것과 아주 비슷한 것 그래서 이것은 유용합니다 이 열 또는 시리즈를 사용할 수 있어야합니다 완전히 새로운 DataFrame을 구축하기 위해 그것들을 조합하십시오 행을 함께 연결할 수도 있습니다

이것이하는 일은 처음 두 가지를 취하는 것입니다 그리고 마지막 두 줄 따라서 우리는 DataFrame을 0에서 2로 가져 가고 있습니다 그리고 나서 마이너스 2에서, 결국 두 개의 뒤를 의미합니다 결국 우리는 함께 연결시켜야합니다

자, 우리는 행을 다루기 때문에이 축은 0입니다 팬더를 자주 사용하는 또 다른 당신의 훈련 데이터를 깨뜨리는 훈련입니다 교육 및 검증 세트, 심지어 K- 폴딩에 이르기까지 다양합니다 우리는 나중의 모듈에서 K- 폴딩을 더 할 것입니다 그러나 기본적으로 데이터를 가져올 수 있습니다

교육 유효성 검사 분할로 나눕니다 전체 데이터 세트를 여기에 가지고 있습니다 그러나 당신은 훈련을 위해 80 %, 유효성 검사를 위해 20 %를 취하고 있습니다 보통 기차 세트에 모델을 훈련시키고 맞출 것입니다 교육 세트에서 생성 된 모델을 평가할 것입니다

귀하의 유효성 검사 세트에 이것은 어떻게하는지 보여주는 간단한 코드입니다 기본적으로 마스크를 사용하여 값의 가면 그러므로 이것은 단지 진리와 거짓의 목록에 불과합니다 그 진실은 포함될 것입니다

그리고 거짓은 그렇지 않은 것들입니다 따라서 우리가 80 %를 사용하고 있기 때문에 교육용 DataFrame 기본적으로 마스크가 적용된 DataFrame을 가져옵니다 반대 마스크 그리고 우리는 인쇄 할 수 있습니다 우리가 312 세트의 훈련을 받았고, 우리의 검증 세트 86

이건 매우 중요합니다 Keras에 직접 DataFrames를 보내지 마십시오 당신은 numpy를 사용할 수 있어야합니다 Numpyvalues가이 일을합니다

그래서 여기에서는 기본적으로 값을 얻었음을 알 수 있습니다 행렬을 만들었습니다 이제는 이러한 모든 값을 원할 수 없습니다 마찬가지로, 그 이름은 숫자가 아닙니다 그래서 문제를 일으킬 수 있습니다

리스트를 전달할 수 있습니다 이제 파이썬에서 이것을 자주 볼 수 있습니다 혼란의 원인으로 배열에 이중 중괄호가 있으면, 이중 중괄호가 아니에요 전달하려는 색인이 목록입니다 내가 모든 행을 원한다고 말하는거야

DataFrame에서 가져 오지 만이 열만 있으면됩니다 그리고 만약 당신이 거기있는 이름없이 지금 그것을 원한다면, 이제는 못생긴 문자열이 없습니다 그것은 당신이 갖고 싶은 순수한 숫자입니다 이것에 대해 더 많이 알 수 있습니다 우리가 특징 벡터를 준비하는 방법을 배울 때 신경 네트워크

생성하거나 수정 한 DataFrame을 저장할 수 있습니다 CSV 파일에 저장하십시오 이렇게하면 Jupyter Notebook 외부에서 볼 수 있습니다 엑셀을 사용하거나, 더 고급 무언가를 사용하는 것이 바람직합니다 CSV 파일보기

Excel에서는주의해야합니다 CSV 파일을 수정하는 경향이 있습니다 심지어 앞에 오는 0을 제거함으로써 심지어 손상시킬 것입니다 그리고 다른 것들 또한 제한된 지원도 있습니다

UTF-8과 같은 텍스트 인코딩 Excel을 사용하여 일을 볼 수는 있습니다 데이터의 일부를 다시 포맷 할 수도 있습니다 그것을 부패시킨다 이제 CSV 파일로 저장하면, 유용 할 수있는 그게 종종 내가 제출 한 것이기 때문에 그 파일들은 나에게, 그 형식으로, 과제 중 일부에 대해서 당신이 Kaggle 경쟁에서 경쟁 할 때, 당신은 종종 CSV 파일을 제출할 것입니다

그래서 나는 Kaggle 경쟁에 대한 정확한 요구 사항을 게시 할 것이다 이번 학기 동안 우리는 그 시점에 도달했습니다 CSV 파일을 저장하는 명령은 간단히 to_csv입니다 그리고 본질적으로이 DataFrame을 걷고 있습니다 그런 다음 그것을 다시 쓰십시오

색인은 거짓입니다 일반적으로 색인은 false와 같음을 원합니다 그것이 그것을 말할 것이기 때문에 각 행에 행 번호를 넣지 마십시오 그리고 당신이 이것을 실행할 때, 그것은 단지 완료라고 말합니다, 우리가 말한 경로에서 CSV를 생성합니다 점은 현재 디렉토리를 의미합니다

Google Collab을 사용하고 계시다면, 당신은 당신의 매핑 된 G 드라이브의 경로를 그곳에 두어야합니다 그 다음 그것을 장소로 출력 할 것입니다 당신은 그 파일을 가질 수 있습니다 그리고 Google 문서 도구에서 그 내용을 살펴볼 수 있습니다 또는 다른 것

Google 문서 도구는 CSV를 볼 수있는 아주 좋은 프로그램입니다 이제 피클에 DataFrame 저장 피클은 바이너리 파일 형식입니다 따라서 CSV로 저장하면, 당신은 기본적으로 그것을 텍스트 파일에 작성하고 있습니다 당신은 종종 그것을 읽습니다

그러나 당신은 아주 작은 정밀도의 문제들에 빠질 수 있습니다 CSV 파일간에 물건을주고받을 때 보통 이것은 문제가되지 않습니다 두 파일을 비교하려고 할 때만 문제가됩니다 따라서 Pickle은 정확한 렌더링을 보장합니다

의 파일의 또한 다른 메타 데이터도 저장합니다 DataFrame에 저장되는 단순히 행 번호와 같은 CSV에 맞지 않습니다 제가 이걸 실행하면, 제가 끝났다고 간단히 말해줍니다 다시 말하지만, 이것은 다시 색인을 다시 만들었습니다 Pickle 파일을 다시로드합니다

이걸로 끝났어, 피클로드 피클 덤프는 어떻게 저장하는지입니다 그리고 다시로드합니다 자, 여기서 주목해야 할 것이 있습니다 이 파일이 모든 열 및 모든 것입니다

하지만 차이점을 알 수있는 방법은 다음과 같습니다 Pickle 파일 로딩과 CSV 파일 로딩 사이 행 번호가 일치하지 않습니다 우리가 다시 색인을 생성했기 때문에 우리는 그 색인을 재구성하지 않았습니다 그래서 그것은 Pickle 파일에 저장되었습니다

그것은 CSV 파일에서 사라 졌을 것입니다 지금은 일반적으로, 당신은 반드시 그들을 잃어 버리지 않을 것입니다, 하지만 실제 행 번호 처음로드되었을 때부터, 우리가 그것을 섞어서 이것들은 순서가 맞지 않습니다 그것은 CSV 파일에 저장되는 것이 아닙니다 이 비디오를 시청 해 주셔서 감사합니다 팬더 소개

우리는 팬더로 더 고급 처리를하는 방법을 보게 될 것입니다 이 모듈의 다른 부분에 이 콘텐츠는 자주 변경되므로 채널을 구독하십시오 이 과정에 최신 정보를 얻으려면 인공 지능 분야의 다른 주제들

Introduction to Machine Learning | What is Machine Learning | Supervised and Unsupervised Learning

안녕하세요, Intellipaat의 세션에 오신 것을 환영합니다 이제는 기계 학습이라는 용어를 접했을 것입니다

정확하게 그것이 무엇인지 궁금합니다 그래서 오늘의 세션에서 다루고있을 것입니다 그래서 당신은 기계 학습 분야에서 당신의 여행을 시작할 수 있습니다 우리는이 작은 예제를 통해 기계 학습의 개념을 이해하게 될 것입니다 여기 그래서 너는 너를 어떻게 보느냐

그것은 정확히 그것이 차가 아니고 어떻게 이것에 관해서는, 이것은 다시 차다 그리고 이것은 이것도 차다 지금 어떠하다 당신은이 카드들이 모두 꼬마 카드라고 생각합니다 자동차 그림과 유치원 교사의 말을 들었을 것입니다 또는 당신의 부모님은 이것이 자동차이고 당신의 두뇌가 자동차 인 것처럼 보입니다

그리고 그것이 뇌가되는 법입니다 기능은 있지만 기계는 어떨까요? 이제 자동차의이 이미지를 채우면 그것은 기계에 그것이 그것이 차라는 것을 확인할 수있을 것입니다 기계 학습이 시작되는 곳에서 내가 할 일은이 모든 이미지를 가져갈 것입니다 자동차의 모든 기능을 학습 할 때까지 기계에 먹이를 계속 공급합니다 이 자동차와 관련된 모든 기능을 배우면 이 차는 새로운 데이터 또는 그것이 얼마나 좋은지를 결정하는 테스트 데이터를 줄 것이다

로드 또는 다른 말로하면 먼저 기계 교육 데이터를 피드하여 교육 데이터에서 모든 기능을 추출하고 교육이 완료되면 학습을 얼마나 잘 수행했는지 결정하기 위해 테스트 데이터를 제공 할 것입니다 완료 및 이것이 기계 학습의 기본 개념입니다 이제 기계 학습이 정확히 무엇인지 이해 했으므로 기계 학습의 범주를 살펴보고 기계 학습이 될 수 있도록하십시오 감독 학습과 감독되지 않은 학습으로 구분됩니다 시작하자

감독 학습과 함께, 감독 학습에서 우리는 변수 및 출력 변수가 있으며이 입력 변수는 X 및 출력 변수는 Y로 표시되며 우리는 Y는 X와 다르다 즉, 우리는 종속 변수와 독립 변수를 갖는다 우리는 종속 변수가 어떻게 변하는지를 결정하려고합니다 이 독립 변수들에 대한 존중은 다시 감독 학습이 될 수있다 회귀와 분류로 나누었다

이제부터 시작하겠습니다 분류에서 분류하기 때문에 출력 변수는 자연을 이해하기 위해이 예를 들어 보겠습니다 학생의 성별과 학생의 성향에 따라 성별은 독립적입니다 변수와 결과는 종속 변수이며 우리는 학생이 시험에 합격했는지 여부는 학생의 성별에 따라 결정됩니다 학생 또는 다른 말로하면 우리는 기본적으로 데이터를 분류하려고합니다

다음으로 우리는 회귀가 있습니다 따라서 회귀 분석에서 출력 변수는 연속 수치 적으로이 예제를 취해 봅시다 여기서는 예측하기 위해 노력하고 있습니다 기본적으로 Apple의 가격은 연속적인 숫자이므로 감독 학습 알고리즘은 감독되지 않은 학습으로 이어갈 것입니다 놀라 울 정도로 클래스 레이블이없는 입력 데이터가 있으므로 빌드를 시도합니다

데이터의 기본 구조를 이해하는 모델이므로 여기예요 따라서 클래스 레이블이없는 입력 데이터와이 입력 값이 있습니다 데이터는 물고기 입력으로 구성됩니다이 입력 데이터를 가져오고 이 입력 데이터의 맨 위에있는 감독되지 않은 학습 모델은 나에게 두 가지를 줄 것이다 클러스터 그래서 모든 물고기와 물고기로 구성된 첫 번째 클러스터 모든 새들로 구성된 두 번째 집단

이제 너희들은 명심해야한다 클래스 레이블이 없어도이 놀랄만 한 모델이 이 데이터를 두 개의 클러스터로 나누고이 클러스터링은 특성의 유사성을 토대로 첫 번째 클러스터에서 모든 값은 유사합니다 그들 모두는 물고기이고 두 번째는 물고기이다 클러스터의 모든 값이 유사하므로 이번에 그들 모두는 새입니다 그래서 이것은 감독되지 않은 학습 모델이 작동하는 방식입니다

그래서 얘들 아, 이건 기계 학습에 대한 간단한 소개 였고 더 유익한 비디오를위한 Intellipaat의 YouTube 채널

Stanford CS234: Reinforcement Learning | Winter 2019 | Lecture 1 – Introduction

다들 안녕하세요, 저는 Emma Brunskill입니다 저는 컴퓨터 사이언스의 조교수이며 CS234에 오신 것을 환영합니다

음, 보강 학습 수업 인 음, 일종의 초급 단계 마스터 또는 PhD 학생이 보강 학습을 소개합니다 그래서, 오늘 우리가 할 일은 내가 시작할거야 보강 학습이 무엇인지 간단히 요약합니다 음, 그럼 우리가 갈거야 과정 물류 및 과정 물류를 거칠 때, 또한 잠시 멈추고 물류에 대해 질문 할 것입니다

음, 웹 사이트가 지금 생방송입니다 또한 클래스에 대한 최상의 정보 소스 그와 피아자가 최고의 정보 원이 될 것입니다 음 어서 가면 거기에서 멈출거야 그 부분은 제가 갈 수없는 것이 있는지 묻습니다 당신에 대해 질문이 있고 질문이 있다면 대기자 명단 또는 자신의 상황과 관련된 특정 사항, 끝까지 나에게 다가와 라 음, 그리고 수업의 세 번째 부분은 우리가 시작하는 곳이 될거야 우리가 생각하고있는 기술적 내용을 익히려면 불확실성에 대한 순차적 의사 결정에 대한 소개입니다

음, 우리가 시작하기 전에 나는 감각이있다 누가 여기 컴퓨터 학습 수업을 들었습니까? 괜찮아 누가 AI를 얻었습니까? 괜찮아 그래서, 조금 덜하지만 대부분의 사람들 괜찮아

큰 그래서, 아마 여기있는 모든 사람들이 보강 학습에 대해 조금은 보았을 것입니다 음, 어디 있었는지에 따라 약간 다릅니다 우리는 다음과 같은 것들을 포함 할 것입니다 당신이 어떤 보강 학습도 모르는 것처럼 처음부터, 음, 하지만 우리는 다른 콘텐츠로 빠르게 갈 것입니다

음, 스탠포드와 관련된 다른 수업에서는 다루지 않습니다 그래서, 강화 학습은이 근본적인 문제와 관련이 있습니다 지능형 에이전트가 올바른 의사 결정 순서를 어떻게 배울 수 있습니까? 음, 그리고 그것은 보강 학습이 무엇인지 요약 한 문장입니다 우리는이 수업에서 다루는 내용을 알고 있습니까? 그러나 실제로 많은 중요한 아이디어를 인코딩합니다 음, 우선, 우리는 지금 일련의 결정에 대해 정말로 염려하고 있습니다

그래서, 다루는 많은 것들과 대조적으로, 어, 기계 학습, 우리는 요원에 대해 생각할거야, 지능형 에이전트 또는 지능형 에이전트 인간 또는 생물학적 인 것 또는 그렇지 않을 수도있는 일반 사항 음, 한 가지 결정 만이 아니라 일련의 결정을 내리는 방법 우리는 선량에 대해 걱정할 것입니다 다시 말해, 우리는 관심을 가질 것입니다 두 번째로 좋은 결정을 내리는 법을 배우는 것입니다

음, 여기서 우리가 잘하는 것이 의미하는 것은 최적 성의 개념입니다 우리는 결정에 대해 몇 가지 유틸리티 조치를 취하고 있습니다 음, 강화 학습의 마지막 중요한 측면은 학습이지만, 음, 에이전트가 그 결정이 어떻게 영향을 미치는지 미리 알지 못한다고 세상이나 어떤 결정이 필연적으로 좋은 결과와 관련 될 수 있는지, 대신 경험을 통해 그 정보를 획득해야합니다 그래서, 우리가 이것에 대해 생각할 때 이것은 정말로 우리가 항상하는 일입니다

우리가 아기였던 이래로 해냈습니다 우리는 알아 내려고 노력한다 너, 음, 세상에서 높은 보상을받는 일종의 신경 과학과 심리학에서 진행되는 정말 흥미 진진한 연구, 음,이게이 근본적인 문제에 대해 생각하려고하는거야 인간 지능형 에이전트의 관점에서 그래서 우리가 AI를 해결할 수 있다면, 음, 또는 상당한 진전을 이루십시오

우리는 중대한 진전을 이루어 낼 수 있어야한다 우리가 강화 학습을하는 에이전트를 만들 수있게 해줍니다 그럼,이게 어디서 올까? Yael Niv의 좋은 예가 있습니다 프린스턴 대학의 심리학자와 신경 과학 연구원의 일종 음, 그녀가 우리에게 원시 생물과 같은 종류의 모범을 보여준 곳입니다

평생 동안 다음과 같이 발전합니다 아기가되었을 때, 그것은 원시적 인 뇌와 한쪽 눈을 가지고 있으며 주위를 헤엄 치며 바위에 붙어 있습니다 그리고 어른이되면 뇌가 소화되어 거기에 앉습니다 그리고 이것은 아마도 지능의 지점 또는 적어도 부분적으로는 두뇌를 갖는 것이 의사 결정을 안내하는 데 도움이되며, 일단 모든 결정과 대리인의 삶이 우리는 더 이상 뇌가 필요하지 않을 수도 있습니다 그래서, 나는 이것이, 당신도 알다시피, 이것은 생물학적 인 생물의 한 예입니다

왜 요원이 될지 생각해 볼 수있는 유용한 알림 어찌 되었든 지능적이어야한다 결정을 내려야한다는 사실과 근본적으로 관련이 있습니까? 당연히, 음, 강화 학습에서 실제로 일종의 패러다임 전환이있었습니다 음, 2015 년경에, 음, Neurex Conference는 학회의 주요 기계 학습 중 하나이며, David Silver가 와서 워크숍에 참석하여 발표했습니다 보강 학습을 사용하여 Atari 게임을 직접 제어하는 ​​놀라운 결과입니다 자, 당신이 비디오 게임을 좋아하는지 여부는 중요합니다

음, 비디오 게임은 정말 흥미로운 예입니다 휴먼 플레이어를 종종 가지고 배우는 복잡한 작업의 일종 우리는 사전에 어떻게해야할지 모른다 적어도 약간의 경험이 필요합니다 그리고이 예제에 대한 정말 놀라운 점은 바로 이것입니다

Breakout은 에이전트가 픽셀 입력에서 직접 재생하는 것을 배우는 것입니다 따라서 에이전트의 관점에서 볼 때, 그들은 단지 이런 종류의 컬러 픽셀을보고 있습니다 들어 와서 무엇을 배워야하는지 놀이를 배우기 위해 내리는 올바른 결정 게임은 물론 사람들보다 훨씬 낫습니다 그래서 이것이 가능하다는 것은 정말로 놀라운 것이 었습니다 음, 처음 보강 학습을 시작했을 때, 많은 작업이 인공 장난감 문제에 집중되어있었습니다

음, 많은 기초가 있었지만 이런 종류의 우리가 정말로 부족한 대규모 어플리케이션 그리고 저는 지난 5 년 동안, 우리는 엄청난 발전을 보았습니다 음, 에서 진행되는 기술 유형 강화 학습 및 문제의 범위에서 다루어 질 수 있습니다 비디오 게임뿐 아니라 게임도 그렇습니다 로봇과 같은 것들에도 있습니다

음, 특히 내 동료 중 일부는 대학에서, 음, 캘리포니아 버클리, 어, 로봇 공학에 대해 정말 대단한 일을하고있었습니다 이러한 유형의 시나리오에서 보강 학습을 사용하면, 요원들에게 쥐기를시키려는 시도, 접은 옷, 그런 것들 자, 그 사람들이 몇 가지 예입니다 음, 전에 보강 학습을 보았습니다 아마 당신이 들었던 사람들 일 겁니다

비디오 게임이나 로봇과 같은 것에 대해 들어 본 적이있을 것입니다 음,하지만 제가 생각하기에 흥미 진진한 것들 중 하나는, 어, 강화 학습은 사실 많은 수의 도메인에 적용 할 수 있습니다 음, 기회이자 책임입니다 그래서, 특히, 음, 스탠포드 (Stanford)에서 인간 영향 연구소 (Human Impact Lab)의 인공 지능을지도하고 있습니다 정말로 관심있는 방법은 우리가 어떻게 사용하는지입니다

인간의 잠재력을 증폭시키는 인공 지능? 그래서, 당신이 그것을 할 수있는 한 가지 방법은 교육 게임 같은 것을 통해서입니다 목표가 밝혀지면, 어, 사람들에게 분수와 같은 자료를 배우는 방법을 빠르고 효과적으로 가르치는 법 또 다른 중요한 분야는 건강 관리입니다 음, 이것은 일종의 컷 아웃입니다 음, 발작을 조사해 보면 Joel Pineau, 맥길 대학에서 그리고 생각하고있는 많은 흥분도 생각납니다

특정 보강 학습에서 AI를 어떻게 사용할 수 있는지, 음, 같이 것들과 상호 작용하는 일을하고 싶습니다 전자 의료 기록 시스템을 사용하여 환자 치료에 알립니다 최근의 흥분과 생각이 많이 있습니다 강화 학습과 많은 다른 응용 프로그램을 사용할 수 있습니다 에 대한 최적화 기술의 종류 최적화 문제를 해결하는 것이 정말 어려울 때

그래서 이것은 다음과 같은 것들에서 발생합니다 비전의 자연어 처리 및 기타 여러 영역에서 사용됩니다 따라서 우리가 강화 학습의 핵심 측면에 대해 생각해야한다면, 그들은 아마도 다음 4 가지로 끓어 갈 것입니다 그리고 이것들은 그것을 구별 할 수있는 것들입니다 인공 지능과 기계 학습의 다른 측면에서

그래서, 내 문장에서 학습 강화 우리가 불확실한 상황에서 좋은 결정을 내리는 것을 배우고 있다는 점, 기본적으로 지연 최적화 결과, 탐사 및 일반화 따라서 우리는 올바른 의사 결정에 관심이 있기 때문에 자연스럽게 최적화가 이루어집니다 우리가 할 수있는 결정의 상대적인 다른 유형의 개념이 있습니다 음, 우리는 좋은 결정을 내릴 수 있기를 원합니다 두 번째 상황은 지연된 결과입니다

그래서, 이것은 지금 내려진 결정들에 대한 도전입니다 그들이 훨씬 늦게까지 좋은 결정인지 여부를 알지 못할 수도 있습니다 그래서, 지금 당신은 일요일에 초콜릿을 먹습니다 그리고 당신은 한시간 후에 그것을 깨닫지 못합니다 그건 아이스크림의 두 코트를 모두 먹는 나쁜 생각이었습니다

음, Montezuma 's Revenge와 같은 비디오 게임과 같은 것들이 있다면, 당신은 열쇠를 집어 야합니다 그리고 나서 많은 도움이된다는 것을 깨닫습니다 또는 지금 정말로 열심히 공부하십시오 금요일 밤에 그리고 3 주 동안은 중간 고사를 잘합니다 그래서, 이것을하기위한 도전 중 하나는 반드시 즉각적인 결과 피드백을받을 필요는 없기 때문에, 알려진 것으로하기가 어려울 수 있습니다

신용 할당 문제는 어떻게 생각합니까? 결정 사이의 인과 관계 당신은 과거와 미래에 결과로 만들었습니까? 그리고 그것은 우리가 기계 학습의 대부분에서 보는 경향이있는 것과는 정말로 다른 문제입니다 그래서, 우리가 시작할 때 나오는 것들 중 하나 이것에 대해 어떻게 생각합니까? 그래서 요원은 근본적으로 세상이 경험을 통해 어떻게 작동하는지 우리는 상담원에 대해 다음과 같이 생각합니다 정말로 세상에서 사물을 시험해 보는 과학자입니다 자전거 타는 중개인이있는 것과 같이 자전거 타는 법을 배우는 것과 같습니다 균형 잡힌 자전거 타기와 물리학은 떨어지는 것으로 작동합니다

여기서 가장 큰 도전 중 하나는 데이터가 검열되고 우리가 의미하는 바 이 경우 검열은 당신이하려고하는 것에 대해서만 배우는 것입니다 여러분 모두 스탠포드에 있습니다 이것이 최적의 선택이었습니다 음,하지만 너는 실제로 가지 않는다 네가 갔다면 어떻게 될지 알아봐

MIT는 좋은 선택이었을 수도 있습니다 하지만 너는 그럴 수 없어 너는 오직 한 삶을 살기 때문에 너는 그것을 경험할 수 없다 그래서 너는 이 특정 시간에 선택한 특정 선택 만 볼 수 있습니다 그래서 궁금한 한 가지 질문은 음, 너도 알다시피, 정책, 우리가 할 일, 우리는 정책에 대해 많은 이야기를 할 것입니다

정책, 의사 결정 정책은 경험에서 결정에 이르기까지 약간의 매핑이 될 것입니다 그리고 당신은 왜 대답 할 수 있습니다, 우리는 이것을 배울 필요가 있습니다 그래서 우리가 딥 마인드 같은 것을 생각한다면, 아타리가 게임을하고있어 여기에서 배운 내용은 그것은 픽셀로부터 배우는 것입니다 그래서, 그것은 본질적으로 이미지의 공간에서 다음에 무엇을 배웠습니다

그리고 만약 당신이 그것을 프로그램으로 쓰고 싶다면, 일련의 if then 구문, 그것은 절대적으로 엄청날 것이다 이것은 다루기가 쉽지 않습니다 그래서, 이것이 우리가 일반화 된 형태를 필요로하는 이유입니다 왜 우리가 직접 데이터에서 배우는 것이 훨씬 더 좋은지, 또한 작업에 대한 높은 수준의 표현을 제공합니다 그래서, 우리가 이전에 보지 못했던 특정 픽셀 구성, 우리 요원은 아직도 무엇을 해야할지 알 수 있습니다

그래서, 이것들은 정말로 강화 학습을 구성하는 4 가지 일종의 것입니다 적어도 온라인 보강 학습과 왜 그들이 있습니까? AI 및 기계 학습의 다른 유형과는 다릅니다 따라서 인공 지능에 많은 도움이되는 또 다른 사항은 계획입니다 예를 들어, 바둑 게임, 음, 계획 문제의 일부가 될 수 있습니다 그렇다면 계획에는 무엇이 관련되어 있습니까? 최적화, 종종 일반화 및 지연된 결과를 포함합니다

당신은 움직임을 취하고 일찍 가야 할 수도 있습니다 나중에 많은 단계까지 잘 움직이지만 탐사는 포함되지 않습니다 아이디어와 계획은 세계가 어떻게 작동하는지에 대한 모델을 제공한다는 것입니다 게임의 규칙이 주어진다면, 예를 들어, 당신은 보상이 무엇인지 압니다 음, 그리고 어려운 부분은 세계의 모델이 주어질 때해야 할 일을 계산하는 것입니다

따라서 탐사가 필요 없습니다 그리고 감독 된 기계 학습 대 강화 학습 종종 최적화와 일반화를 수반하지만, 탐사 또는 지연된 결과가 관여합니다 그래서 탐사가 필요하지 않습니다 일반적으로 감독 학습에서는 데이터 세트가 제공됩니다

따라서 상담원이 세계에 대한 경험이나 데이터를 수집하지 않고 대신 제공합니다 경험이 있어야하며 이미지가 얼굴인지 아닌지 여부를 말해야합니다 마찬가지로, 음, 일반적으로 본질적으로이 이미지가 얼굴인지 여부와 같은 하나의 결정 의사 결정을 생각하는 대신 지금은 그 후에 올바른 결정을 내렸는 지 여부 만 배우는 것입니다 무자비한 기계 학습, 또한 최적화와 일반화를 포함하지만 일반적으로 탐사 또는 지연된 결과와 일반적으로 당신은 세계에 대한 레이블이 없습니다 그래서 감독 학습에서, 당신은 종종이 이미지와 같이 세상에 대한 정확한 라벨을 얻습니다

얼굴이 있거나 없거나 음, 감독받지 않은 학습에서 당신은 일반적으로 세상에 대해 아무 레이블도 얻지 못합니다 RL은 일반적으로 얻을 수있는 것의 중간에 뭔가를 얻습니다 당신이 넣은 라벨의 유틸리티 예를 들어, 여기에 얼굴이 있고 말할 수도 있습니다 "알았어, 네, 우리는 당신에게 그 부분 신용을 줄 것이다

어쩌면 얼굴처럼 보이는 뭔가가있을 수 있기 때문입니다 그러나 당신은 세계의 진정한 레이블을 얻지 못하거나 스탠포드에 가기로 결정했을 것입니다 음, 그럼 당신은 몰라요 그리고 너는 굉장히 좋은 경험 이었어 그것이 맞는지 모르겠다 ","적당한 경험

" 우리가 만질 수있는 모방 학습 이 수업에서 간단히 말하자면 매우 중요 해지고 있습니다 음, 비슷 하긴하지만, 조금 다르다 그래서, 어, 최적화, 일반화, 종종 지연된 결과가 있지만 아이디어는 우리가 다른 사람들의 경험을 통해 배우려고한다는 것입니다 그래서, 우리의 지능형 에이전트가 이전에 가고있는 대신에, 전 세계에서 경험을 쌓고 자신의 결정을 내리십시오 그것은 사람이 될 수있는 또 다른 지능형 에이전트를 볼 수도 있지만, 결정을 내리고, 결과를 관찰 한 다음 그 경험을 사용하여 그것이 어떻게 행동하기를 원하는지 알아냅니다

이 일을하는 데 많은 이점이있을 것입니다 그러나 조금 있습니다 그것은 탐사 문제에 대해 직접 생각할 필요가 없기 때문에 다릅니다 모방 학습과 나는 단지 조금 더 많은 시간을 보내고 싶다 그것은 점점 중요 해지고 있기 때문입니다

그래서, 내 지식으로, 그것은 Andrew Ng에 의해 대중화 된 첫 번째 종류였습니다 음, 전 교수님이 계시 니, 음, 헬리콥터를 통해 그는 Pieter Abbeel과 함께 전문가 비행을보고 있었고, 버클리에있는 교수님, 음, 당신이 어떻게 아주 빨리 모방 할 수 있는지 보려고 음, 장난감 헬리콥터를 타는 전문가들 그리고 그것은 첫 번째 종류의 초청 학습의 주요 응용 프로그램 성공 매우 효과적 일 수 있습니다 본질적으로, 당신이 하나의 궤도를 관측하게된다면, 헬리콥터가 날아 다니는 원이라고 상상해 봅시다

당신의 에이전트는 전문가가하는 것과 정확히 똑같지 않은 것을 배우게됩니다 근본적으로 그 길을 떠나기 시작할 수 있고, 당신이 정말로 옳은 일이 무엇인지 알지 못하는 영역으로 벤처 기업 그래서 모방 학습에 대한 많은 연구가있었습니다 모방 학습과 보강 학습 사이에서 매우 유망한 것으로 끝납니다 그래서, 우리가 보강 학습을하려고하는 방법에 관해서, 우리는 이러한 여러 종류의 기술을 토대로 구축 할 수 있습니다

음, 또한 독특한 도전 과제에 대해 생각해보십시오 이러한 4 가지 과제 모두를 포함하는 강화 학습 그래서이 RL 요원들은 정말로 탐험 할 필요가 있습니다 세계를 탐구하고 그 탐험을 사용하여 미래의 결정을 인도하십시오 그래서, 우리는 과정 전반에 걸쳐 이것에 대해 더 이야기 할 것입니다

음, 정말로 중요한 질문은 이러한 보상이 어디에서 왔는지입니다 요원이이 정보를 사용하는 곳은 어디입니까? 결정이 좋은지 여부를 안내하려고 노력하십시오 음, 누가 그걸 제공하고 있고, 틀렸다면 어떻게 될까요? 그리고 우리는 그것에 대해 더 많이 이야기 할 것입니다 음, 우리는별로 이야기하지 않을거야 멀티 에이전트 강화 학습 시스템 그러나 그것은 또한 매우 중요한 경우입니다, 게임 이론 측면에 대해서도 생각할 것입니다

그래서, 이것은 몇 가지 측면에 대한 간단한 개요입니다 보강 학습과 왜 다른가? 네가 택했을 수도있는 다른 수업들보다 음, 이제 코스 로지스틱스를 간략히 살펴본 후 일종의 더 많은 내용을 담은 후 질문에 대답하기 위해 코스 물류 후에 잠시 멈추도록하겠습니다 전제 조건, 음, 우리는 여기있는 모든 사람들이 AI 수업을 듣거나 기계 학습 수업이 여기에 있습니다 스탠포드 또는 다른 기관에 상응하는 것 그리고 당신이 수업에 대한 적절한 배경을 가지고 있는지 확실하지 않은 경우, 피아자에서 우리에게 다가 가면 우리는 반응 할 것입니다

음, 관련 일들에서 광범위한 작업을했다면, 그것은 아마도 충분할 것입니다 일반적으로, 우리는 기본적인 파이썬 숙련도를 기대합니다 음, 그리고 당신은 확률에 대해 잘 알고 있습니다 통계 및 다중 변수 미적분학 그라데이션 강하, 손실 파생 상품, 음, 그 모든 것들이 당신에게 아주 친숙해야합니다

아마도 대부분의 사람들이 MDP에 대해 들어봤을 것입니다 전,하지만 전적으로 중요하지는 않습니다 그래서, 이것은 긴 목록입니다 [LAUGHTER] 나는 그것이 매우 중요하다고 생각하기 때문에 천천히 통과 할 것이다 그래서, 이것이 수업의 목표입니다

학습 목표는 무엇입니까? 그래서, 이것들은 우리가 기대하는 것들입니다 너희들이 네가 할 수있는 시간에 할 수 있어야한다 이 수업을 마치면 도움이되는 것이 우리의 역할이라고 생각합니다 당신은이 일들을하는 법을 이해할 수 있습니다 따라서 가장 중요한 점은 다음과 같은 핵심 기능을 정의 할 수 있어야한다는 것입니다

AI 및 기계 학습의 다른 유형과 구별하는 보강 학습, 음, 문제의 프레임 그래서, 그것은 제가이 수업에서 지금까지 조금씩 해나 가고 있었던 것입니다 이것이 이것을 어떻게 구별합니까? RL은 다른 유형의 프로, 문제점과 어떻게 구별됩니까? 그래서, 음, 대부분의 경우, 당신은 아마도 학업을 끝내지 않을 것입니다 음, 그리고 대부분의 사람들이 업계에 들어갈 겁니다 그래서, 당신이 할 때의 큰 도전 중 하나는 당신이 직면 할 때입니다

당신의 상사로부터의 특별한 문제 또는 당신이 당신의 문제 중 하나에 문제를 제기 할 때, 감독관은 그들에게 그것은 보강 학습 문제로 틀을 잡아서는 안되며, 음, 그리고 그것에 적용 할 수있는 것들 그래서, 저는이 수업이 끝날 때까지, 실생활에 문제가 생겼다는 느낌이 들었습니다 웹 광고 또는 환자 치료 또는 로봇 문제, 음, 당신이 그것을 공식화하는 것이 유용한 지 아닌지 보강 학습 문제 및 쓰는 법 그 프레임 워크에서 어떤 알고리즘이 관련이 있는지를 보여줍니다 음, 수업 도중, 우리는 또한 몇 가지 보강 학습 알고리즘을 소개합니다 음, 코드에서 그 코드를 구현할 기회가 있습니다

깊은 보강 학습을 포함해서, 어, 문제 또 다른 중요한 측면은 시도하는 경우입니다 특정 도구에 어떤 도구를 사용할지 결정하려면 로봇 문제 또는 건강 관리 문제, 음, 어떤 알고리즘이 유익한 이유인지 이해하는 것입니다 그리고 경험적 수행과 같은 것 외에도, 이해하는 것이 정말 중요하다고 생각합니다 일반적으로 알고리즘을 어떻게 평가할 것인가? 음, 그리고 우리는 후회 표본 복잡성과 같은 이론적 도구 같은 것을 사용할 수 있습니까, 음, 계산상의 복잡성과 같은 것들 어떤 알고리즘이 특정 작업에 적합한 지 결정하십시오

그리고 마지막으로 그 중 한 가지 중요한 측면 강화 학습은 탐험 대 착취입니다 상담원이 어떤 의사 결정을해야하는지 파악해야 할 때 발생하는이 문제 그들은 만들고 싶어 그리고 그들이 뭘 배울지 그러한 결정을 내림으로써 환경에 대해 그래서 수업이 끝날 때까지, 당신은 또한 다양한 기술을 비교할 수 있어야합니다 탐사 대 착취와 이들의 강점과 한계는 무엇입니까? 누구든지 이러한 학습 목표가 무엇인지에 대해 질문이 있습니다

괜찮아 그래서 우리는이 수업에 3 가지 주요 과제를 부여 할 것입니다 음, 중간 고사도있을거야 음, 우리는 수업이 끝날 때 퀴즈를 풀거야 음, 최종 프로젝트뿐입니다

퀴즈는 좀 특이합니다 음, 그래서, 지금 당장 그것에 대해 이야기하기 위해 약간의 시간을 보내고 싶습니다 퀴즈는 개별적으로 그리고 그룹으로 진행됩니다 음, 우리가하는 이유는 우리가 원하기 때문입니다 낮은 지분으로 사람들은 코스의 후반에 배우는 교재로 연습합니다

음, 일종의 재미 있고 매력적이긴하지만 실제로 당신은 그것에 대해 생각하고 또한 동료들로부터 배울 것입니다 음, 작년에 해냈어 나는 많은 사람들이 그것이 이전에 갈 방법에 관해 조금 신경 작용에의하고, 그 다음 그것을 정말로 즐기는 것을 끝내었다 따라서 퀴즈가 작동하는 방식은 객관식 퀴즈입니다 처음에는 누구나 그리고 나서 모두가 그들의 답변을 제출 한 후에, 그런 다음 우리가 미리 할당 한 그룹으로 다시합니다

그리고 목표는 모든 사람들이 무엇을 결정할 수있게해야한다는 것입니다 정답은 스크래치를 치고 정답이 무엇인지 알기 전입니다 그리고 나서 우리는 음, 당신이 옳은 대답을했는지 여부, 정확하게 첫 번째 또는하지 않습니다 당신은 당신의 개인 성적보다 더 나빠질 수 없습니다 그래서, 그룹에서 그것을하는 것은 오직 당신을 도울 수 있습니다

음, SCPD 학생의 경우, 그들은 그룹으로하지 않습니다 그래서 그들은 대답에 대한 정당성을 적어 둡니다 다시 말하지만, 음, 그것은 꽤 가벼운 평가 방법입니다 음, 목표는 당신이 왜 당신이 그것을 믿는 지 분명히 밝힐 수 있어야한다는 것입니다 대답은 그들이하는 방식이며 소그룹으로 토론하고 정보, 음, 정답이 무엇인지 알아내는 데 사용하십시오

음, 최종 프로젝트는 꽤 쌍을 이룹니다 당신이 다른 수업에서했던 다른 프로젝트와 비슷합니다 음, 개방형 프로젝트입니다 이유는, 어, 그리고, 보강 학습에 대해 생각해 봅시다 우리는 또한 발표 될 기본 프로젝트를 제공 할 것입니다

첫 번째 마일스톤이 만료되기 전에 다음 몇 주 동안 기본 프로젝트를 수행하기로 결정한 경우, 당신이 제안이나 이정표를 할 필요가 없기 때문에, 귀하의 과제물에있는 프로젝트 프리젠 테이션을 기반으로 작성됩니다 우리가 생각하기에 음, 너희들은 모두 서로의 최고의 자원이야 음, 우리는 피아자를 사용합니다 음, 거의 모든 클래스 커뮤니케이션에 사용해야합니다 그것이 일종의 것이 아닌 한 사적 또는 민감한 태도로 물론 코스 직원에게 직접 연락하십시오

아, 그리고 강의와 숙제와 프로젝트에 관한 질문은 피아자를 거쳐야합니다 늦은 날 정책을 위해, 우리는 여섯 일 늦게, 아, 자세한 내용은 웹 페이지 및 공동 작업에 대한 자세한 내용은 웹 페이지를 참조하십시오 그래서 우리가 다음 부분으로 가기 전에, 수업에 대한 물류에 대해 질문이 있습니까? 좋아, 시작하자 음, 그러지 않을거야 불확실성에 대한 순차적 의사 결정에 대한 소개, 이전에이 콘텐츠 중 일부를 본 수많은 사람들이 음, 우린 이걸 소수로 갈거야

네가 본 것보다 더 깊이가있어 오늘은 이론이 아닌 다른 이론을 포함한이 이론을 포함하여, 우리는 또한 콘텐츠로 이동합니다 나중에 모든 학생들에게 새로운 것이어야합니다 따라서 불확실성에 대한 순차적 인 의사 결정 음, 우리가 생각하는 근본은 이러한 설정은 일종의 대화 형 폐 루프 프로세스이며, 우리가 대리인이있는 곳, 잘하면 지능형 에이전트가 행동을 취하고있다

세계의 상태에 영향을 미치고 관찰과 보상을 돌려줍니다 주요 목표는 에이전트가 총 예상 미래 보상을 최대화하려고 시도한다는 것입니다 자,이 예상되는 양상, 음, 때로는 세상 자체가 될 것이기 때문에 중요 할 것입니다 확률 론적이어서 에이전트는 예상치 못한 것들을 극대화 할 것입니다 이것은 항상 올바른 기준이 아닐 수도 있습니다

음, 이것은 강화 학습의 대부분에 집중되어 왔습니다 그러나 지금은 존경 할만한 분배에 대해 생각해 보는 것에 관심이 있습니다 RL 및 일부 다른 측면 여기에서 핵심 과제 중 하나는 즉각적이고 장기간의 보상과 높은 보상을 달성하기 위해서는 전략적 행동이 필요하며, 당신이 희생해야한다는 것을 나타냅니다 장기간에 걸쳐 더 우수한 상을 달성하기 위해 초기 상급 상 예를 들어, 웹 광고와 같은 것일 수도 있습니다

웹 사이트를 운영하는 에이전트 및 고객에게 어떤 웹 광고를 제공할지 선택해야합니다 고객은 웹 페이지에 머문 시간, 광고를 클릭하는지 여부에 대한 정보도 얻을 수 있습니다 목표는 사람들이 광고를 가장 많이 클릭하는 방식을 말하는 것입니다 따라서 광고를 클릭하도록 사람들을 보여줄 광고를 선택해야합니다 또 다른 예는 식기 세척기를 내리는 로봇입니다

그래서이 경우 에이전트의 행동 공간은 관절 운동 일 수 있습니다 에이전트가 거꾸로 얻을 수있는 정보는 주방에 요리가 없으면 주방에 더하기 하나의 보상을 얻을 수 있습니다 따라서이 경우 일반적으로 지연된 보상이됩니다 오랫동안 카운터에 요리가있을거야, 어, 그것이 단지 모든 것을 쓸어 버리고 바닥에 충돌하게하지 않으면, 이는 시스템을 작성하는 사람의 의도 된 목표 일 수도 있고 그렇지 않을 수도 있습니다 음, 그래서 일련의 작업을해야 할 수도 있습니다

오랫동안 보상을받을 수없는 결정 또 다른 예는 혈압 조절, 음, 행동은 규정 된 운동이나 처방 된 약물과 우리가 얻을 개인의 혈압이 무엇인지에 대한 관찰 음, 보상이 플러스 1 일 수도 있습니다 건강한 범위의 혈압 약이있는 경우 작은 부정적인 보상 부작용으로 처방되고 다르게는 제로 보상이 될 수 있습니다 [NOISE] 그럼, 다른 사건을 생각해 봅시다

제 실험실에서 인공 교사를 갖는 것 같아요 이제 당신이 가질 수있는 것은 당신이 교습원을 가질 수 있다는 것입니다, 그리고 그것이하는 것은 활동을 선택하는 것입니다 그래서 교습 활동을 선택하십시오 그것은 단지 두 가지 유형의 교수 활동이 있다고 가정 해 봅시다 음, 추가 활동을하거나 빼기 활동으로 학생에게 제공합니다

그런 다음 학생은 옳고 그름을 바로 잡습니다 그리고 학생이 처음에는 덧셈이나 뺄셈을하지 않는다고 가정 해 봅시다 그래서 유치원생인데 학생은 그 사실을 전혀 모릅니다 수학과 우리는 학생 수학을 가르치는 방법을 알아 내려고 노력하고 있습니다 교수 요원을위한 보상 구조는 그들이 더하기를 얻는다는 것입니다

한 학생이 무언가를 얻을 때마다 하나씩 학생이 잘못하면 마이너스 1 점을받습니다 그래서, 누군가에게 잠깐의 시간을 가지기를 바랍니다 근처에 있고 배우려고하는 에이전트에 대해 어떻게 생각하는지 설명합니다 예상되는 보상을 극대화하기 위해 이러한 유형의 사례에서 어떤 유형의 문제가 생길지 그 학생이 옳은 일을하고 있는지 여부 [소음]

내가 여기서 간단히 설명 할게, 그리고 여기서 내가 명확히하자 [NOISE] 여기서 분명히 해두겠습니다 대부분의 학생들은 더하기가 뺄셈보다 쉽기 때문에, 여기에 나온 말처럼 학생이이 중 하나를 알지 못하더라도 문제 추가 학습의 기술은 새로운 학생이 뺄셈보다 더 쉽게 배울 수 있습니다 그렇다면이 사건들에서 어떤 일이 일어날 수 있습니까? 어쩌면 우리가 원하고, 손을 들고, 그들과 누군가에게 말해 줄 수 있습니까? 이 시나리오에서 에이전트 근처에서 사고가 발생했을 가능성이 있습니까? [소음]

에이전트는 그들에게 정말로 쉬운 추가 문제를 줄 것입니다 맞습니다 그것이 실제로 일어난 일입니다 Bev Wolf와 함께 약 2,000 명 정도되는 멋진 종이가 있습니다 가장 초기의 것 중의 하나이다

그러나 나는 알고있다 강화 학습을 통해 지능형 개인 교습 시스템을 만들고 보상은 대리인을위한 것이 었습니다 학생들이 문제를 해결하기 위해 문제를 제기합니다 아시다시피, 학생들이 상황을 바로 잡으면 배웠습니다 그러나 여기에있는 문제는 보상 사양에 있습니다

에이전트가 배우는 것은 정말 쉬운 문제를주는 것입니다 그리고 나서 학생은 처음에는 어떻게해야할지 모릅니다 방법을 빨리 배우고 어려운 문제를 제기 할 인센티브가 없습니다 이것은 보상 해킹으로 알려진 것의 작은 예일뿐입니다 당신 요원이 나올 거란 말인데요

네가 그에게 말한 것이 무엇인지 정확하게 배우라 당신이 지정하고 보강 학습에서 보상 기능의 측면에서, 종종 우리는 시간을 거의 소비하지 않는다 보상 기능이 무엇인지에 대해 매우주의 깊게 생각합니다 그래서 나가서 시험 할 때마다 현실 세계는 이것이 정말로 정말로 중요한 부분입니다 그러나 일반적으로 보상 기능이 무엇인지 선택하는 것은 디자이너입니다

대리인은 본질적인 내부 보상을 가지지 않으므로 지정하는 방법에 따라 다릅니다 에이전트는 다른 일을하는 법을 배웁니다 그래, 뒷문에 문제가 있니? 이 경우, 학생도 같이있을 것 같습니다 RL 요원과 실제 생활을 좋아하는 학생, 그래서 우리는 그녀의 질문에 무엇을 요구 했습니까? 접근 할 수있는 기법이나 그 부분을 무시하는 것은 괜찮습니까? 그래서, 문제는 잘 말하는 것입니다 알다시피, 우리는 사람들이 아마 강화 학습 에이전트뿐만 아니라 그것은 정확합니다

어쩌면 그들은 "이봐 요, 나는 더 열심히 질문 할 필요가있다 또는이 과정에서 상호 작용할 수 있습니다 " 이 수업의 대부분에 대해 우리는 세계가 우리가 자체적으로 상호 작용하는 것은 RL 에이전트 일 수도 있습니다 실제로 그것은 정말로 중요합니다 음, 때로는 게임 이론과 같은 적대적인 방식으로 종종 고려됩니다

제게 가장 흥미로운 것들 중 하나는 우리가 협조적인 방식으로 생각해 보라 음, 그럼, 여기 누가 기계 교육의 하위 분야에 대해 들어 보셨습니까? 아무도 아직, 그래서, 어, 어쩌면 5 ~ 10 년 동안 주변에 있었던 정말 흥미로운 새로운 영역입니다 그것보다 조금 더 거기에있는 아이디어 중 하나는, 두 명의 지능형 에이전트가있는 경우 어떻게됩니까? 상대방이 그들을 도우 려한다는 것을 알면 상대방과 상호 작용할 수 있습니까? 정말 멋진 고전적인 예가 있습니다 기계 학습에 그다지 익숙하지 않은 분들에게 사과드립니다

당신이 분류자를 배우려고하고 있다고 상상해보십시오 이 선을 따라 물건은 긍정적이거나 부정적입니다 그래서 일반적으로 샘플의 양이 필요합니다 샘플, 만약 네가, 그 종류의 점수를 쓰십시오 양수 또는 음수 라벨을 가져와야하는 라인

음, 네가 적극적인 학습 환경에 있다면, 일반적으로 당신은 그것을 대략적으로 로그하는 것으로 줄일 수 있다고 생각합니다 특히 사람들에게 라인에있는 포인트를 라벨링하도록 요구하는 것에 관한 전략적으로, 기계 교육을위한 정말 멋진 것들 중 하나는, 네가이 줄을 나눌 곳을 나에게 가르치려고하는 것을 알고 있다면, 본질적으로 한 점 또는 두 점만 필요합니다 맞습니까? 내가 너를 가르치려고한다면, 내가 무작위로 물건에 레이블을 붙일 방법은 없습니다 너에게 단 하나의 플러스 라벨을 붙일거야 마이너스가되면 라인이 어디로 가는지 정확히 알려줄거야

그래서 이것이 왜 if 에이전트는 다른 에이전트가 그들에게 무언가를 가르치려고한다는 것을 알고 있으며, 실제로 우리가 학습을 위해 생각하는 것보다 훨씬 더 효율적일 수 있습니다 따라서 기계 교육이 실제로 효과적 일 수있는 잠재력이 많이 있다고 생각합니다 그러나 모든 것은 말했습니다 우리는 그 과정의 대부분을 무시할 것입니다 프로젝트에서 탐색하고 싶은 것이 있다면 매우 환영합니다

강화 학습과 많은 관련이 있습니다 괜찮아 그래서, 우리가 일반적으로이 과정을 생각한다면, 우리가 일종의 순차적 의사 결정 과정을 생각한다면, 우리는이 대리인을 가지고 있습니다 우리는 신중한 타이머가 있다는 것을 거의 항상 생각할 것입니다 그래서 요원이 결정을 내릴거야

그것은 어떤 식 으로든 세상에 영향을 미칠 것입니다 세상을 보게 될거야 새로운 관찰과 보상을 줄거야 에이전트는이를 수신하고이를 사용하여 다른 결정을 내립니다 그래서,이 경우 우리가 역사에 대해 생각할 때, 우리가 역사를 의미하는 것은 단순히 에이전트가 취한 이전 행동의 순서이며, 그리고 그것이받은 관찰과 보상

두 번째 중요한 것은 상태 공간을 정의하는 것입니다 다시 한번, 이것이 종종 처음 논의되었을 때, 이것은 일종의 불변의 것이라고 생각합니다 그러나 실제 응용 프로그램을 사용할 때마다 이것은 당신이 정의해야하는 것입니다 세상의 표현을 적는 법입니다 음, 우리가 가정 할 이 클래스는 국가가 역사의 함수라는 것입니다

그래서 다른 측면이있을 수 있습니다 대리인이 원하는 다른 감각 정보 결정을 내리기 위해 접근 할 수 있어야합니다 그러나 지금까지 관측에 제약을 받게 될 것입니다 조치가 취해지고 보상이 준수됩니다 이제 현실 세계가 생길 것입니다

그래서, 그것은 실제 세계입니다 에이전트는 반드시 실제 세계에 액세스 할 필요는 없습니다 그들은 현실 세계의 작은 부분에만 접근 할 수 있습니다 그래서, 예를 들어 인간으로서, 바로 지금, 나는 눈을 내밀어 나를 고대합니다 대략 180도 정도입니다

음,하지만 내 머리 뒤에서 볼 수는 없어 그러나 내 머리 뒤에서는 여전히 세계 국가의 일부입니다 그래서 세계 국가는 현실 세계입니다 에이전트는 결정을 내리기 위해 자신의 상태 공간을 사용합니다 그래서, 일반적으로 역사의 일부 기능을 가지고 있다고 가정 할 것입니다

자, 우리가이 수업에서 많이 사용할 거라고 한 가정 여러분은 아마 Markov 가설을 보셨을 겁니다 마르코프 가정은 단순히 우리가 가고 있다고 말합니다 그 요원이 사용하는 주 (州) 역사의 충분한 통계입니다 미래를 예측하기 위해서는 당신은 현재의 환경 상태를 알아야합니다

따라서 기본적으로 미래는 현재에 주어진 과거와 무관하며, 현재의 경우 합계 통계가 있습니다 [잡음] 그래서, 이것의 두 가지 예로서, 네? 질문 이름 및 – 그냥 설명해 주시겠습니까? 예를 들어 주와 역사의 차이점은 무엇입니까? 차별하는 데 어려움이 있습니다 네 그래서, 국가, 어, 어, 어

우리가 로봇 같은 걸 생각하면 네가 긴 복도를 걸어가는 로봇을 가지고 있다고 가정 해 봅시다 괜찮아 두 개의 긴 복도가 있다고 가정 해 봅시다

괜찮아 그래서 여기에서 로봇이 시작됩니다 이것은 당신의 로봇이 시작하는 곳입니다 그리고 그것은 바로 가고자합니다 맞아, 그러면 아래로, 아래로, 내려 간다

괜찮아 그것의 센서가 단지 그것 앞에서 지켜 볼 수 있다고 가정 해 봅시다 어, 그 벽면에 벽이 있든 없든 그래서 로봇의 관측 공간은 단순히 거기에 있습니다 어떤면에있는 벽 – 네면 각각에있는 벽? 미안하지만 뒷모습이 조금 작을거야

하지만 요원은 기본적으로, 당신도 알다시피, 레이저 거리 측정기 등을 통해 현지 금액의 일종 그래서, 그 주변에 벽이 있는지 여부를 알 수 있습니다 그것은 그 주위에 즉시 정사각형이었고 다른 것은 없었습니다 따라서이 경우 에이전트가 보게되는 것은 처음에는 벽이 이렇게 보입니다 그런 다음 이것을 좋아하고 다음을 좋아하고 이것을 좋아하십시오

역사는이 모든 것을 포함합니다 그러나 그것은 지역의 상태입니다 따라서 지역의 상태는 현재의 관찰 일뿐입니다 네가 내려갈 때 중요해지기 시작한다 여기에 그렇게 많은 장소가 있기 때문에

그래서, 당신이 전체 역사를 추적한다면, 에이전트는 그 위치를 파악할 수 있습니다 그러나 그것이 단지 그것이 어디에 있는지를 계속 추적한다면, 부분 앨리어싱이 많이 발생할 수 있습니다 그래서 여기에 몇 가지 예를 들어 봤습니다 그래서, 고혈압 조절과 같은 것에서, 당신은 상태가 단지 현재의 혈압이라고 상상할 수 있습니다 음, 당신의 행동은 약을 복용할지 말지를 결정하는 겁니다

그래서, 당신이 아는 것처럼 현재의 혈압 의미, 매초마다, 예를 들어 혈압은 얼마입니까? 그래서, 이런 종류의 시스템이 마르코프라고 생각합니까? 나는 어떤 사람들이 머리를 흔들고있는 것을 본다 거의 확실하게 거의 확실하게 다른 기능이 있습니다 알다시피, 어쩌면 운동을하든 안하든, 당신이 방금 식사를 하던지, 그것이 밖에서 덥다고 방금 비행기가 있으면 어떡하지? 이러한 다른 모든 기능은 아마도 다음 혈압이 높아지거나 특히 약물에 대한 반응으로 낮습니다

웹 사이트 쇼핑, 음, 당신은 국가가 단지 일종의 것이라고 상상할 수 있습니다 지금보고있는 제품은 무엇입니까? 제가 아마존을 여는 것처럼, 나는 컴퓨터를보고있다 지금 내 웹 페이지에 올라와 있습니다 행동은 다른 제품이 추천하는 것입니다 그 시스템이 마르코프라고 생각하니? 시스템이 마르코프가 아닌가? 일반적으로 시스템을 의미합니까? 그러나 가정이 마르코프이고 그것이 맞지 않는다면? 문제는 시스템이 일반적으로 마르코프와 가정은 단지 더 세부 사항에 적합하지 않습니다

나는 이것에 대해 생각할 것이다 여기서 내가 의미하는 것은 이 특별한 선택은 시스템을 재 표식하는 것입니다 음, 그래서 현실 세계가 계속되고 있습니다 그리고 나서 에이전트가 사용할 수있는 세상의 모델이 있습니다 제가 여기서 논쟁하는 것은 이러한 세계의 특정 모델이 마르코프가 아니라는 것입니다

세계의 다른 모델이있을 수 있습니다 음,하지만 우리가 선택한다면 이 특별한 관찰은 현재의 혈압이 우리의 상태라고 말하면서, 아마도 그것은 실제로 마르코프 국가가 아닙니다 이제 마치 마치 마치 그것을 다루는 알고리즘을 사용할 수 없다는 것을 의미하지는 않습니다 우리가 우리가 될 수 있다는 것을 알아야한다는 것입니다 이러한 가정 중 일부를 위반합니다

네? 음, 네가 음을 넣으면, 국가로 충분한 역사, 마르코프의 일부로 만들 수 있습니까? 괜찮아 좋은 질문입니다 그래서, 왜 그렇게 인기가 있습니까? 알다시피, 당신은 언제나 무언가를 만들 수 있습니까? 일반적으로 그렇습니다 당신이 모든 역사를 포함한다면, 그러면 시스템 Markov를 항상 만들 수 있습니다 음, 실제로는 종종 그냥 사용하여 도망 갈 수 있습니다

가장 최근의 관찰 또는 어쩌면 합리적으로 충분한 통계로서의 마지막 네 가지 관찰 일 것입니다 그것은 도메인에 많이 의존합니다 확실히 도메인이 있습니다 어쩌면 좋아할 수도 있습니다 내비게이션 세계 모델을 만드는 것이 정말 중요한 곳입니다

전체 역사를 주 (state)로서 사용하거나, 부분 관측 가능성 음에 대해 생각해보십시오 알고있는 다른 사례, 어쩌면 현재 – 가장 최근의 관찰만으로도 충분합니다 자, 여기 도전 중 하나는 당신이 사용하고 싶지 않을 수도 있습니다 그것이 많은 정보이기 때문에 전체 역사 시간이 지남에 따라 계속 추적해야합니다 따라서 충분한 통계를 얻는 것이 훨씬 낫습니다

음, 물론,이 중 일부는 변화하고 있습니다 LSTM과 다른 것들과 약간 그래서, 음, 우리가 이전에 가정 한 몇 가지 방법 상태 공간의 크기에 비례 한 것들 깊은 학습으로 지금 조금 변화하고 있습니다 음,하지만 역사적으로 확실히, 더 작은 상태 공간을 갖는 것이 장점이었습니다 그리고 다시 역사적으로, 계산상의 복잡성과 같은 것들에는 많은 영향이있었습니다

필요한 데이터 및 그 결과는 상태 공간의 크기에 따라 달라진다 그래서, 왜 그렇게 될지에 대한 직감을주기 위해서입니다 음, 네 인생에서 너에게 일어난 모든 일을 네 상태로 만든다면, 그게 당신에게 정말로 진실 된 표현을 줄 것입니다 모든 주마다 하나의 데이터 요소 만 가질 수 있습니다 반복되지 않을 것입니다

음, 배우기가 정말 힘들어요 음, 그들은 모든 주들이 다릅니다 음, 우리가 무언가를하는 법을 배우고 싶다면, 우리는 어떤 형태의 일반화 또는 어떤 형식의 클러스터링 또는 집계를 통해 경험, 우리는 이전에 비슷한 경험을 통해 무엇을해야 하는지를 배울 수 있습니다 그래서 우리가 당신의 관찰이 당신의 상태라고 가정한다면, 그래서 에이전트가 얻은 가장 최근의 관찰은 우리는 그것을 국가로 취급 할 것입니다 그럼 우리는 – 그 에이전트가 마르코프 결정 과정 인 세계를 모델링하고 있습니다

그래서, 그것은 행동을 취할 생각입니다, 관측과 보상 받기, 그리고 그것은 국가를 설정하고 있습니다 세계는 환경이 그것이 관찰 인 것을 사용한다고 말합니다 세계가 부분적으로 관찰 가능한 음으로 세계를 다루고 있다면, 그 다음에는 에이전트 상태가 같지 않다고합니다 음, 그리고 그것은 세계의 상태에 관한 역사나 신념과 같은 것을 사용합니다 이전에 취해진 행동의 순서와받은 관측치를 모으기 위해, 그 결정을 내리기 위해 그것을 사용합니다 예를 들어, 포커와 같은 무언가에서, 음, 네가 직접 카드를 볼 수있어

다른 사람들은 분명히 게임의 진행 과정에 영향을 미치는 카드를 가지고 있습니다 음,하지만 당신은 실제로 그게 뭔지 알지 못해요 버려진 카드를 볼 수 있습니다 그리고 그것이 자연적으로 부분적으로 관찰 가능한 곳입니다 그래서 다른 카드 나 다른 플레이어의 신념을 유지할 수 있습니다

그리고 그 정보를 사용하거나 결정을 내릴 수 있습니다 그리고 건강 관리에서 이와 비슷한 경우가 많습니다 정말 복잡한 생리적 과정이 진행되고 있습니다 하지만 당신은 물건의 일부를 모니터 할 수 있습니다 혈압이나 체온 등을 아는 것처럼

그리고 결정을 내리기 위해 그것을 사용하십시오 따라서 순차적 의사 결정 프로세스의 유형 측면에서 볼 때, 그 중 한 명은 산적들입니다 우리는 나중에이 용어에 대해 더 이야기 할 것입니다 음, Bandits는 마크 업 결정 프로세스의 아주 단순한 버전입니다 그 감각은 그 행동들이 다음 관찰에 영향을 미치지 않는다

그래서, 언제 이것이 합리적일까요? 자, 일련의 고객에게 당신의 웹 사이트 그리고 당신은 그들 각각에게 광고를 보여줍니다 그래서, 그들은 그걸 클릭할지 말지를 선택합니다 그러면 다른 고객이 귀하의 웹 사이트에 로그인하게됩니다 따라서이 경우 고객에게 보여주는 광고, 일반적으로 어떤 고객 2 명이 따라 오는가에 영향을주지 않습니다 이제는 아마 고객이 정말로 복잡한 방식 일 수 있습니다

페이스 북에 간다 그리고 나는이 광고를 정말로 정말로 좋아한다라고 말한다, 당신은 그것을보아야한다 음,하지만 고객에게 보여준 광고는 대부분 하나는 귀하의 웹 사이트에 다음에 로그인하는 사람에게 전혀 영향을 미치지 않습니다 그래서 네가 내리는 결정은 지역에 영향을 미친다 첫 번째 고객과 두 번째 고객은 완전히 독립적입니다

도둑들은 정말로 정말로 중요했습니다 최소한 50 년 동안 음, 사람들은 임상 시험 같은 것들에 대해 생각했습니다 사람들을 임상 시험에 배정하는 법 당신은 웹 사이트와 다른 많은 응용 프로그램들을 생각할 것입니다

MDPs와 POMDPs는 당신이 취하는 행동이 세계의 상태에 영향을 미칠 수 있다고 말하지 않으며, 그들은 종종 당신이 얻는 다음 관찰에 영향을 미치고, 음, 보상뿐 아니라 그리고이 폐쇄 루프 시스템에 대해 생각해 봐야합니다 당신이 세상의 상태를 변화시키고있는 행동들 따라서 고객에게 추천하는 제품이 고객의 의견은 다음 단계에 있습니다 사실, 그럴 것이라고 기대하고 있습니다

음, 우리가 생각하는 이런 경우에, 사실,이 행동은 실제로 세계의 상태에 영향을 미칩니다 그래서, 또 다른 중요한 질문은 세상이 어떻게 변하는가하는 것입니다 음, 하나의 아이디어는 결정 론적으로 변화한다는 것입니다 그래서, 당신이 특정 국가에서 행동을 취할 때, 당신은 다른 상태로 가고 있지만 당신이가는 상태는 결정 론적입니다 단 한가지가 있습니다

그리고 이것은 종종 매우 일반적인 가정입니다 로봇 및 제어 장치 괜찮아 토마스 로자노 – 페레즈 교수는 MIT에서 저에게 제안합니다 동전을 던지면, 실제로 결정론적인 과정입니다

우리는 그것을 확률 론적으로 모델링합니다 우리는 충분히 좋은 모델이 없습니다 음, 그래서, 많은 과정들이 있습니다 음, 세계의 완벽한 완벽한 모델이 실제로 결정적으로 보일 것입니다 음,하지만 많은 경우에 그 모델을 적어두기는 어려울지라도

그래서 우리는 그것들을 확률 론적으로 추정 할 것입니다 그리고 그 생각은 우리가 행동을 취할 때 많은 가능한 결과가 있다는 것입니다 따라서 누군가에게 광고를 게재 할 수 없으며 광고를 클릭 할 수도 있고 클릭하지 않을 수도 있습니다 그리고 우리는 단지 확률 론적, 확률 론적 모델로 그것을 표현하기를 원할지도 모릅니다 그래서, 특정한 예를 생각해보십시오

우리가 화성 탐사선 같은 것을 생각하면, 정말 멀리 떨어져서 로버 또는 로봇을 배치 할 때, 음, 행성들, 의사 소통을 앞뒤로하기가 어렵습니다 따라서 이러한 종류의 로봇을보다 자율적으로 만들 수 있으면 좋을 것입니다 화성 탐사선이 아주 간단하다고 상상해보십시오 음, 일곱 주 시스템에 대해 생각해 그래서, 그것은 단지 착륙했습니다

음, 특정 위치에있어 왼쪽으로 가거나 오른쪽으로 가려고합니다 나는 왼쪽으로 시도하거나 오른쪽으로 시도해보십시오 하려고하는 것이지만 어쩌면 당신은 성공하거나 실패 할 것입니다 발견 할 수있는 여러 종류의 과학 정보가 있다고 상상해 봅시다 그래서 S1에서 약간의 유용한 과학적 정보이지만 실제로는 S7에는 물이있을 수있는 엄청나게 풍부한 곳이 있습니다

그리고 다른 모든 주에는 0이 있습니다 그래서, 우리는 약간의 예일 것입니다 나는 구강 대리인의 다른 공통 구성 요소에 대해 이야기하기 시작합니다 따라서 공통적 인 구성 요소 중 하나가 모델입니다 따라서 모델은 단순히 에이전트의 표현이 될 것입니다

세상에서 일어나는 일에 대해 행동을 취하고 그에 따른 보상을 얻을 수 있습니다 마크 업 결정 프로세스의 경우 단순히 내가이 상태에서 시작해서이 행동 A를 취하면, 내가 도달 할 수있는 다음 주에 대한 분포는 얼마인가? 또한 예상되는 보상을 예측하는 보상 모델을 갖게 될 것입니다 음, 특정 상태의 행동 그래서,이 경우에, 아, 에이전트의 보상이 그것은 영원한 보상이 도처에 있다고 생각합니다 음, 모터 컨트롤이 매우 나쁘다고 생각한다고 상상해 봅시다

그리고 50 % 확률로 움직일 때마다 같은 장소에 머무르고 실제로 움직일 확률은 50 %입니다 이제 모델이 잘못 될 수 있습니다 제가 여기서 뭘 올려 놓았는지 기억한다면 실제 보상은 무엇입니까? 상태 S1에서 당신은 더하기 1을 얻습니다 S7을하면 10 점을 받고 나머지는 0 점입니다 그리고 제가 여기 적어 놓은 보상은 모든 곳에서 제로라는 것입니다

따라서 에이전트가 가질 수있는 합리적인 보상 모델입니다 그것은 단지 잘못되었다 그리고 많은 경우에 모델이 잘못 될 것입니다 음, 그러나 종종 유용한 방법으로 상담원이 계속 사용할 수 있습니다 구강 에이전트가 항상 필요로하는 다음 중요한 구성 요소는 정책입니다

음, 정책이나 의사 결정 정책은 단순히 우리가 결정을 내리는 방법입니다 이제 마르코프 결정 과정에 대해 생각하고 있으므로, 우리는 그것들을 국가에서 행동으로의 매핑이라고 생각할 것입니다 그리고 결정 론적 정책은 단순히 하나의 행동 전립선이 있음을 의미합니다 그리고 확률 적 의미는 취할 수있는 행동에 대한 배분을 의미합니다 그래서, 아마도 당신이 공항에 갈 때마다, 당신은 동전을 던져서 당신이 가져갈지를 결정합니다

뒷골목이나 고속도로를 타야하는지 여부 따라서 빠른 점검으로 모든 단일 국가에서 우리가 올바른 행동을 취하는 것을 상상해보십시오 이것은 결정 론적 정책인가 확률 적 정책인가? 결정적인 위대한 우리는 왜 결정 론적 정책이 유용하고 확률 론적 정책이 곧 유용 할 때 이제, 값 함수, 음, 미래 보상의 기대 할인 액 특별한 정책

그래서, 그것은 기다리고 있습니다 얼마나 많은 보상이 지금과 미래에 나올 것인지 생각하고 있습니다 즉각적인 보상과 장기적인 보상에 대해 내가 얼마나 신경 쓰는지에 따라 가중치를 부여합니다 할인 요인 감마는 0과 1 사이가 될 것입니다 그래서 우리가 말할 수있는 가치 함수 좋은 상태인지 또는 나쁜 상태인지에 대한 분류

따라서, 화성 탐사선의 경우에도 우리의 할인율이 0이라고 상상해보십시오 우리의 정책은 올바르게 진행되는 것입니다 이 경우에는 이것이 우리의 가치 기능이라고 말합니다 그것은 국가에있는 것의 가치가 모든 것에 더한 것이라고 말합니다 else는 0이고 S7에있는 값은 10입니다

다시 말하지만, 이것은 올바른 값 기능 일 수도 그렇지 않을 수도 있습니다 진정한 역 동성 모델에 따라 다르지만, 하지만이 값은 에이전트가이 정책에 대해 가질 수있는 값 기능입니다 예상 할인 된 금액은 무엇인지 간단하게 알려줍니다 로 시작하는이 정책을 준수하면 얻을 수있는 보상 당신이 무게를다는이 주 각 보상은 감마에 의해 당신이 도달 한 시간 간격의 수에 이른다 그래서, 우리가 생각할 때, 예

따라서 할인 요인을이 예제로 확장하고자한다면, 아, 아, 얼마나 멀리 갔는지에 따라 보상에 대한 가치가 증가하거나 감소합니다 예 질문은, 감마가 0이 아니라면 여기 음, 감마가 0 이니까요 근본적으로 우리가 즉각적인 보상에 신경을 쓰고 있음을 나타냅니다

우리가 시작하든 안하든, 일종의, 만일 내가 올바르게 이해하면, 당신은 보상이 다른 주 (州)로 돌아가는 것을보기 시작합니다 그 대답은 '예'입니다 그래서 우리는 다음에 더 많은 것을 볼 것입니다 할인 계수가 0이 아닌 경우, 기본적으로 당신이 얻는 즉각적인 보상뿐만 아니라, [NOISE] 당신은 근시안 만이 아닙니다 당신은 당신이 미래에 얻게 될 그들의 보상에 관심이 있습니다

따라서 보강 학습 에이전트의 일반적인 유형에 관해서는, 음, 그 중 일부 모델을 기반으로, 이는 세계가 어떻게 작동하는지에 대한 직접적인 모델을 그들의 대표로 유지한다는 것을 의미하며, 전환 모델과 보상 모델처럼 그리고 정책이나 가치 기능이있을 수도 있고 없을 수도 있습니다 그들은 항상 정책을 계산해야합니다 그들은 무엇을해야 할지를 알아야합니다 그러나 그들은 명시 적 표현을 할 수도 있고 가지지 않을 수도있다

그들이 어떤 주에서나 할 일을 위해서 음, 모델이없는 접근은 명백한 가치 함수를 가지고 있습니다 정책 기능 및 모델 없음 네 이전 슬라이드 인 [NOISE] (으)로 돌아가서, 가치 함수가 혼란 스럽습니다

잘 얼음으로 평가했다 그래서, 왜 그것이 가치가있는 [NOISE] S_6이 아닌가? 왜냐하면 S_6에서 오른쪽으로 가면 S_7에 도착하기 때문입니다 당신은 언제 어떻게 보상을 받는지 생각하고 있습니다 음, 다음에 그 얘기를 더 할거야 실제로, 어, 보상이 어디에서 발생하는지 사람들이 생각하는 여러 가지 방법이 있습니다

어떤 사람들은 현재 상태에 대한 보상으로 생각합니다 어떤 사람들은 당신이 [NOISE]에있는 보상과 당신이 취하는 행동이기 때문에 그것을 생각합니다 그리고 일부 사람들 – 다른 공통 정의는 r-SAS 소수입니다 전환 할 때까지받을 보상이 무엇인지 알지 못한다는 의미입니다 그리고 내가 사용하고있는이 특별한 정의 여기서 우리는 그 상태에서 1 년 동안 보상이 발생했다고 가정합니다

그들 모두는, 음, 기본적으로 isomorphic, 음,하지만 우리는 우리가 [잡음]을 사용하고있는 것에 대해 조심하십시오 우리가 수업에서 사용하는 가장 공통적 인 것은 s입니다 여러분이 국가에있을 때, 당신은 특정한 행동을 선택합니다, 그러면 보상을 받게되고 다음 상태로 전환됩니다 좋은 질문입니다 괜찮아

그래서 우리가 보강 학습 에이전트에 대해 생각할 때, 이러한 모델과 이러한 가치와 정책을 유지하고 있는지 여부, 음, 우린 교차로가 많아 그래서 데이빗 실버 (David Silver) 그가 생각하는 곳, 일종의, RL 알고리즘이나 대개 이러한 세 가지 다른 클래스에 속하는 에이전트 그들은 심지어 모델 또는 명시 적 정책 또는 명시 적 가치 기능을 가지고 있습니다 그리고 많은 알고리즘들이 있습니다 일종의,이 교차로에서

따라서 배우 평론가와 같은 사람들은 종종 노골적인 반응을 보입니다 그리고 명시 적으로 무엇을 의미합니까? 나는 그들이 종종 길을 가짐을 의미한다 네가 말할 수있는 상태 – 나는 그 가치가 무엇인지 말할 수있다 내가 네게 국가를 주면 나에게 즉시 말해 줄 수있어 정책은 추가 계산없이 수행됩니다

따라서 배우 비평가는 가치 기능과 정책을 결합합니다 음, 많은 알고리즘이 있습니다 이 모든 것들의 교차점에 실제로 실제로는 유지 관리가 매우 바람직합니다 이들 중 다수는 서로 다른 강점과 약점을 가지고 있습니다 학습 이론의 이론적 인 측면에 관심이있는 사람들을 위해, 정말 근사한 최근 일이 있습니다

음, 공식적인 근본적인 차이가 무엇인지 명시 적으로 살펴 봅니다 MSR에서 방금 나온 모델 기반 RL과 모델 RL 사이에서, Microsoft Research [소음] 뉴욕에 있을지도 모른다는 것을 나타내는 모델 기반 및 모델없는 방법 간의 근본적인 차이, 깊은 학습면에서 매우 불분명합니다 그러니 자유롭게 저에게 묻습니다 그래서, 좋은 결정을 내리는 것을 배우는 데있어서의 도전은 무엇입니까? 음, 이것, 일종의 프레임 워크? 음, 하나, 우리가 조금 전에 이야기했던 계획의 ​​이슈입니다 그것은 세계가 어떻게 작동하는지에 대한 모델을 얻은 후에도 가능합니다

나는 내가해야하는 결정을 알아 내기 위해 그것을 사용해야한다 나는 그것이 내가 높은 보상을 얻을 수있게 될 것이라고 생각하는 방식으로 말입니다 음, [NOISE] 그리고이 경우에 당신이 주어진다면 실제 세계에서 어떤 상호 작용없이이 계획을 수행 할 수없는 모델입니다 누군가가 말하면, 여기에 전환 모델이 있습니다 그리고 여기에 당신의 보상 모델이 있습니다, 여러분은 떠나서 많은 계산을 할 수 있습니다, 귀하의 컴퓨터 또는 종이, 최선의 행동이 무엇인지 결정하고, 현실 세계로 돌아가서 그 행동을 취하십시오

이를 계산하기 위해 추가 경험이 필요하지 않습니다 그러나 강화 학습에서, 우리는 우리가 생각하고 싶지 않은 다른 추가적인 문제에 이것을 가지고 있습니다 내가 생각하기에 내가 지금까지 가지고있는 정보를 가지고 내가 할 수있는 최선의 일은, 하지만 내가 행동해야하는 방식은 무엇인가? 앞으로 좋은 결정을 내리는 데 필요한 정보 그래서, [NOISE] 너도 알다시피, 너는 아주 새로운 식당에 가고, 아, 새 마을로 이사한다고 가정 해 봅시다 당신은 거기에 단 하나의 식당 밖에 없습니다

당신은 첫날에 거기에 간다 그리고 그들은 5 개의 다른 접시를 가지고있다 오랫동안 거기에있을거야 그리고 당신은 최고의 요리에서 최적화하고 싶습니다 그리고 아마 첫날에 당신은 접시 하나를 시험해 볼 것입니다

그리고 둘째 날에는 접시 두 개를 먹고, 그리고 셋째 날 셋째 날, 그런 다음 당신이 모든 것을 시도 할 수 있도록 기타 등등 그 다음에 그것을 사용하여 어느 것이 가장 좋은 것인지 파악하십시오 장기적으로 당신은 정말 맛있는 것을 골라야합니다 따라서이 경우 에이전트는 어떤 결정을 내려야하는지 명시 적으로 생각해야합니다 그래서 미래에 좋은 결정을 내릴 수 있도록 필요한 정보를 얻을 수 있습니다

따라서, 계획의 경우, 그리고 이것이 이미 어려운 문제라는 사실, 음, 솔리테어 같은 것을 생각해보세요 이미 게임의 규칙을 알았 으면합니다 이것은 이동이나 체스 또는 다른 여러 시나리오와 같은 경우에도 마찬가지입니다 음, 당신이 행동을 취하면 알 수 있어요 다음 [NOISE] 상태의 확률 분포는 무엇인가? 이 점수를 사용하여 잠재적 인 점수를 계산할 수 있습니다

그리고 트리 검색이나 동적 프로그래밍 같은 것을 사용하면, 그리고 우리는 이것에 대해 훨씬 더 많은 이야기를 할 것입니다 [NOISE] 아, 특히 동적 프로그래밍 측면에서 사용할 수 있습니다 세계를 모델로 한 결정은 올바른 결정이 무엇인지 결정해야합니다 그러나 보강 학습 자체를 해결하십시오 규칙 책이없는 독방과 조금 더 비슷합니다

우리는 여기있는 것 뿐이며 어떤 일이 일어나고 있는지 관찰하고 있습니다 당신은 더 큰 보상을 얻으 려합니다 또한 사용자의 경험을 사용하여 명시 적으로 계산할 수도 있습니다 그 모델에서 모델을 계획하고, 그렇지 않을 수도 있으며 직접 정책이나 가치 기능을 계산할 수도 있습니다 자, 여기서 탐험과 착취 문제를 다시 강조하고 싶습니다

그래서, 화성 탐사선의 경우에만가는 것입니다 세계가 시도하는 행동에 대해 어떻게 작동하는지 알아보십시오 그래서, 상태 S2에서 왼쪽으로 가려고하면 거기에서 무슨 일이 일어나는 지 볼 수 있습니다 그리고 나서 바로 다음 행동을 결정할 수 있습니다 자, 이것은 분명하지만 딜레마로 이어질 수 있습니다

그들이 좋은 것처럼 보이는 것 사이에서 균형을 이룰 수 있어야합니다 이전 경험을 토대로, 미래에 좋을 것 같은 것들, 어쩌면 전에는 불행 해졌을 수도 있습니다 탐험에서 우리는 전에 시도한 적이없는 것들을 시도하는 것에 관심이 있습니다 또는 지금까지 나쁘게 보일지도 모른 일을 시도해서, 그러나 우리는 미래에 좋을 것이라고 생각합니다 그러나 착취는 우리가하는 것을 시도하고 있습니다

과거의 경험을 고려할 때 좋은 것으로 기대된다 그래서 여기에 세 가지 예가 있습니다 영화의 경우, 음, 착취는 좋아하는 영화를 보는 것과 같습니다 탐사가 새로운 영화를보고있다 그게 좋을 수도 있고 끔찍 할 수도 있습니다

광고는 지금까지 가장 높은 클릭률을 기록한 광고를 게재하고 있습니다 탐사가 다른 광고를 보여주고 있습니다 운전 착취는 이전 경험을 바탕으로 가장 빠른 경로를 시도하고 있습니다 탐사가 다른 길을 몰고있다 [알아들을 수 없는]

중대한 질문, 즉, 내가 준 예제에 대한 상상은 무엇입니까? 나는 너만 5 일 동안 마을에있을거야 음, 그리고 당신이 할 수있는 정책으로 만약 당신이 유한 한 지평선 환경에 있다면, 너가 너가가는 것을 너가 있있는 것과 동일하거나 다르 십시요 무한한 시간 동안이 안에서 살 수 있습니다 음, 다음에 대해 조금 더 이야기하겠습니다 아, 다음 시간이지만 아주 다른 음, 특히 음, 일반적으로 정책은 유한 한 수평선은 고정적이지 않다

즉, 음, 결정은 시간뿐만 아니라 상태에 달려 있습니다 무한한 수평선 경우에 가정은, 음, 최적 정책 및 마크 오프 설정은 고정되어 있으며, 이것은 당신이 같은 상태에 있다면 당신이 거기에 있는지 여부를 의미합니다 3 단계 또는 3 천 시간 단계로 당신은 항상 똑같은 일을 할 것입니다 음, 유한 한 수평선 경우에는 사실이 아니에요 그리고 그것의 중요한 예로서

그래서 우리는 왜 탐구합니까? 우리는 앞으로 사용할 수있는 정보를 배우기 위해 탐구합니다 그래서, 당신이 유한 한 지평선 환경에 있고 그것이 마지막 날인 경우 할리우드에서의 마지막 날, 너는 무엇을 해야할지 결정하려고하는 것을 알고있다 음, 당신은 이익이 없기 때문에 탐험하지 않을 것입니다 미래에 대한 탐험은 더 이상 결정을 내리지 않기 때문에, 그래서 그 경우에 당신은 항상 악용 할 것이고, 항상 악용하기에 최적입니다 그래서, 유한 한 수평선 경우, 음, 결정은 가치에 의존해야합니다

의사 결정 및 나머지 지평선을 변경하기 위해 얻는 정보 그리고 실제 상황에서 종종 이런 일이 발생합니다 네 얼마나 더 복잡 했니? 유한 한 지평선이 있지만이 위치가 어디인지 모릅니다 어, 제가 게임 이론에서 기억하고있는 것은 매우 복잡합니다

이게 어떻게 들리지? 문제는 내가 정의 할 수없는 수평선 문제라고 부르는 것에 관한 것입니다 유한 한 지평선이지만 매우 까다로울 수있는 것이 무엇인지 모릅니다 이를 모델링하는 한 가지 방법은 종료 상태의 무한한 수평 문제입니다 따라서 본질적으로 악취가 나는 상태가 있습니다 일단 프로세스가 끝나면 상태가 종료됩니다

게임에서 종종 발생합니다 음, 게임이 언제 끝날 지 모르지만 그것은 유한 할 것입니다 음, 그 대답은 형식주의에 넣는 한 가지 방법입니다 음,하지만 까다 롭습니다 그러한 경우 우리는 그것을 모델링하는 경향이 있습니다

무한한 수평선과 다른 종료 상태에 도달 할 확률을 살펴보십시오 [들리지 않음] 착취를 놓친다 탐험 본질적으로 subproblems, 나는 운전에 대한 particulary 것 좀 더 나은 것 같아 착취는 당신이 정말로 좋고 어쩌면 알고 있습니다

일부를 탐험하다 [들리지 않음] 완전히 새로운 길을 시도하는 것보다 그녀를 잘 알지 못한다 이 혼합이 탐사에서 어떻게 발생하는지에 관해서는, 착취와 어쩌면 자동차의 경우 아마 어쩌면, 음, 일종의, 어, 모든 것을 무작위로 시도하지 마십시오 좋은 소식이 필요할 수도 있습니다 음, 큰 질문 이네요 일반적으로 탐사 착취를 혼용하는 것이 좋습니다

어떤 경우에는 일찍 또는 적어도 동등한 탐사를하는 것이 가장 좋습니다 그리고 그것은 나중에 모든 정보에서 나왔습니다 결정 과정에 달려 있습니다 음, 우리는 상당한 돈을 쓸거야 탐사에 관한 중간 고사 이후의 과정, 착취, 그것은 확실히 강화 학습의 정말로 중요한 부분입니다, 음, 특히 높은 지분 도메인

중요도가 높은 도메인은 무엇을 의미합니까? 나는 사람들에게 영향을 미치는 도메인을 의미합니다 그래서 고객이든 환자 든 학생이든, 음, 이것이 우리가 내리는 결정이 실제 사람들에게 실제로 영향을 미치기 때문에 우리가 원하는 것입니다 가능한 한 빨리 배우고 가능한 한 빨리 훌륭한 의사 결정을 내리십시오 이에 대한 다른 질문이 있으십니까? 당신이 이전에 보지 못했던 상태에 있다면, 다른 더 나은 옵션이 있습니까? 그냥 나가기 위해 임의의 조치를 취하시겠습니까? 또는 이전에 경험하지 않았더라도 이전 경험을 사용할 수 있습니까? 질문은 훌륭합니다 이전에 결코 보지 못했던 새로운 상태에 있다면 똑같습니다

당신은 무엇을합니까? 무작위보다 더 나은 것을 할 수 있습니까? 또는 이전 경험을 어떻게 든 사용할 수 있습니까? 음, 정말 대단한 점 중 하나입니다 일반화를한다는 것은 우리가 심층 학습 또는 정보를 공유하려고하는 다른 표현 따라서 비록 [NOISE]가 정확히 방문한 국가가 아닐지라도 이전 정보를 공유하기 전에 할 수있는 행동이 무엇인지 알리십시오 물론 잘못된 방향으로 공유한다면, 음, 잘못된 결정을 내릴 수 있습니다 따라서 오버 슈트 – 지나치게 일반화하면 이전 경험을 과소 평가하고 실제로 새로운 시나리오에서 더 나은 조치를 취하십시오

이 질문이 있으십니까? 괜찮아 그래서, 우리가 이야기 할 것들 중 하나는 다음 몇 강의는이 트렌드 2입니다 평가와 통제라는 근본적인 문제 따라서 누군가가 당신에게 정책을 제공한다면 평가가 문제가됩니다 그들이 헤이 (hey) 인 경우 이것이 당신이해야 할 일이거나 이것이 당신 요원이해야 할 일입니다

이것이 로봇이 얼마나 좋은지 평가하기 위해 세계에서 행동해야하는 방식입니다 그래서, 우리는 매니저가 오라고 말한 것을 알 수 있기를 원합니다 이것이 고객에게 광고를 보여줘야하는 올바른 방법이라고 생각합니다 음, 그게 얼마나 좋은지 말해 줄 수 있니? 빠른 [들리지 않음]은 무엇입니까? 음, 정말 중요한 질문은 평가입니다 세계의 모델이 없다는 걸 알고 있습니다

따라서 외출하고 데이터를 수집해야 할 수도 있습니다 이 정책이 얼마나 좋은지를 아는 데 유용하다고 평가하십시오 너는 새로운 정책을 만들려고하지 않는다 아직 당신은 단지이 현재의 것이 얼마나 좋은지를 보려고하고 있습니다 그리고 나서 제어 문제는 최적화입니다

정말 좋은 정책을 찾으려고합니다 일반적으로 하위 구성 요소 평가 란 무엇 때문에 가장 좋은 것이 무엇인지 알 필요가 있기 때문입니다 최상은 정말 좋은 정책을 의미합니다 정책이 얼마나 훌륭한 지 어떻게 알 수 있습니까? 우리는 평가를해야합니다 이제 강화 학습의 정말 멋진면 중 하나 인 음, 그것은 종종 우리가 정책에서이 평가를 할 수 있다는 것입니다

즉, 다른 정책에서 수집 한 데이터를 다른 정책이 할 수있는 일의 역행을 평가하십시오 이것은 정말로 도움이됩니다 왜냐하면 모든 정책을 철저히 시험하지 않아도됩니다 그래서, 음,이 질문들이 어떻게 생겼는지에 관해서, 우리가 화성 탐사선 예제로 돌아 가면 정책 평가 누군가가 당신의 정책이 이것이라고 말하면, 모든 주에서 올바른 조치를 취할 때 취해야 할 조치 이것은 제가 걱정하는 할인 요소입니다, 음, 이 정책의 가치는 무엇인지 나와 비교해주십시오

제어 케이스에서, 그들은 정책이 무엇인지 알지 못한다고 말할 것입니다 나도 너 한테 정책이 무엇이든간에 내게 네가줬으면 좋겠어 보상의 최고 예상 할인 된 합계, 사실 여기에는 중요한 질문이 있습니다 괜찮아 보상에서 예상되는 할인 된 금액은 무엇입니까? 그래서, 그들은 특정 시작 상태에 관심을 가질 수 있습니다

그들은 내가 당신이 S4에서 시작한다고 가정하면서 최선의 정책을 이해하기를 원한다고 말할 것입니다 그들은 모든 출발 국가에서 최고의 정책을 계산하기를 원한다고 말할지도 모릅니다 음, 또는 평균의 일종 그래서 우리가 얻을 코스의 나머지 측면에서 – 네 배운 것이 가능한지 궁금 해서요

최적 정책과 보상 기능이 동시에 작용할 수 있는가? 예를 통해 내가 보상에 대한 리뷰를 믿을 수 있다면 포함되거나 어떤 종류의 행동을 위해 국가 일 것이고 그것은 틀린 것으로 드러났습니다 아, 우리는 다시 시작해야하고 최적의 정책을 세우거나 지금까지 배운 것을 사용할 수 있습니까? 또한 보상에 대한 믿음이있는 데이터의 가정 구성은 [들리지 않음]입니까? 가짜 질문입니다 괜찮아 제가 평가할 정책이 있다고 가정 해 봅시다 음, 보상 기능이 뭔지 모르겠지만 무엇을 알지 못합니다

최적의 정책이 있으며, 이것은 [안 들림] 매우 좋지 않다는 것을 알 수 있습니다 다시 시작해야하는지 또는 사용할 수 있습니까? 사전 경험을 통해 내가 시도하는 다음 정책이 무엇인지 알릴 수 있습니까? 아, 어쩌면 다른 정책 모음일까요? 일반적으로 이전 경험을 사용하여 다음 정책 모음을 시도 할 때 다음 정책이 무엇인지 알려주십시오 음, 거기에 약간의 경고가 있습니다 어, 네가하는 행동에 어떤 확률론이 필요해 그래서, 만약 당신이 오직 같은 것을 취하면 당신은 한 상태에서 하나의 행동을 알고 있습니다

당신은 다른 어떤 것에 대해서 정말로 배울 수 없습니다 음, 당신이 취할 행동들 그래서 여러분은 어떤 종류의 일반화 또는 어떤 종류의 확률론을 가정 할 필요가 있습니다 해당 정보가 다른 정책을 평가하려고 할 때 유용하도록 정책을 수정하십시오 이것은 정말로 중요한 문제입니다

이것은 일종의 역설적 인 추론의 문제이며 어떻게 우리가 우리의 오래된 데이터를 사용하여 우리가 미래에 어떻게 행동해야하는지 알아 내고, 이전 정책이 최적의 정책이 아닐 수도 있습니다 그래서 일반적으로 우리는 음, 우리는 정말 중요한 문제라고 많이 이야기 할 것입니다 그래서, 우리는 처음에 일종의 마르코프에 대해 이야기하기 시작할 것입니다 의사 결정 프로세스 및 계획 우리가 세상에 어떻게 작용 하는지를 우리가 아는 사람과이 평가를 어떻게 분류 할 것인가에 대해 이야기하고, 전환 모델과 보상 모델이 주어 졌음을 의미하며, 그렇지 않은 경우, 우리는 또한 모델없는 정책 평가 및 모델없는 제어를 제공합니다 우리는 다음에 시간을 할애 할 것입니다

심층 강화 학습 및 함수 근사법을 이용한 보강 학습 학습, 그것은 현재 상당히 성장하고있는 지역입니다 음, 음모를 꾸미려고 생각했습니다 얼마나 많은 논문이이 분야에서 진행되고 있는지 지금은 꽤 놀라운 것입니다 음, 그럼 우리는 많이 이야기 할거야 특히 로봇에서 실제로 생각하는 정책 검색 지금 가장 영향력있는 방법 중 하나입니다

탐사에 많은 시간을 할애 할뿐만 아니라, 몇 가지 고급 주제가 있습니다 그래서 우리가 한 일을 요약하면됩니다 오늘은 강화 학습에 관해 이야기하고 있습니다 AI 기계 학습의 다른 측면과 어떻게 다른가? 우리는 코스 물류를 거쳐 이야기를 시작했습니다 불확실성에 대한 순차적 의사 결정에 관한 것

다음 시간에 대한 간단한 메모처럼, 음, 강의 슬라이드를 게시하려고합니다 음, 사전 이틀 또는 당신이 끝날 때 미리 이틀 저녁을 알고, 수업 시간에 원하면 인쇄 할 수 있습니다 그리고 수요일에 너희들을 볼거야

Microsoft Introduction P6 Get Started with Azure Machine Learning

안녕하세요, 저는 Chris Lauren입니다 Azure 기계 학습에 관해 이야기 해주세요

하늘색 기계 학습이 도움이 될 것입니다 학습 기계 구축을 단순화하십시오 자동 기계를 사용하는 모델 공부 기술이나 원한다면 자신 만의 모델을 쉽게 만들 수 있습니다 우리를 사용하는 클라우드에서 나오는 규모 파이썬 SDK는 오픈 소스를 사용합니다 프레임 워크를 사용하면 Azure를 사용한 엔드 – 투 – 엔드 워크 플로우 같은 파이프 학습 기계 그 학습 기계에 대한 개발자 작업 훈련을 쉽게받을 수 있도록 도와주세요

클라우드 모델과 현재의 모델 사용하는 방법에는 여러 가지가 있습니다 Azure가 학습에 전원을 공급합니다 사전 훈련 된인지 서비스를 사용할 수있다 REST API 또는 Azure 기계 학습을 사용할 수 있습니다 맞춤형 모델 교육을위한 서비스 원하는 프레임 워크를 사용하십시오

PI 토치 및 텐서 흐름 포함 그들을 강하게 퍼뜨려 라 GPU CPU를 사용하는 인프라 또는 추측 가속화를위한 FPGA 최종 워크 플로우에는 준비 클라우드의 데이터는 다음과 같은 것을 사용합니다 귀하의 데이터 벽돌로 누른 다음 사용 선택한 IDE에서 파이썬 코드 자체 목성 대 코드를 사용하거나 PyCharm을 사용하십시오 모델을 교육하는 Python SDK 귀하와 귀하의 통계를 추적하십시오 모델 기차를 등록하고 배포 할 수 있습니다

구름에 또는 가장자리에 사용할 모든 것을 설정하십시오 Azure 파이프 학습 기계 이제 우리는 모델을 수평 확장하는 것이 매우 쉽습니다 우리의 강점을 사용하여 클라우드에서 교육 GPU 및 심지어 촉진 이 프로비저닝은 주문형 클러스터로 비용 만 지불하면됩니다 당신이 그들을 사용할 때 당신은 사용할 수 있습니다 Nvidia의 최신 GPU로 교육 모델 또는 FPGA를 사용할 수 있습니다

열차 모델 인쇄가 빠르다 당신은 훈련 된 모델을 가지고 있습니다 도커를 사용하여 클라우드에 배치 컨테이너 또는 가장자리에 인텔을 데려오다 귀하의 신청서가있는 지역의 어떻게 전개 할 지 보여 드리겠습니다 이것은 Azure 기계 학습을 사용하기 위해 나는 너에게 가져갈 방법을 보여줄 것이다 손으로 쓴 숫자의 그룹과 그들이 사용하는 숫자를 인식한다

손짓하지 않은 M 아래에서 볼 수있는 데이터 세트는 내가 가지고있는 것입니다 손으로 쓴 그룹과 나는 그것을 분류하여 이것들은 3 개이며 0과 그것은 내가 모델을 훈련시키는 데 도움이 될 것이다 Azure를 사용할 숫자를 인식하는 방법 내가 배우는 첫 번째 기계 논리적 인 작업 공간을 만든다 셀 수있는 컨테이너 실험 데이터를 타겟팅하십시오 숙련 된 학습 기계 저장 당신의 도커와 당신의 모델 이미지 서비스는 한 곳에서 모두 배포됩니다

팀이 일하기가 매우 쉽다 함께하면 돼 우리를 사용하기위한 작업 공간 콜 도트 파이썬 SDK는 논리적으로 매우 쉽습니다 진짜로 만드는 장면 뒤에 BLOB 데이터 저장 통찰력 응용 프로그램 및 기타 작성 그들을 하나로 묶어서 그들은 정말 사용하기 쉽다 나는 갈 것이다

앞에 나와 데이터 세트를로드하십시오 밥 매장과 강력한 공급 나 때문에 GPU 머신이 잔뜩 들었어 이미 가지고있어 나는 앞으로 나아갈거야 데모 속도를 높이는 시간 이 카운트를 가져갈 것입니다

목표는 GPU 클러스터라고 부릅니다 이것이 얼마나 쉬운 지 알 수 있습니다 최소 4 개의 VM이 있어야하며 최대 20 개까지 보낼 수 있습니다 내가 공부 한 클러스터의 작업 엔진은 나를 자동으로 키우고 줄일 것입니다 최신 국가를 얻을 수 있고 그 다음에 얼마나 많은 노드가 실제로 작동하는지 확인하십시오

지금이 일이 나를 시작하게 지금 실험을하고 실험은 추적 방법입니다 이 기계를 훈련시키는 나의 모든 노력 모델 및 모든 주요 학습 측정 항목 즉 이 실험을 실행할 때 중요합니다 내 자신의 Python 스크립트를 GPU에서 사용 내가 만든 클러스터 이 호출은 tensorflow로 넘겨진다 텐서 흐름 추정기 및 추정기 자동으로 매우 쉽다 주요 통계 및 규모 추적 다른 GPU 컴퓨터에서 평행 당신은 내가 이것을 앞으로 돌렸다는 것을 알 수있다

시간과 나는 모든 것에 접근 할 수있다 로그 파일은 내가 훈련 한 것처럼 다시 스트리밍됩니다 내 모델을 사용하면 얼마나 잘 잘 이해하고 있는지 목성을 사용하는 모델입니다 위젯을 여기, 지금 노트북에 매우 중요한 부분 중 하나 기계 학습 교육 모델은 이 하이퍼 매개 변수를 정상적으로 설정하십시오 수표를 추측하는 많은 사용자가 관련되어 있습니다

그것은 정말로 복잡하지만 나다 우리 하이퍼 드라이브 서비스를 사용할 수 있습니다 내가 결정할 수있게 해준다 내 매개 변수가 중요하다 방법을 결정하는 데 사용되는 정책 실적이 저조한 작업 취소 다른 작업과 비교하여 모델을 유지하십시오

누가 다시 최선을 다하니? 내가 줄 수있는 목성 위젯을 사용하라 실험은 정말 좋을거야 이 모든 것이 아닌 것은 Azure에 자동으로 저장됩니다 다른 사람들의 파란색 포털에서도 팀에서 나는 똑같은 통찰력을 얻을 수있다 어떻게 일이 일어나는 지 알 수 있습니다

이 실험 중 일부는 일찍 중단되었습니다 이 선들은 끝까지 간다 그것은 좋아하지 않기 때문입니다 뿐만 아니라 이러한 다른 실행 중 일부는 최고 품질의 메트릭스를 사용하고 싶습니다 모든 배치에서 사용하고 사용하지 않음 계산하고 지불하는주기를 버렸다

하지 않을 때 여분 계산하기 내가 제일 좋은 모델을 만든 후에 구름에 퍼질 수 있지만 전에는 퍼질 수있다 이게 얼마나 쉬운지를 보여주고 싶습니다 훈련하는 법을 모른다면 할 수 있어요 자신의 기계 학습 모델을 소유 할 수 있습니다 우리의 Auto ml 서비스를 사용하여 저에게 말하십시오

~ 싶다 예측 분류기 이 경우 숫자를 입력하고 이 데이터를 얻는 방법 및 의지 자동 학습 기계 학습 당신을 위해 모델을 많이 실행할 것입니다 평행하고 가장 좋은 것을 지금 선택하십시오 왜냐하면 방금 모델을 훈련 시켜서 해내 야합니다 그럼 우리가 가서 내가 보여줄거야

어떻게하면 Visual Studio를 사용할 수 있습니까? Visual Studio 코드 도구로 코드 작성 AI 확장 기능으로 나를 추적 할 수 있습니다 실험 대 당신이 나를 볼 수있는 코드 내가 사용하는 GPU 클러스터와 나 내가 얻은 것을 훈련시킨 모델을 가져라 내가 지금 보여줄 최고의 결과들 구름에 사용하는 방법 먼저 파이썬 스크립트를 작성해야합니다 실제로는 init과 이 함수를 실행하여 모델을 인쇄 할 수 있습니다 너를 퍼뜨려 라

마우스 오른쪽 버튼으로 클릭 만하면됩니다 실행하여 모델에서 서비스 배포 이 마법사를 통해 선택할 수도 있습니다 나는 이것을 푸른 색으로 퍼뜨려야한다 예를 들어, 제공 할 수있는 컨테이너 이름을 입력 한 다음 내가 보여준 인쇄본과 그럼 네가 줄 수있어 항의자를 신청하거나 선택할 수 있습니다

기본값을 선택한 다음 선택할 수 있습니다 모든 첩자가있는 첩자 파일 이것에 tensorflow 같은 의존성 내 항해사에 포함시키고 싶은 경우 그때 나중에 얻은 사진 파란색 제어 특성 얼마나 많은 CPU와 같은 샘플 컨테이너 코어 및 사용할 메모리 및 이제는 속도를 높이기 위해 퍼질 수 있습니다 내 업 과정이 내게 동원되었다 당신이 볼 수있는 서비스를 여기에서 할 수 있습니다 어디에서나 파이썬 코드를 사용하거나 곱슬 곱슬합니다

이 끝내기 명령은 웹을 출력한다 네가 볼 수있는 서비스 내가 앞으로 나아갈 것이다 이걸 실행하면 내 환경이 활성화 될거야 이것은 임의의 테스트 데이터를로드합니다 그리고 그것은 서비스를 부를 것이다

그래서 당신은 여기에서 볼 수 있습니다 웹에서 URL입니다 서비스와 나는 그것을 부름으로 얻었다 누가 여기에 URI를 인쇄 한 다음 예측이 3이고 레이블이 있음을 알 수 있습니다 3인데 사실이거나 당신입니다 일련의 개별 이미지를 전달할 수있다 큰 점수로 점수를 매기면 볼 수 있습니다

여기에 가치의 무리 환상적인 지금 똑같은 일을 할 수있어 목성 노트북에서 물론 어디서든 쉽게 쉽게 사용할 수 있습니다 각각에서 Azure 머신 학습 사용 당신이 그것을 사용하기로 선택한 도구 프레임을 사용하여 각 유형을 훈련 시키십시오 기계 학습 모델이 시작되었습니다 오늘 무료 기계 학습 교육 모델에서 모든 것에 대해 자세히 알아볼 수 있습니다

방금 전에 우리에게 말한 서비스 최신 블로그 게시물 또는 목성 걸리기 시험해 볼 수있는 샘플 노트북 나 자신이 잘 연결되어 있기를 바랍니다 보고 주셔서 감사합니다

11. Introduction to Machine Learning

광고 소재 아래에 다음 콘텐츠가 제공됩니다 커먼즈 라이센스

귀하의 지원은 MIT OpenCourseWare에 도움이 될 것입니다 무료 고품질 교육 자료를 계속 제공하십시오 기부 또는 추가 자료보기 수백 개의 MIT 과정에서 MIT OpenCourseWare 방문 ocwmitedu에서

오케이 다시 오신 것을 환영합니다 알다시피, 그시기가 우리는이 모든 일을하고 있습니다 그래서 내가 너에게 간단히 말하면서 내가 미소 지을 수 있는지 알아 보자 오늘부터 2 주간은 마지막 수업입니다

적어도 미소 짓는 가치가 있겠지? Guttag 교수는 웃고 있습니다 그는 그 생각을 좋아합니다 거의 다 왔어 마지막 두 강의 동안 우리가 뭘하고 있니? 우리는 선형 회귀에 대해 이야기하고 있습니다 그리고 나는 너에게 상기시키고 싶다

나는 실험 데이터가 있다고 생각했다 나는 다른 무게를 측정에 두는 봄의 ​​경우 변위 그리고 회귀 분석을 통해 우리는 모델을 추론 할 수있었습니다 해당 데이터에 맞게 그리고 어떤 경우에는 쉽습니다 예를 들어 선형 모델이 될 것이라는 것을 알았습니다

우리는 그 데이터에 맞는 최상의 라인을 찾았습니다 어떤 경우에는 유효성 검사를 사용할 수 있다고 말했습니다 실제로 우리가 최고의 모델을 찾기 위해 탐험 할 수있게 해줍니다 선형, 2 차, 3 차, 어떤 고차원 물건 그래서 우리는 그것을 모델에 대해 추론하기 위해 사용할 것입니다

그것은 다음 세 가지 주제에 대한 좋은 단서입니다 강의, 수업의 마지막 큰 주제, 이는 기계 학습입니다 그리고 제가 논쟁 할 것은, 당신이 실제로 그것이 학습의 예 그러나 그것은 우리가 기계 학습에 관해 이야기 할 때 이야기하고 싶습니다 항상 그렇듯이 독서 과제가 있습니다

이 책의 22 장에서는 이것에 대한 좋은 출발점을 제시합니다 그리고 그것은 다른 조각들과 함께 할 것입니다 기본적으로 개요를 작성하고 싶습니다 우리가하려고하는 것 그리고 저는 먼저 말하기 시작합니다

당신이 알고 있다고 확신 하듯이, 이것은 거대한 주제입니다 나는 코스 6에서 5 개의 과목만을 나열했습니다 모두 기계 학습에 중점을 둡니다 여기에는 다른 주제가 포함되지 않습니다 여기서 학습은 중심 부분입니다

그래서 자연 언어 처리, 전산 생물학, 컴퓨터 비전 로봇 공학은 모두 오늘 의지합니다 무겁게 기계 학습에 그리고 당신은 그 주제들에서도 그것들을 볼 것입니다 그래서 우리는 5 명의 과목을 압축하지 않을 것입니다 세 번의 강의로 그러나 우리가 할 일은 당신에게 소개를하는 것입니다

우리는 기본 개념에 대해 이야기하면서 시작하겠습니다 기계 학습 예제가있는 아이디어 및 기능에 대해 어떻게 이야기합니까? 예제를 나타내는데 어떻게해야합니까? 당신은 그들 사이의 거리를 측정합니다 시도의 거리 개념을 사용하십시오 방법으로 같은 것을 하나로 묶어 라

기계 학습을하는 것 그리고 우리는 결과적으로, 학습을하는 두 가지 표준 방법 중 하나는 분류 방법입니다 우리가 볼 수있는 예가 거기에 있습니다 "가장 가까운 이웃 k" 클러스터링 방법이라고하는 두 번째 클래스가 있습니다 분류는 내가 무엇을 할 때 잘 작동한다

레이블이 붙은 데이터를 호출합니다 제 예제에 레이블을 알고 있습니다 수업을 시도하고 정의하기 위해 그것을 사용하려고합니다 내가 배울 수있는, 그리고 잘 작동 클러스터링, 내가 데이터를 분류하지 않았을 때 그리고 우리는 그것이 몇 분 안에 의미하는 것을 보게 될 것입니다

그러나 우리는 당신에게 이것에 대한 초기의 견해를 줄 것입니다 Guttag 교수가 마음을 바꾸지 않는다면, 우리는 아마 당신에게 현재를 보여주지 않을 것입니다 정교한 기계 학습 방법 길쌈 신경 네트워크 (convolutional neural net) 또는 심층 학습 (deep learning) 뉴스에서 읽게 될 것들 하지만 당신은 무엇이 그것들 뒤에, 우리가 할 때 우리가 무엇을하는지 보면서 학습 알고리즘에 대해 이야기하십시오 내가 그것을하기 전에, 나는 너에게 지적하고 싶다

이것이 얼마나 널리 퍼져 있는지 그리고 나는 회색 머리로 인정할 것입니다 저는 1975 년 기계 학습이 시작된 AI에서 일하기 시작했습니다 할 아주 간단한 일 그리고 그것은보고 매력적이었습니다

40 년이 넘는 변화 그리고 당신이 그것에 대해 생각한다면, 당신이 그것을 보는 곳을 생각하십시오 AlphaGo, Google에서 기계 학습 기반 시스템 이기기 세계적 수준의 Go Player 체스는 이미 컴퓨터에 의해 잠시 동안 정복당했습니다 지금은 컴퓨터에 속합니다

세계 최고의 선수는 컴퓨터입니다 많은 사람들이 넷플 릭스를 사용합니다 모든 추천 시스템 인 Netflix, 아마존, 당신이 좋아하는 것을 골라 내고, 기계 학습 알고리즘을 사용합니다 너에게 물건을 제안해라 실제로 Google에서 보셨을 것입니다

Google에 팝업 광고가 게재됩니다 기계 학습 알고리즘에서 나온다 당신의 취향을보고 무서운 생각 마약 발견, 문자 인식 – 우체국 손으로 쓴 문자의 문자 인식을 사용 기계 학습 알고리즘 및 컴퓨터 비전 시스템 그 뒤에

당신은 아마이 회사를 모른다 그것은 실제로 Two Sigma라고 불리는 MIT 분사입니다 그것은 뉴욕의 헤지 펀드입니다 그들은 AI와 기계 학습 기술을 많이 사용합니다 그리고 2 년 전, 그들의 기금은 56 %의 수익을 냈습니다

나는 기금에 투자했으면 좋겠다 나는 너에게 필요한 수백만의 종류가 없다 그러나 그것은 인상적인 복귀입니다 1 년 동안 귀하의 돈을 56 % 반환합니다 작년에 그들은 꽤 잘하지 못했습니다

그러나 그들은 기계 학습 기술을 사용하여 매우 잘 수행합니다 시리 Mobileye라고하는 또 다른 위대한 MIT 회사 무거운 기계로 컴퓨터 비전 시스템을 작동시키는 것 보조 운전에 사용되는 학습 구성 요소 완전 자율 주행에 사용될 것입니다 브레이크에서 걷어차는 것과 같은 일을 할 것입니다 네가 너 앞에서 차에서 너무 빨리 닫는다면, 정말 나에게 좋지 않을거야

내가 보스턴 사람처럼 운전하기 때문에 그리고 그것은 끊임없이 시작될 것입니다 얼굴 인식 Facebook은 이것을 비롯하여 다른 많은 시스템을 사용합니다 얼굴을 감지하고 인식 할 수 있습니다

IBM 왓슨 – 암 진단 이것들은 모두 기계의 예일뿐입니다 학습은 어디서나 사용됩니다 그리고 그것은 정말로 있습니다 나는 단지 9 명을 골랐어

그래서 무엇입니까? 나는 불쾌한 성명을 발표 할 것입니다 이제는 익숙해 져 있습니다 네가 할 수 있다고 주장 할거야 거의 모든 컴퓨터 프로그램이 뭔가를 배웠다고 주장한다 그러나 학습 수준은 실제로 많이 다릅니다

그래서 여러분이 60001 년에 처음으로 강의를 생각해 보면, 우리는 제곱근 계산을위한 뉴튼의 방법을 보여주었습니다 그리고 당신은 논쟁 할 수 있습니다, 당신은 그것을 뻗어 야합니다, 그러나 당신은 그 방법이 제곱근을 계산하는 방법에 대해 알아 보겠습니다 사실, 당신은 모든 주문 권력의 근원으로 그것을 일반화 할 수 있습니다 그러나 그것은 실제로 배우지 않았습니다 나는 그것을 정말로 프로그램해야했다

괜찮아 지난 주에 우리가 선형 회귀에 대해 이야기했을 때를 생각해보십시오 이제 조금 더 느끼기 시작합니다 학습 알고리즘처럼 왜냐하면 우리는 무엇을했기 때문에? 우리는 당신에게 일련의 데이터 포인트를주었습니다

질량 변위 데이터 포인트 그리고 컴퓨터를 본질적으로 어떻게 할 수 있는지 보여주었습니다 해당 데이터 포인트에 곡선을 맞 춥니 다 그리고 어떤 의미에서는 데이터에 대한 모델을 배우는 것이 었습니다 그런 다음 행동을 예측하는 데 사용할 수 있습니다

다른 상황에서 그리고 그것은 무엇에 더 가깝습니까? 우리는 기계에 대해 생각할 때 좋을 것입니다 학습 알고리즘 우리는 경험을 통해 배울 수있는 프로그램을 갖고 싶습니다 새로운 사실을 추론하는데 사용할 수있는 무언가

이제 AI에서 오랜 시간 동안 문제가되었습니다 그리고 저는이 견적을 좋아합니다 Art Samuel이라는 신사 출신입니다 그가 말한 인용문은 1959 년이다 기계 학습에 대한 그의 정의 컴퓨터에주는 연구 분야입니다

명시 적으로 프로그래밍하지 않고 배우는 능력 그리고 많은 사람들이 논쟁 할 것이라고 생각합니다 그는 그러한 첫 번째 프로그램을 썼다 경험을 통해 배웠습니다 그의 경우에는 체커를 사용했습니다

종류는 분야가 어떻게 진보했는지 보여줍니다 그러나 우리는 체커로 시작했고, 체스에 도착했습니다 이제 우리는 이동합니다 그러나 체커를 사용했습니다 가장 중요한 것은 국가 수준의 선수를 이기고, 그것의 방법을 향상시키는 것을 배웠다

그것이 게임에서 어떻게 이루어 졌는지 관찰하고 무언가를 추론함으로써 그것이 그랬던 것처럼 생각했던 것을 바꿀 수 있습니다 사무엘은 다른 일들을 많이했습니다 나는 단지 하나를 강조했다 당신은 과정에 따라 계속 볼 수 있습니다, 그는 알파 베타 가지 치기 (Alpha-Beta Pruning)를 발명했습니다 검색을 수행하는 데 정말로 유용한 기술입니다

그러나 아이디어는 컴퓨터를 어떻게 배우게 할 수 있는가입니다 명시 적으로 프로그래밍하지 않고? 이것에 대해 생각하는 한 가지 방법은 어떻게 우리가 정상적으로 프로그램 및 우리가 기계 학습에서 원하는 것 연산 정상적인 프로그래밍, 당신이 확신하지 못한다는 것을 압니다 정상적인 프로그래밍과 같은 것이 있습니다 그러나 전통적인 프로그래밍을 생각한다면, 그 과정이 뭐야? 나는 컴퓨터에 입력 한 프로그램을 쓴다

데이터를 가져 와서 적절한 출력 그리고 제곱근 찾기가 실제로 거기에 앉아 있습니다 나는 Newton 방법을 사용하여 제곱근을 찾는 코드를 작성했다 그리고 나서 그것은 주어진 숫자의 과정을 내게주었습니다 제곱근을 줄께

그러나 지난 번에 우리가 한 일에 대해 생각한다면, 그것은 조금 달랐다 그리고 실제로, 기계 학습 접근법에서, 아이디어는 컴퓨터 출력을 줄 것입니다 내가 그 프로그램이하기를 원하는 것의 예를 들어 줄 것이다 데이터, 특성화에 관한 라벨 다른 종류의 사물들 컴퓨터에서해야 할 일 출력과 데이터의 특성을 고려할 때, 나는 그 기계 학습 알고리즘을 원했다

실제로 나를 위해 프로그램을 제작하려면, 그 다음에 추론에 사용할 수있는 프로그램 사물에 대한 새로운 정보 그리고, 당신이 원한다면 정말로 멋진 루프를 만듭니다 내가 기계 학습 알고리즘을 가질 수있는 곳 내가 사용할 수있는 프로그램을 배워라 다른 문제를 해결할 수 있습니다 우리가 할 수 있다면 정말 좋을 것입니다

그리고 내가 제안한 것처럼, 커브 피팅 알고리즘 그것의 간단한 버전입니다 그것은 데이터에 대한 모델을 배웠습니다 데이터의 다른 모든 인스턴스에 레이블을 붙일 때 사용한다 또는 스프링 변위의 관점에서 볼 수있는 것을 예측하십시오 나는 대중을 바꿨다

이것이 우리가 탐구 할 아이디어의 종류입니다 우리가 사물을 배우고 싶다면 우리도 할 수 있습니다 물어 보니, 어떻게 배울 수 있니? 그리고 컴퓨터는 어떻게 배워야합니까? 자, 인간으로서의 당신에게는 몇 가지 가능성이 있습니다 이것은 지루한 것입니다 이것은 이전 스타일의 방법입니다

사실을 암기하십시오 가능한 한 많은 사실을 암기하고 우리가 당신에게 묻기를 바랍니다 그 사실들의 최종 시험 사례에서, 당신이 암기하지 않은 다른 사실 들과는 대조적입니다 이것은 첫 번째 강의로 돌아가 생각하면, 선언적 지식의 예, 진리의 진술 최대한 많은 것을 암기하십시오

뒷 주머니에 위키 피 디아가 있습니다 배울 수있는 더 나은 방법은 추론하고 추론 할 수 있어야합니다 오래된 정보 그리고 이것에 대해 생각하면이 우리가 명령적인 지식이라고 불렀던 것에 더 가까워졌습니다 새로운 것을 추론하는 방법

이제 첫 번째 경우에는 그 때 우리는 제곱근을하기위한 프로그램을 작성했습니다 그러나 학습 알고리즘에서 우리가 원하는 것은 무엇입니까? 그 일반화 아이디어와 훨씬 더 비슷합니다 우리는 우리의 역량을 확장하는 데 관심이 있습니다 유용한 정보를 추측 할 수있는 프로그램 작성 데이터의 암시적인 패턴으로부터 그래서 명시 적으로 구축 된 것이 아닙니다

무게와 변위의 비교처럼, 실제로는 데이터에 암묵적인 패턴이 있지만, 그리고 그 알고리즘이 그 패턴이 무엇인지를 파악하게하고, 그것들을 사용하여 프로그램을 생성하십시오 객체에 대한 새로운 데이터를 유추하는 데 사용할 수 있습니다 문자열 변위에 관한 것, 뭐든간에 그것은 당신이하려고하는 것입니다 승인 그래서 그 아이디어는 기본적인 패러다임입니다

우리가 볼 것입니다 체계에게 약간 훈련을주기 위하여려고하고있다 데이터, 일부 관측 우리는 단지 봄철 변위로 그 일을 마지막으로했습니다 우리는 시도하고 방법이있을거야 알아 내려면 어떻게 코드를 작성해야합니까? 어떻게해야합니까? 프로그램을 작성하고, 뭔가를 추론 할 시스템 데이터를 생성 한 프로세스에 대해? 그런 다음에, 우리는되고 싶습니다

사물에 대한 예측을 할 수있다 우리는 전에 보지 못했습니다 그래서 다시, 나는이 지점을 집으로 운전하고 싶다 생각해 보면 스프링 예제가 해당 모델에 적합합니다 나는 일련의 데이터, 공간 편차를 주었다

질량 이동에 비례한다 다른 질량의 경우, 스프링은 얼마나 멀리 움직였습니까? 나는 그 때 근본적인 과정에 관하여 무언가를 추론했다 첫 번째 경우에는 직선이라는 것을 알았고, 그러나 실제로 선형 방정식이 무엇인지 알아 내도록하겠습니다 그와 관련된 스프링 상수는 무엇입니까? 그 결과를 토대로 코드 조각이 생겼습니다 새로운 변위를 예측하는 데 사용할 수 있습니다

따라서 모든 요소, 교육 자료, 추론 엔진, 그리고 능력 그것을 사용하여 새로운 예측을하십시오 그러나 그것은 매우 단순한 종류의 학습 설정입니다 그래서 더 일반적인 것이 내가 있습니다 예로서 사용하려고합니다 내가 너에게 일련의 예제들을 줄 때, 이 예제들은 그들과 관련된 어떤 데이터를 가지고있다

일부 기능 및 일부 레이블이 있습니다 각 예를 들어, 나는 이것을 말할지도 모릅니다 특별한 종류의 것입니다 이 다른 것은 또 다른 종류의 것입니다 그리고 내가하고 싶은 건 알아내는거야

새로운 것을 표기하는 것에 대한 추론을하는 법 그래서 그것은 질량의 변위가 무엇인지, 그것은 실제로 레이블입니다 그리고 내가 좋아하는 예제 중 하나를 사용할 것입니다 나는 큰 뉴 잉글랜드 애국자 팬이고, 네가 아니라면, 나는 사과한다 그러나 나는 축구 선수를 사용할 것입니다

그래서 나는 잠시 후에 너를 보여줄거야 나는 축구 선수의 예를 들어 줄 것이다 라벨은 그들이 플레이하는 위치입니다 그리고 그 데이터는 많은 것들이 될 수 있습니다 키와 몸무게를 사용합니다

하지만 우리가하고 싶은 것은 우리는 어떻게 특성화하는 방법을 생각해 낼 것인가? 무게와 높이가 어떻게 예측되는지에 대한 함축적 인 패턴 이 플레이어가 플레이 할 수있는 위치의 종류 그런 다음 알고리즘을 제안하십시오 새로운 선수의 위치를 ​​예측할 것입니다 내년 초안을 작성하겠습니다 우리는 그들이 어디에서 놀기를 원합니까? 그것이 바로 패러다임입니다

잠재적으로 라벨이 붙은 잠재적 인 관찰 세트 모델을 찾기 위해 추론을하는 방법을 생각해보십시오 그런 다음 어떻게 그 모델을 사용하여 예측을 내릴 수 있습니까? 우리가 볼 것이고 우리는 오늘 여러 가지 예를 보게 될 것입니다 그 학습을 할 수 있다는 것입니다 매우 넓은 두 가지 방법 중 하나로 첫 번째는 감독 학습이라고합니다 그리고이 경우, 새로운 예가있을 때마다 나는 당신을 훈련 자료의 일부로 제공합니다

나는 그것에 레이블이있다 나는 그것이 어떤 종류의 것을 안다 그리고 내가 할 일은 관련 레이블을 예측하는 규칙을 어떻게 찾습니까? 이러한 예를 바탕으로 보이지 않는 입력이 있습니다 라벨이 무엇인지 알기 때문에 감독하에 있습니다 두 번째 종류, 이것이 감독 될 경우, 분명한 다른 사람은 감독자가 아닌 사람이라고합니다

이 경우, 저는 여러분에게 많은 예제를 제공 할 것입니다 그러나 나는 그들과 관련된 레이블을 모른다 나는 단지 무엇을 찾으려고 노력할 것이다 이 예제를 그룹화하는 자연스러운 방법입니다 함께 다른 모델로

어떤 경우에는 얼마나 많은 모델이 있는지 알 수 있습니다 어떤 경우에는, 내가 말하고자하는 것이 있습니다 내가 찾을 수있는 최고의 그룹 승인 오늘 제가해야 할 일은 많은 코드가 아닙니다

나는 그것을 위해 환호 할 것을 기대하고 있었다, John 그러나 나는 그들을 얻지 않았다 코드가 많지 않습니다 제가 할 일은 기본적으로 당신을 보여주는 것입니다, 이 학습을하는 직관 그리고 나는 뉴 잉글랜드 패트리어트의 예에서 시작할 것입니다

그래서 현재 애국자 선수에 관한 몇 가지 데이터 포인트가 있습니다 그리고 두 종류의 직책을 가지고 있습니다 나는 수신기를 가지고 있고, 보선사가있다 그리고 각각의 이름은 단지 이름으로 표시되고, 높이는 인치로 표시되며, 그리고 파운드로 무게 승인? 각 5 명

만약 내가 그것들을 2 차원 플롯으로 플롯하면, 이것이 내가 얻는 것입니다 승인? 별거 아니야 내가 뭘하려고하는거야? 나는 배우려고 노력하고있어, 그들의 특성이있다 두 클래스를 서로 구별합니까? 그리고 레이블이없는 경우에는 예제의 집합입니다 그래서 내가하고 싶은 것은 무엇을 결정할 것인가? 두 명의 플레이어가 보는 것을 목표로 비슷하게 만듭니다

이 분배를 두 개 이상으로 분리 할 수 ​​있습니까? 자연 그룹 비슷한 거리 측정입니다 그것은 값으로 두 가지 예제를 취하는 방법을 말합니다 또는 관련 기능과 얼마나 멀리 떨어져 있을지 결정할 것입니까? 그리고 레이블이없는 경우에, 그것을하는 간단한 방법은, 거기에 최소한 k 개의 그룹이 있다는 것을 알고 있다면 – 이 경우, 나는 거기에 있다고 말할 것입니다 거기에 두 개의 다른 그룹 – 어떻게하면 물건을 모으는 것이 최선인지 결정할 수 있어요

함께 하나의 그룹에있는 모든 예를 서로 가깝고, 다른 그룹의 모든 예 서로 가깝고 합리적으로 멀리 떨어져 있습니다 그것을 할 수있는 많은 방법이 있습니다 나는 너에게 하나를 보여 주겠다 이것은 매우 표준적인 방법이며 기본적으로 다음과 같이 작동합니다 내가 아는 전부는 거기에 두 개의 그룹이 있다는 것입니다, 나는 따기로 시작할 것입니다

나의 모범이되는 두 가지 예 무작위로 선택하십시오 사실 무작위로는 좋지 않습니다 나는 너무 가깝게 선택하고 싶지 않다 나는 그들을 멀리 떨어져 선택하려고 노력할 것이다

그러나 나는 두 가지 예를 나의 모범으로 택한다 그리고 훈련 데이터의 모든 다른 예들에 대해서, 나는 그것이 어느 것에 가장 가깝습니까? 내가하려고 할 일은 클러스터를 만드는 것입니다 거리가 그 클러스터의 모든 예들 사이의 차이는 작습니다 평균 거리가 작습니다 그리고 클러스터를 찾을 수 있는지 확인하십시오

두 클러스터의 평균 거리를 구합니다 가능한 한 작다 이 알고리즘은 두 가지 예제를 선택하여 작동합니다 단순히 다른 말로 클러스터링 그 예제에 가장 가까운 그룹에 넣으십시오 그 클러스터가 생기면 그 그룹의 중간 요소를 찾으러 갈 것입니다

중간이 아니라 중심에 가장 가까운 것이 무엇입니까? 그리고 그것들을 모범으로 삼아 그 과정을 반복하십시오 몇 번이나 해보겠습니다 또는 내가 그 과정에서 어떤 변화도 가져올 때까지 따라서 거리에 따라 클러스터링됩니다 그리고 우리는 잠시 후에 다시 돌아올 것입니다

그래서 여기에 내 축구 선수가있을 것입니다 내가 방금 무게에 기초하여 이것을했다면, 자연 분열선이 있습니다 그리고 그것은 일종의 이해가됩니다 괜찮아? 이 세 가지는 명백히 군집되어있다 그리고 다시, 그것은 바로이 축에 있습니다

그들은 모두 여기에 있습니다 이 7 명이 다른 곳에 있습니다 거기에 자연적인 구분선이 있습니다 내가 높이를 기준으로 그것을한다면, 깨끗하지는 않은 것입니다 이것은 내 알고리즘이 나온 것입니다

여기에 최고의 분할 선으로, 다시 말해이 축을 기반으로 한이 네 가지가 서로 가깝다 이 6 개는 서로 가깝습니다 그러나 거의 깨끗하지는 않습니다 그리고 그것은 우리가 보게 될 이슈의 일부입니다 최상의 클러스터를 찾는 방법은 무엇입니까? 신장과 체중 모두를 사용하면 그것을 얻으십시오

그것은 실제로 친절합니다 맞습니까? 그 세 클러스터 함께 그들은 서로 가까이 있고, 비행기에서 단지 거리의 관점에서 그 7 명은 서로 가깝다 여기를 통해 자연스럽고 분명한 선이 있습니다

그리고 사실 그것은 저에게 분류자를줍니다 이 선은 등거리 선입니다 그 두 클러스터의 중심 사이 의미,이 선을 따라 어떤 지점 그 그룹의 중심까지의 거리가 같다 그것은 그 그룹에있는 그대로입니다

그리고 새로운 예가 될 수 있습니다 선상에 있다면, 그 레이블을 얻는다 고 말하면, 그것이 라인 아래에 있다면, 그 라벨을 가져옵니다 잠시 후에, 우리는 다시 보러 올 것이다 거리를 어떻게 측정할까요? 그러나 여기의 아이디어는 꽤 간단합니다 서로 가까이서 그룹을 찾고 싶다

다른 그룹과는 거리가 멀다 이제 실제로이 선수들에 대한 레이블을 알고 있다고 가정 해 봅시다 이들은 수신기입니다 그것들은 보선 자들입니다 축구 팬 이신 분들께서, 너는 그것을 알아낼 수있다, 그렇지? 그것들은 두 개의 단단한 끝이다

그들은 훨씬 큽니다 그게 베넷이라고 생각해 네가 진짜라면 그로크 야 큰 애국자 팬 그러나 그것들은 단단한 끝이고, 그것들은 넓은 수신기이며, 그리고 그것은 두 번째로 다시 올 것입니다, 그러나 레이블이 있습니다

이제 내가하고 싶은 말은, 내가 유리하게 활용할 수 있다면 말이다 라벨을 아는 것,이 그룹을 어떻게 나눌까요? 그리고 쉽게 볼 수 있습니다 이 경우 기본 아이디어는 내가 해당 지형지 물에 라벨이 지정된 그룹이 있습니다 공간, 내가하고 싶은 것은 자연스럽게 그 표면을 발견하는 것이다 그 공간을 나눕니다

이제 지 하 표면은 멋진 단어입니다 그것은 2 차원의 경우에, 나는 최고의 라인이 무엇인지 알고 싶다 한 줄을 찾을 수 있으면 모든 예제가 분리됩니다 두 번째 레이블의 모든 예제에서 한 레이블 예제가 잘 분리되어 있다면, 이것은하기 쉽고 훌륭합니다

하지만 어떤 경우에는 일부 예제가 더 복잡하기 때문에 서로 매우 가까울 수 있습니다 그리고 그것은 문제를 제기 할 것입니다 너는 마지막 강연을 보았다 나는 지나치게 피하는 것을 피하고 싶다 나는 정말로 복잡한 표면을 만들고 싶지 않다

물건을 나눌거야 그래서 우리는 몇 가지 잘못을 용인해야 할 수도 있습니다 우리가 그것을 꺼낼 수 없다면 라벨이 붙은 것들 그리고 당신이 이미 알아 낸 것처럼,이 경우, 라벨이있는 데이터에는 가장 적합한 맞춤 라인이 있습니다 바로 거기

280 파운드를 초과하는 사람은 누구나 훌륭한 직계 인이 될 것입니다 280 파운드 미만의 사람은 수신기가 될 가능성이 큽니다 승인 그래서 나는 생각하려고하는 두 가지 다른 방법이있다 이 라벨링에 대해서

나는 두 번째로 다시 돌아올 것입니다 이제 새로운 데이터를 추가한다고 가정 해 봅시다 새 인스턴스에 레이블을 지정하려고합니다 이제 이들은 실제로 다른 지위의 선수들입니다 이들은 등판대입니다

그러나 나는 내가 알고있는 전부는 수신기와 보선 자다는 것이다 나는이 두 가지 새로운 데이터 포인트를 얻는다 나는 그들이 더있을 가능성이 있는지 알고 싶다 수신기 또는 보선사? 그리고이 두 신사 분들을위한 데이터가 있습니다 그래서 내가 지금 계획을 세우면, 오, 당신은 그 문제들 중 하나에 주목합니다

그래서 내 보선 자들이 있고, 빨간 자들은 내 수신기입니다 검은 색 점 두 개는 두 개의 등판입니다 그리고 여기서 바로 주목하십시오 그 둘을 분리하는 것은 정말로 어려울 것입니다 서로의 예

그들은 서로 너무 가깝습니다 그리고 그것은 하나의 사물이 될 것입니다 우리는 서로 교환해야합니다 그러나 내가 배운 것을 분류 자로 사용하는 것에 대해 생각한다면 레이블이없는 데이터의 경우에는 두 개의 클러스터가있었습니다 이제 보시다시피 흥미로운 예가 있습니다

내가 말할 수있는이 새로운 예는 분명히 보선공보다 수신기처럼 하지만 저기있는 사람은 분명하지 않습니다 거의 정확히 그 분할 선에 놓여 있습니다 그 두 클러스터 사이 그리고 저는 클러스터링을 재고하고 싶습니다

또는 나는 말하고 싶다, 당신은 무엇을 압니까? 아시다시피 아마 여기에는 두 개의 클러스터가 없을 것입니다 어쩌면 세 가지가있을 수 있습니다 그리고 나는 그것들을 조금 다르게 분류하고 싶습니다 그래서 나는 다시 돌아올 것이다 다른 한편, 만약 내가 라벨 데이터를 사용했다면, 내 분할 선이 있었다

이것은 정말 쉽습니다 이 두 가지 예는 모두 분명합니다 분할 선 아래 그것들은 분명히 내가보기에 수신기처럼 더 많은 것으로 분류 그들은 보선 자보다 낫다 그리고 그것이 축구의 예라는 것을 압니다

축구를 좋아하지 않는다면 다른 예를 선택하십시오 하지만 왜 내가 할 수 있는지 레이블이있는 경우와 레이블이없는 경우에서 데이터를 사용하십시오 클러스터를 만드는 다양한 방법을 생각해 내야합니다 그래서 우리는 다음 2 일 동안 무엇을 할 것인가? 1 / 2 강의는 어떻게 우리가 물건을 분리하는 방법을 배우려면 코드를 작성하시오 우리는 레이블이없는 데이터를 기반으로 모델을 배울 것입니다

라벨이 무엇인지 모르겠다 단순히 물건을 함께 모으는 방법을 찾으려고 노력한다 인근에서 클러스터를 사용하여 레이블을 할당합니다 새로운 데이터 그리고 우리는 라벨 데이터를보고 모델을 배울 것입니다

우리가 어떻게 분리하는 방법을 생각해 내는지 가장 잘 보아라 선 또는 비행기 또는 선의 모음이있는 예 한 그룹에서 다른 그룹의 예제로 우리가 지나치게 맞추는 것을 피하고 싶다는 인정으로, 우리는 정말로 복잡한 시스템을 만들고 싶지 않습니다 결과적으로 우리는 무엇을 트레이드 오프해야 하는가? 우리는 가양 성 및 거짓 음성을 호출합니다 그러나 그 결과 생성 된 분류기는 임의의 새로운 데이터 당신이 존경심을 가지고 어디에 있는지 결정하는 것만으로 그 분리 선으로 그래서 여기에 다음 2 장에서 보게 될 것이 있습니다 1/2 강의

모든 기계 학습 방법에는 5 가지 필수 구성 요소가 있습니다 우리는 훈련 자료가 무엇인지 결정해야합니다 그리고 그 시스템의 성공을 어떻게 평가할 것인가 우리는 이미 그것의 몇 가지 예를 보았습니다 우리는 어떻게 갈 것인지 결정할 필요가있다

우리가 제공하는 각각의 인스턴스를 나타냅니다 나는 축구 선수의 키와 몸무게를 선택했다 하지만 나는 평균 속도를 선택하는 편이 나을지도 모른다 또는, 나는 팔 길이, 다른 것을 모른다 올바른 기능이 무엇인지 어떻게 알 수 있습니까? 그리고 그것과 관련해서 거리를 어떻게 측정할까요? 그 기능들 사이에? 어떻게하면 가까운 것이고 가까운 것이 아닌지 어떻게 결정합니까? 어쩌면 그것은 무게와 높이의 관점에서 달라야 만합니다

예를 들면 나는 그 결정을 내릴 필요가있다 그리고 그것들은 우리가 가진 두 가지 것입니다 오늘의 예를 보여줄 것입니다 어떻게해야할까요? 다음 주부터 Guttag 교수 어떻게 그걸 가져 와서 실제로 시작하는지 보여 줄거야

측정 클러스터링의보다 상세한 버전을 구축하고, 유사성을 측정하여 객관적인 기능을 찾을 수 있습니다 사용할 최상의 클러스터가 무엇인지 결정하기 위해 최소화하려고합니다 그런 다음 원하는 최적의 최적화 방법은 무엇입니까? 그 모델을 배우는 데 사용합니다 이제 기능에 대해 이야기 해 봅시다 레이블이 있거나없는 예제 세트가 있습니다

나는 그 예들에 대해 그것이 무엇인지 결정할 필요가있다 내가 원하는 것을 결정할 때 유용하다 다른 물건에 가깝거나 가깝다 그리고 문제 중 하나는, 그것이 정말로 쉽다면, 정말 쉬울 것입니다 기능은 항상 원하는 것을 캡처하지 않습니다

나는 축구 비유에 대해 자세히 설명 할 것이다 그러나 왜 나는 신장과 체중을 선택 했습니까? 쉽게 찾을 수 있었기 때문에 뉴 잉글랜드 패트리어트에서 일하면 당신이 묻고있을 때 당신이 정말로 바라는 것입니다 올바른 기능은 무엇입니까? 아마도 다른 것들의 조합 일 것입니다 디자이너로서, 당신은 무엇을 말해야합니까? 내가 사용하고 싶은 기능입니다

그 견적은, 그런데, 20 세기의 위대한 통계 학자들 중 나는 그것을 잘 포착한다고 생각한다 따라서 프로그래머로서의 기능 공학은, 기능이 무엇인지 둘 다 결정할 때까지 내려옵니다 나는 그 벡터에서 내가 조립하려고하는 것을 측정하고 싶다 무게를다는 상대적 방법을 어떻게 결정합니까? 그래서 존과 아나, 나는 우리 일을 할 수 있었을거야 우리가 앉아 있었다면이 용어는 정말 쉬웠다

임기 초에 말했듯이, 당신도 알다시피, 우리는이 과정을 여러 번 가르쳤습니다 우리는에서 데이터를 가지고, 나도 몰라, 존, 수천 명의 학생, 아마도 이번에 끝났을 것입니다 조금 학습 알고리즘을 만들자 이는 일련의 데이터를 취해 최종 성적을 예측합니다 수업에 오지 않아도됩니다

모든 문제를 해결해야한다 우리는 당신의 최종 성적을 예측할 것이기 때문에 멋지지 않니? 우리 일을 좀 더 쉽게 만들고, 그렇지 않을 수도 있습니다 그 아이디어처럼 하지만 그 성적 예측에 대해 생각해 볼 수 있을까요? 이제 내가이 예를 말하는 이유는 무엇입니까? 내가 몇 가지 미소를 지을 수 있는지 알아보기 위해 노력했다

나는 그들 중 몇 명을 보았다 하지만 기능에 대해 생각해보십시오 나는 무엇을 측정합니까? 사실, 나는 그의 아이디어이기 때문에 이것을 John에게 줄 것이다 그는 무엇을 측정하겠습니까? 글쎄, GPA는 아마도 성능의 나쁜 예측 인자가 아닙니다 너는 다른 과목에서 잘한다

이 수업에서 잘 할 것 같습니다 나는 이것을 아주 조심스럽게 사용할 것입니다 사전 프로그래밍 경험은 적어도 예측 변수입니다 그러나 완벽한 예측 인자는 아닙니다 이전에 프로그래밍하지 않은 여러분, 이 수업에서는 여전히이 수업에서 정말 잘 할 수 있습니다

하지만 다른 프로그래밍을 본 적이 있다는 표시입니다 언어 반면에 나는 점성술을 믿지 않는다 그래서 나는 네가 태어난 달을 생각하지 않는다 네가 태어난 점성학 기호 아마 당신이 프로그램을 얼마나 잘 할 것인가와 관련이 있습니다

나는 눈 색깔이 할 일이 없다는 것을 의심한다 당신이 얼마나 잘 프로그램 할 수 있는지 당신은 아이디어를 얻습니다 일부 기능은 중요하지만 다른 기능은 그렇지 않습니다 이제는 모든 기능을 포기하고 기계 학습 알고리즘이 원하는 것을 분류합니다

그것들에서 지키지 않는 것 그러나 나는 당신에게 지나치게 적합하다는 생각을 상기시킵니다 내가 그렇게한다면, 위험이있다 그것은 출생 사이에 어떤 상관 관계를 발견 할 것이다 월, 눈 색깔 및 평균 점수

그리고 그것은 결론을 이끌 것입니다 우리는 정말로 싫어한다 그런데, 당신이 걱정하는 경우에 대비해서, 나는 당신에게 Stu Schmill 입학 학과장 당신을 선택하는 기계 학습을 사용하지 않습니다 그는 사실 여러 가지 물건을 본다 그를 기계로 교체하는 것이 쉽지 않기 때문에 – 아직

괜찮아 그래서 이것은 우리가 생각해야 할 우리는 어떻게 기능을 선택합니까 그리고 대부분, 우리가하려는 일은 신호대 잡음비라고 불리는 것을 최대화하는 것입니다 가장 많은 정보를 담고있는 기능을 최대한 활용하십시오 그렇지 않은 것을 제거하십시오

그래서 저는 어떻게 당신에게 어떻게 보여줄 것인가? 너는 이것에 대해 생각할지도 모른다 나는 파충류에 라벨을 붙이고 싶다 나는 동물에게 라벨을 붙이는 방법을 생각해 내고 싶다 그들은 파충류인가 그렇지 않은가? 그리고 저는 여러분에게 한 가지 예를드립니다 하나의 예를 들어, 당신은 정말로 많이 할 수 없습니다

그러나이 예에서 코브라, 알을 낳고, 그것은 비늘을 가지고 있고, 유독하며, 냉혈하고, 그것은 다리가 없으며 그것은 파충류입니다 그래서 저는 파충류 모형이 훌륭하다고 말할 수 있습니다 나는 확실하지 않다 아직 충분한 데이터가 없습니다 하지만 두 번째 예를 들어 주면, 그리고 그것은 또한 우연히 알을 낳는 것입니다

비늘, 유독 한, 냉혈한, 다리가 없습니다 내 모델이 맞지, 그렇지? 완벽 하 게 합리적인 모델, 내가 그것을 디자인 여부 또는 기계 학습 알고리즘은 이 모든 것이 사실이라면 파충류로 분류해라 승인? 그리고 이제 나는 보아 수축자를 준다 아 그것은 파충류입니다

그러나 그것은 모델에 맞지 않습니다 그리고 특히, 그것은 알을 낳지 않습니다 그리고 그것은 유독하지 않습니다 그래서 모델을 수정해야합니다 또는 알고리즘이 모델을 수정해야합니다

그리고 이것, 나는 당신에게 상기시키고 싶습니다 그래서 다섯 가지 기능으로 시작했습니다 이것은 적합하지 않습니다 그래서 내가해야 할 일은 그것을 줄이는 것입니다 나는 비늘을 볼 것입니다

나는 냉혈한 사람을 볼 것입니다 나는 다리를 볼 것입니다 그것은 세 가지 예를 모두 포착합니다 다시 말하지만 클러스터링 측면에서이 점을 생각하면, 세 사람 모두 그 일에 잘 어울릴 것입니다 승인

이제 또 다른 예를 보여 드리겠습니다 치킨 나는 그것이 파충류라고 생각하지 않는다 사실 파충류가 아니라고 확신합니다 그리고이 모델에도 여전히 적합합니다

맞습니까? 왜냐하면 그것은 당신이 깨닫지 못할 수도있는 비늘을 가지고 있기 때문에, 그것은 냉혈한 것이 아니며 다리가 있습니다 따라서 모델을 보완하는 부정적인 예입니다 좋은 소리 그리고 지금 나는 악어를 줄 것이다 그것은 파충류입니다

오 퍼지, 그렇지? 모델을 만족시키지 못합니다 비늘이 있고 냉혈한 것이기 때문에, 다리가있다 나는 그 예를 거의 다 마쳤다 그러나 당신은 그 요지를 본다 다시 말하지만, 어떻게 수정해야하는지 생각해야합니다

그리고 나는 말할 수 있습니다, 좋습니다 조금 더 복잡하게 만들어 보겠습니다 비늘이 있고, 냉혈한, 0 ~ 4 다리 – 나는 그것이 파충류라고 말할 것입니다 나는 다트 개구리를 줄거야 파충류가 아니라 양서류입니다

그리고 여전히 만족 스럽습니다 따라서 클러스터 외부의 예입니다 냉담한 것이 아니라 비늘이 없다고 말합니다 그러나 4 개의 다리가 생기게됩니다 그것은 파충류가 아닙니다

좋습니다 그리고 너를 준다 파이썬 줄께, 그치? 여기에 파이썬이 있어야합니다 오 어서 내가 말할 때 적어도 내게 성장했다

파이썬이 있어야합니다 그리고 나는 너에게 그 연어를 준다 그리고 지금 나는 곤경에 처해있다 비늘을보고 있기 때문에 냉혈한 모습을보고 다리를보세요 나는 그들을 분리 할 수 ​​없다

이러한 기능에는 아무런 방법이 없습니다 바르게 돌아갈 길을 찾는다 파이썬은 파충류이고 연어는 그렇지 않다고 말하십시오 따라서이 규칙을 쉽게 추가 할 수있는 방법은 없습니다 그리고 아마도 가장 좋은 방법은 단순히 돌아가는 것입니다

단지 두 가지 기능, 저울 및 냉혈증에 이르기까지 그리고 기본적으로 말하자면, 무언가가 있다면 저울과 냉혈한, 나는 그것을 파충류라고 부를 것이다 두 가지가 모두없는 경우, 나는 그것이 파충류가 아니라고 말할 것입니다 그것은 완벽하지 않습니다 연어에 잘못 표시 될 것입니다 하지만 여기서는 디자인 선택을 중요하게 생각했습니다

그리고 설계 선택은 내가 잘못된 음수를 갖지 않을 것이라는 것입니다 그게 무슨 뜻 이니? 파충류가 아니에요 파충류를 부를거야 나는 약간의 오 탐률을 보일지 모른다 그래서 나는 잘못된 방식으로 그렇게했다

위양성은 말합니다 그건 파충류가 아니에요 나는 그 방향을 분류 할 것입니다 나는 약간의 오 탐률을 보일지도 모른다 나는 내가 잘못 될 몇 가지 일을할지 모른다

파충류로 표시 그리고 특히, 연어가 가고 있습니다 그것의 실례입니다 오탐 (false positive)과 거짓 (false) 네거티브의 트레이드 오프 우리가 그것에 대해 생각하는 것처럼 우리가 걱정하는 것입니다 완벽한 방법이 없기 때문에 많은 경우에, 데이터를 분리합니다

뉴 잉글랜드에 대한 나의 예를 생각해 보면 애국자들, 그 등판대와 넓은 수신기는 너무 높이와 무게가 가깝고, 나는 그들을 분리 할 수있는 방법이 없었다 그리고 난 기꺼이 결정해야 해 거짓 긍정 또는 거짓 음수의 수 나는 용납하고 싶다 일단 어떤 기능을 사용할 것인지를 알아 냈 으면 좋겠지 만, 나는 거리에 관해 결정해야한다 두 특징 벡터를 어떻게 비교합니까? 나는 벡터를 말할 것입니다

그것에 여러 차원이되어야한다 어떻게 비교할 것인가? 거리를 사용하여 그룹화 방법 또는 분할 선 찾는 법 그것은 물건을 분리시킨다 그래서 내가 결정해야 할 것 중의 하나는 어떤 특징입니다 나는 또한 거리를 결정해야한다 그리고 마침내, 나는 결정하기를 원할지도 모른다

서로 다른 차원의 중요성을 비교하는 방법 특징 벡터에서 어떤 사람들은 그 결정을 내리는 데있어 다른 사람들보다 더 가치가있을 수 있습니다 그리고 나는 그 예를 보여주고 싶습니다 그러니 제 동물로 돌아가 봅시다 나는 실제로 그 특징 벡터로 시작했다

그것에 다섯 차원을 가졌다 그것은 알을 낳고, 냉혈하고, 비늘을 가졌으며, 나는 다른 하나가 무엇인지, 그리고 다리의 수를 잊어 버린다 그래서 내가 이것에 대해 생각할 수있는 방법 중 하나 내가 4 개의 2 진 특징과 하나의 정수를 가지고 있다고 말하고있다 각 동물과 관련된 특징 그리고 파충류를 파충류와 분리하는 법을 배우는 한 가지 방법 예제 쌍 사이의 거리를 측정하는 것입니다

그 거리를 사용하여 서로 가까이있는 것을 결정하십시오 그리고 그렇지 않은 것 그리고 전에 말했듯이, 그것은 물건을 묶거나 분류 자 ​​표면을 찾는 데 사용됩니다 그들을 분리합니다 여기 간단한 방법이 있습니다

이 예제들 각각에 대해, 나는 단지 사실로 만들 것입니다 1이면 거짓, 0이면 거짓 따라서 처음 네 개는 0 또는 1입니다 그리고 마지막 하나는 다리의 수입니다 그리고 이제 나는 말할 수 있습니다

좋습니다 동물 간의 거리를 어떻게 측정합니까? 또는 다른 어떤 것, 그러나 이런 종류의 특징 벡터? 여기, 우리는 무언가를 사용할 것입니다 Minkowski Metric 또는 Minkowski 차이라고 불렀습니다 두 벡터와 힘, p, 우리는 기본적으로 절대 값을 취합니다 각 구성 요소 간의 차이 벡터의 p 번째 전력까지 올리고, 합계를 취하고, 그 p 번째 경로를 택하십시오

그럼 두 가지 분명한 예를 들어 봅시다 p가 1이면, 나는 단지 절대 거리를 측정한다 각 구성 요소 사이에, 그들을 추가하고, 그건 내 거리 야 맨해튼 통계라고합니다 더 많이 본 사람, 지난 번에 본 사람, p가 2이면 유클리드 거리입니다

맞습니까? 차이의 제곱의 합입니다 구성 요소의 제곱근을 가져 가라 그것이 만들어지기 때문에 제곱근을 취하십시오 거리의 특정 성질을 가지고있다

그것은 유클리드 거리입니다 이제이 둘의 차이를 측정하려면 여기에 질문이 있습니다 이 원은 별에 더 가깝거나 십자가에 더 가깝습니까? 불행히도 여기에 답을 달았습니다 하지만 사용하는 측정 항목에 따라 다릅니다 권리? 유클리드 거리 (Euclidean distance)는 2 배의 제곱근입니다

2, 그래서 그것은 약 28입니다 그리고 그것은 세 가지입니다 평면상의 표준 거리의 관점에서 볼 때, 우리는이 두 가지가 두 가지보다 더 가깝다고 말합니다 맨해튼 거리, 왜 그렇게 부르죠? 도로와 길을 따라 걸을 수 있기 때문입니다

맨해튼 거리는 기본적으로 이것은 하나, 둘, 셋, 네 단위 거리라고 말하십시오 이것은 1, 2, 3 단위 떨어져 있습니다 그리고 맨하탄 거리에서 이것은 더 가깝습니다 이 페어링은 페어링보다 가깝습니다 이제 당신은 유클리드를 생각하는 데 익숙합니다

우리는 그것을 사용할 것입니다 그러나 이것은 중요 할 것입니다 우리가 거리를 어떻게 비교하는지 생각할 때 이 다른 조각들 사이 그래서 일반적으로 우리는 유클리드를 사용할 것입니다 우리는 맨해튼이 실제로 어떤 가치가 있음을 보게 될 것입니다

그러니까 제가 세 가지 예를 들어 보겠습니다 총 슬라이드, 안 그래? 그러나 우리가 간다 방울뱀, 보아 압축 장치 및 다트 개구리 표현이 있습니다 나는 물을 수있다, 그들 사이의 거리는 무엇인가? 오늘을위한 유인물에서 우리는 당신에게 작은 조각을주었습니다

그것을 할 코드의 그리고 실제로 그것을 실행하면, 나는, 사실, 좋은 작은 결과 이리 유클리드 거리를 사용하는 벡터 간의 거리입니다 나는 그들에게 돌아올거야 하지만 두 마리의 뱀이 멋지게 보입니다 합리적으로 서로 가깝다

어쨌든, 다트 개구리는 그것으로부터 공정한 거리입니다 좋았지? 그게 좋은 구분 이군 이 둘의 차이 승인 이제 나는 악어를 던졌습니다

Dungeons & Dragons 게임처럼 들립니다 나는 악어를 던져 넣고 같은 비교를하고 싶다 그리고 나는 거의 좋은 결과를 얻지 못합니다 왜냐하면 지금 그것이 말하기 때문에, 이전처럼, 두 마리의 뱀이 서로 가깝습니다 그러나 그것은 다트 개구리와 악어가 이 측정에서 훨씬 더 가깝습니다

둘 중 하나가 다른 하나보다 낫다 그리고 악어와 두 사람을 생각 나게하기 위해 뱀들은 서로 가까이서 거리를 유지하고 싶다 개구리에서 멀리 떨어져 나는 파충류를 분류하지 않으려 고하기 때문에 무슨 일이 있었 니? 글쎄,이 곳은 기능 공학 중요한 일이 될 것입니다

사실, 악어는 개구리와 다릅니다 세 가지 기능이 있습니다 보아 압축 장치와 같은 두 가지 기능 만 있습니다 그러나 이러한 특징 중 하나는 다리의 수입니다 그리고 이진 축에있는 동안, 그 차이는 0과 1 사이이며, 여기에는 0에서 4 사이의 값을 사용할 수 있습니다 그래서 그것은 우리가 원하는 것보다 훨씬 더 먼 거리의 무게를 달고 있습니다

당신이 원한다면 다리 치수가 너무 큽니다 어떻게 해결할 수 있을까요? 이것은 사실, 나는 논쟁한다, 자연적인 장소 맨해튼 거리를 사용합니다 나는 왜 그 차이가 다리 수 또는 다리 수 차이 가늠자가다는 것을 있건 없건간에보다 중요합니까? 왜 그 거리를 측정해야한다고 생각해야합니까? 유클리드가 현명한가요? 그들은 정말로 완전히 다른 측정 값입니다 사실 저는 그것을하지 않을 것입니다 하지만 맨해튼에서 이걸 측정하면 그것은 악어를 뱀에게 훨씬 더 가까이 가게 할 것이고, 왜냐하면 그것은 단지 두 가지 특징 만이 아니라 3 가지가 다른 점 때문입니다

내가 고칠 수있는 다른 방법은 나는 너무 많은 체중을 연관 시키도록하고있다 다리의 수에 차이가 있습니다 이제 바이너리 기능으로 만들어 보겠습니다 다리가 없거나 다리가 있습니다 동일한 분류를 실행하십시오

이제 뱀과 악어가 보입니다 모두 서로 가깝다 다트 개구리 (dart frog) 하지만 꽤 자연스러운 분리가 있습니다 특히 그들 사이의 숫자를 사용합니다 내 요점은 뭐니? 기능 선택이 중요합니다

5 월에 너무 많은 기능을 던지면 사실, 우리에게 지나친 조율을해라 특히, 가중치를 결정하는 것은 그 기능에 내가 원하는 것은 실제로 영향을 미칩니다 그리고 당신은 디자이너 또는 프로그래머로서, 그것들을 어떻게 사용하는지에 대해 많은 영향을 미친다 따라서 기능 엔지니어링이 중요합니다 기능 선택 방법, 사용 방법 중요한 일이 될 것입니다

승인 이것의 마지막 부분은 우리가 우리가 당신에게 데이터를주는 몇 가지 예제를 살펴볼 것입니다 관련 기능 어떤 경우에는 라벨을 붙이려고합니다 다른 경우에는 그렇지 않습니다

그리고 우리는 어떻게 우리가 그들 사이의 거리를 측정하십시오 남자 존 GUTTAG : 당신은 아마 의도하지 않았다 to say 기능의 가중치 당신은 그들이 어떻게 비대칭이라고 말하려고했습니다

죄송합니다 비늘이 아니라 고마워요, 존 아니, 그랬어 나는 그것을 뒤로 가져 간다 나는 특징의 가중치를 말하는 것이 아닙니다 나는 차원의 척도를 말하고자했다

여기서 중요한 역할을 할 것입니다 증폭과 수정에 감사드립니다 당신은 절대적으로 옳습니다 JOHN GUTTAG : 가중치, 우리는 다른 방식으로 사용합니다 다음에 보게 될 것입니다

에릭 그리 슨 : 우리는 다음에 왜 우리는 다른 방식으로 가중치를 사용할 것입니까? 그러므로 다시 말해보십시오 그걸 막으세요 우리는 축척과 축의 축척에 대해 이야기 할 것입니다 여기서 중요한 것으로 그리고 우리는 이미 우리가 두 가지 종류의 학습에서, 분류 및 분류되지 않은, 클러스터링 및 분류

그리고 너를 보여줌으로써 마무리하고 싶다 그것의 두 가지 예입니다 우리가 알고리즘 적으로 어떻게 생각할 것인가? 우리는 다음 번에 자세히 살펴볼 것입니다 우리가 그것을 보면서, 나는 생각 나게하고 싶다 당신에게 중요한 일이 될 것입니다

예제 간의 거리를 어떻게 측정합니까? 이를 설계하는 올바른 방법은 무엇입니까? 벡터에 사용할 올바른 기능 집합은 무엇입니까? 그런 다음 모델에 어떤 제약 조건을 적용하고 싶습니까? 레이블이 지정되지 않은 데이터의 경우 얼마나 많은 클러스터를 갖고 싶은지 결정할 수 있습니까? 왜냐하면 나는 당신에게 클러스터링을하는 쉬운 방법을 줄 수 있기 때문입니다 제가 100 가지 예를 들어 주면 100 개의 클러스터를 만듭니다 모든 예는 자체 클러스터입니다 거리가 정말 좋습니다 그것은 정말로 그 자체에 가깝지만, 비열한 일을합니다

그것에 라벨을 붙이는 것 그래서 생각해야합니다 어떻게해야합니까? 얼마나 많은 클러스터를 결정할 것인가? 그 분리 서비스? 어떻게하면 기본적으로 과도한 문제를 피할 수 있습니까? 나는 갖고 싶지 않아? 너를 상기시키기 위해서, 우리는 이미 이것의 작은 버전, 클러스터링 방법을 보았습니다 이것은 표준 방법이며, 단순히 반복하는 것입니다 우리는 이전 슬라이드에있었습니다

그룹으로 묶고 싶다면, 얼마나 많은 클러스터가 필요한지 말하기 시작합니다 조기 표현으로 취한 예를 선택하십시오 훈련 데이터의 모든 다른 예에서, 가장 가까운 클러스터에 놓으십시오 일단 내가 가지고 있으면 중간 값을 찾아서 그 과정을 반복하십시오 그리고 그것은 그러한 분리를 가져 왔습니다

일단 내가 그것을 얻으면, 나는 그것을 검증하는 것을 좋아한다 그리고 사실, 나는 이것을 더 잘 말해야했습니다 그 두 개의 군집은 검은 점 2 개를 보지 않고 나왔다 검은 점들을 넣으면 유효성 검사를하고 싶습니다 얼마나 효과가 있습니까? 그리고 그 예가 정말로 고무적이지 않습니다

너무 가깝습니다 그래서 그것은 말할 수있는 자연스러운 곳입니다 좋아, 만약 내가 이것을하면? 세 개의 클러스터가있는가요? 그것이 내가 얻는 것입니다 나는 그 것을 좋아한다 괜찮아? 여기 정말 멋진 클러스터가 있습니다

알고리즘이 라벨링을 알지 못했다는 사실 부적절하다 5 개의 멋진 그룹이 있습니다 4 개의 멋진 그룹이 있습니다 그 사이에는 세 개의 멋진 그룹이 있습니다 사실, 평균 거리를 보면 이들 클러스터 각각의 예들 사이에서, 그것은 그 예보다 훨씬 더 가깝습니다

그리고 그것은 결국, 제가해야 할 문제에 이르게합니다 네 개의 클러스터를 찾으십니까? 질문 해주세요 관객 : 두 클러스터 사이에 겹침인가? 별일 아니다? 네 문제는 두 클러스터 사이의 겹침이다 문제? 아니

방금 그걸 그렸어 그래서 내가 풀어 줄 수있어 그 조각들이 어디 있는지 알 수 있습니다 그러나 사실, 원한다면 센터가 있습니다 그 세 점은 모두 그 중심에 더 가깝습니다 그 중심에있는 것보다

그래서 그들이 중첩된다는 사실은 좋은 질문입니다 그것은 내가 그 (것)들을 당기는 다만 일어난 방법이다 나는 이것들을 실제로 그려야한다 동그라미지만, 좀 더 복잡 한 표면으로 승인? 3 개를했다면 4 개를 찾아야할까요? 이미 말했듯이 저점들이 그 아래에 있습니다

어떻게 될지 예를 들어 보겠습니다 그들을 분리하기가 어렵다 그리고 나는 과장하기를 원하지 않습니다 그것들을 분리하는 유일한 방법이기 때문에 정말로 복잡한 클러스터를 생각해 낼 것입니다 나는 그것을 좋아하지 않는다

괜찮아? 다른 한 가지 예를 보여 드리겠습니다 다른 방향에서 나는 당신에게 라벨을 붙인 예시를 줄 것이라고 가정합니다 다시 한 번, 목표는 기능이 있다는 것입니다 각 예제와 관련됩니다

그것들은 그것에 여러 차원을 가질 것입니다 그러나 나는 또한 그들과 관련된 레이블을 알고있다 그리고 나는 무엇이 최선인지 배우고 싶다 새로운 예를 들어 줄 수있는 규칙을 생각해내는 길 적절한 그룹에 할당하십시오 이것을하는 다수 방법

당신은 간단하게 내가 말하는 가장 단순한 표면을 찾고 있다고 말할 수 있습니다 그 예를 분리 할 것입니다 비행기에 탄 축구 경기에서 그 (것)들을 분리하는 제일 선, 그것은 쉬운 것으로 판명되었다 나는 더 복잡한 표면을 찾을지도 모른다 그리고 우리는 두 번째 예를 보게 될 것입니다

어쩌면 그것은 일련의 선분들입니다 그 (것)들을 분리하는 분리를 수행하는 한 줄만 있기 때문에 전과 마찬가지로 조심하고 싶습니다 너무 복잡하게 만들면 정말 좋은 분리 기호를 얻지 만 데이터에 너무 지나치게 맞습니다

그리고 당신은 다음 번에 볼 것입니다 여기에서 강조 할 것입니다 세 번째 방법은 거의 같은 종류의 결과로 k 개의 가장 가까운 이웃이라고 불린다 여기서 아이디어는 레이블이 지정된 데이터 집합입니다 그리고 제가 할 일은, 모든 새로운 예를 들어, 5 개의 가장 가까운 레이블이있는 예제를 말하여 k를 찾으십시오

투표를하십시오 5 개 중 3 개 또는 5 개 중 4 개 또는 5 개 중 5 개 같으면 그 그룹의 일부라고 말할 것입니다 그리고 내가 그보다 적 으면 나는 분류되지 않은 상태로 남겨두기 그리고 그것은 실제로 생각하는 좋은 방법입니다 그들을 배울 수있는 방법에 대해

그리고 예제를 보여줌으로써 마무리하겠습니다 이제 저는이 축구 선수를 사용하지 않겠습니다 나는 다른 예를 사용할 것이다 투표 데이터를 좀 드리겠습니다 나는 이것이 실제로 시뮬레이션 된 데이터라고 생각한다

그러나 이들은 미국의 유권자입니다 그들의 선호와 함께 그들은 공화당에 투표하는 경향이 있습니다 그들은 민주당 원을 투표하는 경향이 있습니다 그리고 두 범주는 연령과 얼마나 멀리 떨어져 있는가? 그들은 보스톤에서 산다 관련이 있든 없든간에, 나는 잘 모른다

그러나 그들은 그것들을 분류하기 위해 사용할 두 가지 일뿐입니다 그리고 나는 말하고 싶습니다 어떻게 곡선에 맞을까요? 그 두 클래스를 분리할까요? 테스트 할 데이터의 절반을 보관할 것입니다 나는 절반의 데이터를 사용하여 훈련시킬 것입니다 그래서 이것이 제가 훈련 데이터라면, 저는 이것들을 구분하는 가장 좋은 라인은 무엇일까요? 나는 최선을 모르지만 여기에 두 가지 예가 있습니다

이 실선은 모든 민주당 원들이 한쪽에있다 다른쪽에있는 모든 것은 공화당입니다 그러나 선의이쪽에 몇몇 공화당 원이 있습니다 나는 이것들을 완전히 구분하는 선을 발견 할 수 없다 내가 축구 선수들과했던 것처럼

그러나 그것들을 분리하기에 적당한 선이있다 다른 후보자가 있습니다 그 대시 라인은 오른쪽에 너는 알아 낸거야 고의적이라고 생각하지 않아 존, 맞아 -하지만 오른쪽에, 거의 모든 공화당 원이 있습니다

그것은 아주 적절하게 보인다 한 명의 민주당 원, 그러나 거기에는 꽤 좋은 분리점이 있습니다 왼쪽에는 여러 가지 요소가 있습니다 그러나 대부분의 민주당 원들이 그 노선의 왼쪽 편에있다 괜찮아? 좌우 상관 관계가 있다는 사실 보스턴으로부터의 거리는 여기서 전혀 상관 없습니다

그러나 그것에는 좋은 펀치가 있습니다 존 GUTTAG : 우연한 것은 아니지만 우연이 아닙니다 우연이 아니야 고맙습니다 괜찮아

이제 문제는 어떻게 평가할 것인가입니다 어느 것이 더 나은지 어떻게 결정합니까? 그리고 나는 너를 보여줄거야 아주 빨리, 몇몇보기 첫 번째는 혼란 행렬이라는 것을 살펴 보는 것입니다 그게 무슨 뜻 이죠? 예를 들어, 이러한 분류 자 ​​중 하나 인, 실선

다음은 실선을 기반으로 한 예측입니다 그럴 가능성이 더 큰지 민주당 원이나 공화당 원 여기 실제 레이블이 있습니다 파선에 대해서도 마찬가지입니다 대각선은 중요합니다

올바르게 분류 된 결과 권리? 실선의 경우, 민주당 원의 정확한 라벨을 모두 가져옵니다 그것은 공화당의 권리를 절반 얻습니다 그러나 그것은 실제로 그것이 공화당 인 곳을 가지고 있습니다 그러나 그것을 민주당 원으로 표시합니다

우리는 정말 커지고 싶습니다 그리고 사실 그것은 자연스러운 조치로 인도합니다 정확성을 불렀다 다시 말하지만, 우리는 이것이 진정한 긍정이라고 말합니다 의미, 나는 그것을 인스턴스로 표시했고, 실제로 그렇습니다

이것들은 참된 원판입니다 나는 그것을 인스턴스가 아니라고 표시하고 실제로는 그렇지 않습니다 그런 다음 위양성입니다 나는 그것을 인스턴스로 표시했고 그렇지 않다 이것들은 위조 방지제입니다

나는 그것이 그것을 인스턴스가 아니라고 표시했다 측정 할 수있는 쉬운 방법은 올바른 라벨을 보는 것입니다 모든 라벨에 대해 진정한 긍정과 참된 원판은 내가 얻은 것들 이 경우 두 모델의 값은 모두 07입니다

그래서 어느 것이 더 낫습니까? 글쎄, 나는 그것을 검증해야한다 그리고 저는 그걸 두 번째로 할 것입니다 다른 데이터를보고 우리는 또한 물을 수 있습니다, 우리는 뭔가를 찾을 수 있을까요? 훈련 오류가 적은가? 이것은 단지 70 %의 권리를 얻고 있습니다 안좋아 음, 좀 더 복잡한 모델이 있습니다

그리고 이것이 당신이 시작하는 곳입니다 overfitting에 대해 걱정했다 이제 내가 한 일은 내가 올라 왔나? 그 (것)들을 분리하는 선의 순서로 이 줄 위의 모든 것, 나는 말할 것입니다 공화당입니다

이 줄 아래 모든 것은 민주당 원이라고 말할 것입니다 그래서 나는 그것을 피하고 있습니다 나는 그것을 피하고있다 나는 아직도 많은 것을 포착하고있다 그리고이 경우, 나는 12 가지의 진정한 긍정, 13 가지의 참된 부정적인 결과, 단 5 개의 오 탐지 만 있습니다

그리고 그것은 친절합니다 당신은 5를 볼 수 있습니다 저기 다섯 개의 빨간 색이야 정확도는 0833입니다

이제 테스트 데이터에 적용하면 OK 결과가 나타납니다 정확도는 약 06입니다 나는이 생각을 일반화하여 시도 할 수 있었다 더 나은 모델을 제시하십시오

그리고 당신은 다음에 그것을 보게 될 것입니다 내가 이것을 측정하는 다른 방법이있을 수 있습니다 마지막 예제로 이것을 사용하고 싶습니다 우리가 사용하는 또 다른 좋은 방법은 PPV, Positive Predictive 얼마나 많은 진정한 긍정적인 가치가 있는가? 나는 모든 것을 긍정적으로 표기했다 그리고이 솔리드 모델에서 점선으로 보면, 나는 약 0

57의 가치를 얻을 수있다 교육 자료의 복잡한 모델이 더 좋습니다 그리고 테스트 데이터가 더욱 강력 해졌습니다 마지막으로 두 개의 다른 예가 호출됩니다 민감성과 특이성

감도는 기본적으로 내가 올바르게 찾았습니까? 그리고 특이성은 어떤 비율 나는 올바르게 거절 했습니까? 이걸 보여주기 때문에 나는 이것을 보여줍니다 트레이드 오프가 일어나는 곳 감도가 얼마나 많은 경우 나는 올바르게 했는가? 내가 둘 다 올바르게 레이블을 붙인다 라벨이 붙어 부정적인 것으로 잘못 분류 된 경우, 내가 얼마나 많은 레이블을 붙였는가? 내가 원하는 종류로? 나는 감도 1을 만들 수있다 모든 것을 레이블은 내가 찾고있는 것입니다

큰 모든 것이 정확합니다 그러나 특이성은 0이 될 것입니다 왜냐하면 내가 잘못 분류 한 것들을 가지고 있기 때문이다 나는 특이성을 1로 만들고, 모든 것을 거부 할 수있다

인스턴스로 아무것도 말하지 마십시오 진실한 원판은 1에 이르고, 나는 거기서 좋은 장소에있다 내 감도는 0이됩니다 나는 절충점이있다 내가 사용하고있는 알고리즘을 학습하는 기계에 대해 생각할 때 그 분류 자의 나의 선택, 나는 어디에서 거래를 볼 것입니다

나는 민감성이나 부작용의 댓가로 특이성을 높일 수있다 그 반대 그리고 ROC 또는 수신기 운영자라는 멋진 기술을 보게 될 것입니다 커브는 당신이 어떻게 대처하고 싶은지에 대한 감을줍니다 그리고 그걸로 우리는 다음에 너를 볼거야

우리는 당신의 질문을 줄 것이다 네가 괜찮 으면 내가 시간이 지났기 때문에 하지만 다음에 Guttag 교수님을 보게됩니다 이 예를 보여줄 것입니다