Introduction to Runway: Machine Learning for Creators (Part 2)

[철도 휘파람] 다른 비디오 자습서에 오신 것을 환영합니다 Runway 작업 및 기계 학습 모델 실행에 대한 정보 활주로 자체에서 이 비디오 자습서를보기 전에 전에 활주로를 사용한 적이 없다면 돌아가서 내 소개를보고 싶을 수도 있습니다

활주로에 다운로드하고 설치하는 방법 그러나 솔직히 말해서, 당신은 아마 그것을 알아낼 수 있습니다 runwaymlcom으로 이동하여 베타 다운로드를 클릭하십시오 활주로 소프트웨어를 다운로드하여 열어야합니다 그런 다음 모델 찾아보기로 이동합니다

모션 아래로 가서 PoseNet을 클릭하겠습니다 그리고 당신은 바로 여기에 자신을 찾을 수 있습니다 이것이 바로 내가있는 곳입니다 Runway를 설치했습니다 다운로드했습니다

그리고 PoseNet의 Runway 소프트웨어 페이지에 있습니다 기계 학습 모델 자, PoseNet은 무엇입니까? PoseNet은 기계 학습 모델입니다 한 명 이상의 사람에 대한 실시간 골격 추적을 수행합니다 그리고 무엇을 추측합니까? 나는 사람이고, 활주로가 여기에 달려 있습니다 PoseNet과 함께

그래서 나는 그것을 실행할 것입니다 먼저 작업 공간에 추가를 클릭하십시오 그래서 이미 가지고있는 작업 공간이 있습니다 코딩 기차 라이브라는 이전 비디오에서 만든 흐름 입력 소스를 선택하고 싶습니다 나는 그것이 나의 웹캠이되기를 원한다

그렇습니다, 활주로가 바로 나아갑니다 그런 다음 출력 소스를 선택하고 싶습니다 내가 원하기 때문에 처리하고 싶다 이 기계 학습 모델을 실행 한 결과를 얻기 위해 PoseNet 자체 처리 하지만 지금은 미리보기를 클릭하겠습니다 미리보기를 클릭합니다

아, 그리고 나는 달려야한다 하지만 그거 알아? 이것은 이전 비디오에서 보여준 것과 다릅니다 로컬로 실행 옵션이 있습니다 실제로이 모델은 로컬에서만 실행할 수 있습니다 클라우드에서 이것을 실행하는 것은 어리석은 일입니다

이 모든 시간을 보내야했기 때문에 네트워크를 통한 데이터 그리고 실행하기가 매우 쉽습니다 이것은 매우 작고 빠른 모델입니다 대부분의 최신 컴퓨터에서 실행할 수 있습니다 로컬로 실행을 클릭하겠습니다

따라서 GPU 크레딧이 필요하지 않습니다 물론 무료로 사용할 수 있습니다 그리고 우리는 그곳에가는 것을 볼 수 있습니다 지금 실행 중입니다 다양한 요점을 추측합니다

내 골격의 출력에 내 몸에 있습니다 볼 수있는 이하 그래서 일에 대한 좋은 점 중 하나 활주로와 그 모델은 많이 모델마다 다른 매개 변수와 값이 있습니다 조정하고 변경하여 실행할 수있는 것들 다른 방법으로 그리고 이것들은 일종의 하이퍼 파라미터로 알려져 있습니다 기계 학습 모델에 그래서 그들 중 일부는 실제로 모델 실행을 중단 한 다음 나는 그것을 가지고 시작할 수 있습니다

예를 들어이 아키텍처는 실제로 모델을 더 작게 만들 수 있습니다 정확도는 떨어질 수 있지만 더 빨리 실행됩니다 그러나 예를 들어, 나는 단지 가고 있습니다 대신 075로 변경하십시오 다시 실행하겠습니다

그러나 이러한 매개 변수 중 일부는 실제로 실시간으로 조정됩니다 예를 들어 너비와 높이를 변경할 수 있습니다 실제로 변화하는 이미지의 웹캠 자체의 이미지 해상도 원하는 경우 그레이 스케일을 더 만들 수 있습니다 실제로 여러 가지 작업을 수행하여 실제로 조정할 수 있습니다 들어가기 전에 이미지

그러나 이것은 중요한 부분이 아닙니다 이 비디오에서하고 싶은 일을 이 비디오에서하고 싶은 것은 여기서 Runway에서 모델을 실행하는 순간이 있습니다 나는 그것을 가지고 놀 수 있고, 조정하고, 정확하게 얻습니다 내가 원하는 방식으로 작동합니다 다음 단계로 넘어 가고 싶습니다 결과를 볼 수 있도록 여기에서 실행하도록 내 자신의 소프트웨어에서 그렇게하겠습니다

이것을 시도하는 데 사용할 소프트웨어 프로세싱이라고합니다 이 크기는 출력의 활주로에서 640×362, 처리 코드에서 수행 할 작업 캔버스 크기를 640 x 362로 설정합니다 무효 그리기 배경 0 이제 처리 스케치가 있습니다

내가 여기서 뛰고 있습니다 결과, 모델의 결과를 어떻게 볼 수 있습니까 내 프로세싱 스케치에서? 다양한 네트워크 프로토콜이 있습니다 활주로가 지원합니다 그리고 나는 그들에 대해 여기에서 찾을 수 있습니다 이 네트워크 탭을 클릭하여 그리고 처리 작업에 사용하고 싶은 것 OSC입니다 여러 가지 이유가 있습니다 한 프로토콜을 다른 프로토콜보다 선택하십시오

그것은 실제로 당신이하고있는 것에 달려 있습니다 하나의 이미지를 얻고 자하는 경우 HTTP 요청이 가장 적합합니다 그리고 다른 비디오에서 할게요 Runway에서 스타일로 다시 작업하는 방법을 보여 드리겠습니다 하지만 지금은 클릭합니다 OSC에서 처리와 잘 작동합니다 그리고 여기에 많은 정보가 있습니다

이 말은 서버 주소입니다 이것이 내가 활주로에서 필요한 가장 중요한 것입니다 내가 말하고자하는 것은 Processing이 유일한 IP라는 것입니다 로컬 IP 인 주소 이 컴퓨터의 주소와 포트 번호 OSC 메시지를 얻을 수 있습니다 여기를 클릭하겠습니다 그리고 ip와 같은 문자열을 만들 것입니다

나는 아마 갈거야 확신 별도의 변수에 포트 번호를 원합니다 그리고 이와 같은 포트 번호를 만들 것입니다 이제 여기 앉아서 모든 코드를 작성할 수 있습니다 이것을 위해, 나는 보통 코딩 기차 비디오에서 할 수 있습니다 그러나 이것은 상당히 다른 상황입니다 정말 예제를보고 싶어요 실행하고이를 수행하는 방법을 보여줍니다

그리고 Runway 작업에 대한 좋은 점 중 하나 미리 만들어진 예가 많이 있습니까? 다른 플랫폼과 소프트웨어를 사용하는 경우 그 중 하나가 처리 중입니다 그래서 당신이 실제로 어떻게하는지 보여 드리겠습니다 현실 세계에서이 작업을 수행하는 방법 지금하는 방법입니다 Runway ML GitHub에 가면 실제로 한 단계 뒤로 돌아 가야합니다 Runway ML 아래로 이동하십시오 Runway 소프트웨어에 대한 GitHub 페이지는 다음과 같습니다 그리고 많은 정보가 있습니다

높은 수준의 물건과 같은 것이 있습니다 머신 러닝 모델을 이식하는 방법 활주로 자체 자신의 모델을 훈련했거나 Runway에서 지원하지 않는 모델을 찾으십시오 당신이 그것을 추가 할 수있는 방법 그러나 그것은 우리가 여기서 실제로하고있는 것이 아닙니다

내가 찾고 싶은 것은 여기 Processing, Runway 그리고 가공 여기를 클릭하면이 저장소에 프로세싱과 함께 Runway를 사용하는 많은 예제 attnGAN에 StreetView가있는 것을 볼 수 있습니다 얼굴 랜드 마크, im2txt 및 voila, PoseNet 이것은 내가 일하고있는 것입니다

이 예를 살펴 보겠습니다 나는 이것이 오픈 소스 프로젝트라고 말해야한다 프로세싱은 오픈 소스 프로젝트입니다 내가 말했던 것에 관여 다른 많은 비디오에서 다른 모델을 찾으면 활주로에서 당신이 일을하고 기여하고 싶어 여기에 처리 예제가 있으므로 권장합니다 Runway의 창립자이자 제작자 중 한 명인 Chris는 그리고 나는 가공에 대해 이야기하고있다 활주로 도서관

그리고 최근에 두 개의 비디오 자습서를 만들었습니다 Processing Java 라이브러리를 만드는 방법에 대해 설명합니다 앞으로 처리 될 프로젝트를 보게됩니다 활주로 도서관 그러니 그 일에 참여하고 싶다면 의견을 적어 알려주세요 그리고 아마도이를 위해 GitHub 저장소를 만들 것입니다

좋아, PoseNet 아래로 가야겠다 그리고 posenetpde 아래에서 여기를 클릭하겠습니다 붙여 넣기 만하면됩니다 하지만 한 조각 씩 갈 것입니다

그리고 이미 활주로 호스트와 활주로 포트를 볼 수 있습니다 그래서 코드에서 실수를했습니다 그래서 저는-01을 놓쳤습니다 채팅에 대해 이미 이야기하고 있습니다

그리고 여기에 여분의 1이 있습니다 그리고 이것은 정수 여야합니다 그리고 이것은 실제로 호스트입니다 사실 같은 변수를 사용하겠습니다 이름은 runwayHost 및 runwayPort입니다 좋아, 지금 당장 얻은 것 같아

이제 예제가 작동하려면 처리 OSC가 있는지 확인해야합니다 라이브러리가 설치되었습니다 여기 와서 복사하면 이 수입 명세서를 붙여 넣습니다 꼭 필요한 OSC 객체를 붙여 넣을 수 있습니다 그리고 우리는 내가 OscP5 클래스가 존재하지 않는 오류가 있습니다

프로세싱 OSC를 설치하지 않았기 때문입니다 도서관 사용하기 때문에 이미 설치했을 수 있습니다 다른 프로젝트로 그러나 나는 여기에 갈 수 있었다 Sketch, Import Library, 라이브러리, OSC를 추가하여 검색하십시오

이것은 내가 찾고있는 라이브러리입니다 oscP5 설치를 클릭하겠습니다 이제 오류 메시지가 사라지는 것을 볼 수 있습니다 다음으로하고 싶은 것은 객체를 만드는 것입니다 OSC 메시지를 수신합니다 그리고 나는 이것을 새로운 OscP5 객체로 만들 수 있다고 생각합니다

이 특정 스케치에 대한 참조를 제공해야합니다 스케치에서 이벤트를 트리거해야하기 때문에 사용 가능한 데이터가있을 때 그런 다음 포트 번호를 지정하십시오 이것을 runwayPort라고합니다 활주로 예제를 보면 실제로 OscProperties라는이 개체를 사용하고 있습니다 좀 더 정교합니다

원격 주소, 수신 포트, 데이터 그램 크기와 다른 것들 아마도 이것을 내 예제에 붙여 넣을 것입니다 그러나 그것이 더 많은 종류의 것들과 함께 작동하는지 궁금합니다 방금 말한 단순화 된 기본 OscP5 객체 이것과 특정 포트 그러나 나는 이것을 필요로한다

방송 위치가 필요합니다 왜냐하면 런웨이에게 메시지를 보내야합니다 연결되어 있거나 연결이 끊어졌습니다 여기에는 두 가지가 있습니다 프로세싱 소프트웨어가 있습니다

그리고 Runway 소프트웨어가 있습니다 둘 다 내 컴퓨터에서 로컬로 실행 중입니다 이제 다른 시나리오에서 클라우드 GPU도 포함될 수 있습니다 활주로는 메시지를주고받습니다 그리고 이것은 내가 가고있는 것입니다 다음 예제에서해야 할 일 StyleGAN이라는 이름으로 Runway가 클라우드 GPU 와도 대화하도록하겠습니다

그러나 여기서 일어나지 않습니다 PoseNet은 실제로 내부에서 실행되고 있습니다 기본적으로 Runway 자체에 로컬로 래핑됩니다 PoseNet은 여기서 Runway에서 로컬로 실행됩니다 처리 중이 connect와 같은 메시지를 보내는 중입니다

나도 정보를 듣고 싶어 그것은 일회성 메시지입니다 그런 다음 Runway는 OSC를 통해 지속적으로 데이터를 보냅니다 PoseNet으로 감지하는 포즈 처리 웹캠 입력에서 모델 그래서 내가 원한다면 아마도 방법을 알아낼 수있을 것입니다 카메라 입력을 처리로 가져 오려면 이미지를 활주로로 보내고 활주로 결과를 다시 보냅니다 하지만 런웨이는 카메라에 직접 연결할 수 있습니다 아주 간단하기 때문에 그렇게 할 수도 있습니다

그래서 여기에도 같은 것을 넣어야합니다 웹캠처럼 여기에 약간의 메모를하면 웹캠이 런웨이와 대화 중입니다 나는 또한 처리와 이야기 할 수 있습니다 처리 결과도 표시하려면 이것이이 특정 예에서 진행되고있는 것입니다 이 브로드 캐스트 위치를 만들고 싶습니다 네트 주소 개체입니다 여기에 넣어야합니다

그리고 내가하고 싶은 첫 번째 일은 연결 메시지를 보내면됩니다 복사해서 여기에 붙여넣고 연결이라고하겠습니다 처리를 시작할 때 내가하고있는 일은 connect 함수를 호출합니까? OSC 메시지를 작성합니다 모든 단일 OSC 메시지는 두 부분으로 구성됩니다 이 두 부분은 주소이며 보통 경로처럼 일종의 문자열로 표시됩니다

이것이 서버 / 연결임을 알 수 있습니다 그게 주소 야 아니면 거의 메시지처럼 생각할 수도 있습니다 내가 생각하는 방식으로 그런 다음 데이터 이 경우에는 실제로 주소 자체가 메시지이므로 데이터가 없습니다 이것은 매우 단순화 된 것입니다 이 연결 메시지가있는 곳입니다

연결 중입니다 메시지 이름, 주소, 거기에 있어야 할 유일한 것입니다 데이터가 없습니다 그러나 Runway가 데이터를 다시 보내면 데이터 또는 요점과 같은 메시지 이름을 갖습니다 또는 포즈, 그런 것

그리고 그것은 많은 양의 데이터와 함께 패키지 될 것입니다 모든 xy의 모든 위치와 같습니다 자, 이것을 실행하고 무슨 일이 일어나는지 봅시다 예, 꽤 좋습니다 오류가 없습니다

연결되었으므로 메시지를 듣고 싶습니다 그리고 그 방법은 OSC 이벤트라는 이벤트를 사용하는 것입니다 마우스 누르는 것과 비슷합니다 또는 키 누르기 또는 직렬 이벤트 또는 캡처 이벤트 이것은 매우 특별한 이름을 가진 Processing의 함수입니다 OSC 이벤트라고합니다

그리고 oscP5 라이브러리는 그 함수를 호출하는 것을 알고 있습니다 데이터가 들어올 때 붙여 넣기 만하면됩니다 그리고 여기에 넣겠습니다 그리고 제가하려고하는 것 – 이것을 보도록합시다 그것을 통과 한 OSC 이벤트가 있습니다 OSC 메시지 이 메시지를 메시지로 변경하겠습니다 메시지에 해당 데이터가 있다면 주소와 같습니다

기억? 주소에는 데이터가 있으며, 이것이 우리가 찾고있는 주소입니다 그렇지 않은 경우 여기서 나가십시오 그래서 들어오는 다른 메시지를 무시하고 싶습니다 그런 다음 내가하고 싶은 일은 데이터 자체를 얻는 것입니다 따라서 메시지의 데이터는 실제로 문자열로 제공됩니다

그러나 문자열은 JSON으로 형식이 지정됩니다 JavaScript 객체 표기법입니다 JSON이 무엇인지 모른다면 JSON이 무엇인지 설명하는 다른 비디오로 JSON은 JavaScript에서 정말 잘 작동합니다 그것으로 작업하는 것은 조금 어색합니다 처리가 Java이므로 처리 중입니다

기본적으로 JavaScript를 사용하지 않습니다 그러나 우리는 그것을 작동시킬 것입니다 메시지의 첫 번째 자체는 JSON 데이터의 큰 문자열이며 JSON입니다 Processing의 parseJSONObject로 파싱 할 수있는 객체 기능 그런 다음 콘솔에서 볼 수 있습니다

실제로 데이터를 가져 오는지 봅시다 아무것도 얻지 못했습니다 왜 그런지 궁금합니다 그리고 실제로 이유를 알고 있습니다 우선, 여기에 실마리가 있습니다

데이터 그램 소켓을 만들 수 없습니다 포트 5100은 이미 사용 중이기 때문에 그리고 나는 여기에 이상한 일이 있다는 것을 잊었다 OSC를 사용하여 둘 사이에서 통신하는 경우 별도의 컴퓨터, 같은 포트 번호를 사용할 수 있습니다 각 개별 컴퓨터에서 하나의 포트 번호 하지만 여기서 활주로에 데이터를 보낼 수 있어야합니다 특정 포트에서 처리로 데이터를 수신 같은 포트가 될 수없는 다른 포트에서 그렇지 않으면 충돌이 발생합니다 제가 방송하는 포트는 57100입니다

이것이 Runway에 나와 있습니다 하지만 메시지를 받고 싶은 실제 포트 57200입니다 그리고 Runway는 자동으로 100을 추가하는 것을 알고 있습니다 무대 뒤에서 그러나 이것은 Runway의 기본 설정입니다

데이터 수신을 위해 다른 포트가 필요합니다 내가 보내는 포트로 코드에서 의미하는 바를 보여 드리겠습니다 이것이 바로 활주로 포트 5757입니다 그것이 내가 방송하고 싶은 포트입니다

그리고 그것은 내 방송 위치의 일부입니다 그것이 내가 방송하는 곳입니다 그러나 메시지를 받고 싶은 곳은 실제로 57200입니다 이제 이것을 실행하면 실제로 메시지가 수신됩니다 하지만 새로운 오류가 있습니다

ArrayIndexOutOfBoundsException입니다 따라서 이것은 런웨이 데이터가 이 포즈를 모두 보내는 것은 실제로 상당히 큽니다 그리고 필요한 것은 더 많은 공간입니다 더 큰 패킷 크기가 필요합니다 그렇기 때문에 Runway 예제에서 이 여분의 OSC 속성이있었습니다 더 큰 데이터 그램 크기를 설정할 수있는 개체입니다

청취 포트는 57200입니다 기본적으로 OscP5를 사용하기 전에 이럴 필요는 없지만 난 복사하여 붙여 넣습니다 이걸 다시 여기에 넣고 이것을 속성으로 변경하겠습니다 저는 이제 모든 조각을 가지고 있다고 생각합니다 내가보아야 할 것은, 우리가 간다, 많은 것들

이것 좀 봐 자, 저는 확신을 가지고 정확하게 처리했습니다 점수– 왼쪽 발목이 보이지 않습니다 왼쪽 발목을 카메라로 볼 수 없기 때문입니다 그래서 그 신뢰 점수가 너무 낮은 이유입니다 위로 스크롤하고 오른쪽 귀를 좋아합시다 매우 높은 신뢰 점수와 x 및 ay를 얻었습니다

내 오른쪽 귀를 위해 이제 저는이 데이터를 실제로 사용할 수있는 시점에 있습니다 런웨이 예제로 돌아가서 여기에 매우 정교한 루프가 있음을 알 수 있습니다 JSON을 파싱하고 모든 다른 핵심 포인트에서 감지하는 모든 것의 모든 다른 위치 지금 훨씬 더 간단한 일을하려고합니다 나는 오른쪽 눈과 왼쪽 눈을 얻을 것입니다

우리가 알아낼 수 있는지 봅시다 우리가 이것에 접근 할 수있는 한 가지 방법은 이 데이터 변수를 전역 변수로 만들 수 있습니다 이 JSON 객체를 사용하겠습니다 저는 이것을 전역 변수로 만들 것입니다 데이터라고하겠습니다

그런 다음 드로우 루프에서 나는 단지 데이터가 널이 아닌 한 Java에 있다는 것을 잊었습니다 그냥 할 수있어 데이터는 Runway로부터 무언가를받을 때까지 null이됩니다 런웨이에서 무언가를 받자 마자 내가해야 할 일은이 JSON을 구문 분석하는 것입니다 조금 더 쉽게하기 위해 내가 한 일 방금 JSON을 가져 와서 인쇄합니다 프로세싱 콘솔에 그것을 JSON 파일에 붙여 넣었습니다

Visual Studio Code에서 볼 수있는 그래서 참조 할 것이 있습니다 그래서 나는 포즈라고 불리는 것을 얻어야한다는 것을 알고 있습니다 가장 먼저 원하는 것은 poses 배열입니다 프로세싱에서 정말 이상한 것 중 하나는 JSON을 사용하면 데이터가 있는지 여부를 지정해야합니다 보는 것은 JSON 객체 또는 JSON 배열입니다

그리고이 포즈 데이터는 표시된대로 배열입니다 이 대괄호로 JSONArray의 포즈가 같다고 말하겠습니다 datagetJSONArray 문자열 포즈 그런 다음 키 포인트 배열을 얻고 싶습니다

아, 둘 이상의 포즈가있을 수 있기 때문에 하지만 포즈가 하나만 있다고 가정하겠습니다 그런 다음 포즈입니다 그럼 요점은 배열이 동일한 posesget 0 이것이 배열의 첫 번째 요소입니다

이제 핵심 포인트라는 새로운 배열을 얻습니다 JSON 배열 요점을 얻습니다 좋은 소식은 런웨이 예제입니다 거기에이 모든 것이 포함되어 있습니다 제가 잘못하면 키 포인트 get element 0이라고 말할 수 없기 때문에 여기에 오류가 있습니다

요소 0은 무엇입니까? JSON 객체입니다 우리는 거기에 갈 이제 핵심 사항이 있습니다 첫 번째 JSON 객체에서 키 포인트라는 JSON 배열입니다 인덱스 0

그렇다면 무엇을 찾고 싶습니까? 이제 핵심 포인트 배열에 있습니다 이것은 요소 0입니다 내가 왼쪽을 알고 있었다면- 아, 이건 쉬워요 코, 왼쪽 눈, 오른쪽 눈을 봅시다 0, 1 및 2, 완벽합니다

그래서 JSONObject nose equals를 얻고 싶습니다 keypointsgetJSONObject 0 그리고 우리는이 중 세 가지를 할 것입니다 왼쪽 눈-나는 이것을 조금하고있다 활주로 예제와 다릅니다

그런 다음 오른쪽 눈 다음에 활주로를 예로 들어 보겠습니다 확실히, 나는 여기서 루프를 사용할 수 있습니다 코, 왼쪽 눈, 오른쪽 눈 그런 다음 입장을 취해야합니다 nosePos는 nos

getJSONObject와 같습니다 코만하면 돼 난 그냥 코를 할거야 여기서 더 간단하게 유지하십시오 외삽하여 알아낼 수 있습니다 왼쪽 눈과 오른쪽 눈을하는 방법- nosegetJSON 객체 위치 그리고 x는 이 코 위치를 호출합니다

코 위치는 x를 얻습니다 이것이 옳다는 것을 확신하십시오 그리고 y는 nosePositionget y와 같습니다 알았어, 내가 뭘 잘못 봤니? getFloat

다시 한번, 저는 Java에 있습니다 유형을 지정해야합니다 내가 모든 것을 올바르게했다면 첫 번째 포즈의 모든 요점을 얻었습니다 코에 대한 모든 데이터가있는 객체를 얻었습니다 그런 다음 해당 물체에서 코 위치를 뺀 다음 x 그리고 그 물체에서 y

휴 이제 2020 년에 타원 x라고 말하겠습니다 그리고 그것을 빨간 코로 만들어 봅시다 25500을 채 웁니다

이것을 실행시켜 봅시다 그리고 우리는 간다 나는 지금 코를 제어하고 있습니다 활주로에서 OSC 메시지 처리로 놀랄 만한

자, 이것으로이 비디오 튜토리얼을 마치겠습니다 확실히, 당신이하고 싶은 일 전체 골격을 참조하십시오 PoseNet을 효과적으로 사용하려면 카메라가 당신으로부터 약 6 피트 정도 떨어져 있기를 원합니다 백업하고 전체 양식을 볼 수 있도록 허용하려고합니다 당신은 또한 이미지를 전달하고 포즈를 취할 수 있습니다

이미지에서 할 수있는 일이 많이 있습니다 그리고 확실히, 나는 추천 할 것입니다 Runway GitHub 리포지토리의 예제를 확인하십시오 이것은 모두 통과하는 멋진 루프가 있습니다 다른 위치의

실제로이 작은 매핑도 그들 사이의 모든 연결이 무엇입니까 실제 골격 자체에 약간의 운동으로 오른쪽 눈과 왼쪽 눈을 갖기 위해 내가 한 일을 확장 할 수 있습니다 그러나 그럼에도 불구하고 Runway 예제 자체를 얻을 수 있습니다 그러나 이것은 어떻게 Runway 자체에서 찾을 수있는 특정 모델 채팅에 참여한 사람이 방금 밀도에 대해 묻고있었습니다 예를 들어 OSC를 통해 활주로에서 통신 할 수있는 자세 처리합니다 하지만 다른 많은 경우에는 웹 소켓이나 HTTP 연결을 사용하고 싶습니다 특히 작업중인 경우 의사 소통 JavaScript로 브라우저에서

다음 비디오에서하려고하는 것은 보고 싶다면 StyleGAN을 실행하여 무지개를 생성하십시오 이미지를 P5에 전달 브라우저 자체에서 렌더링합니다 그리고 대화에서 뉴스 속보, Damien SRSP는 동일한 포트에서 보내기 및 받기를 나타냅니다 기본적으로 OSC 패킷은 수신 및 전송되지 않습니다 보내거나 받아야 할 경우 동일한 포트로 같은 포트에서 어쩌면 내가 실제로 무언가를 할 수 있었을 것입니다 포트 번호와 함께

나도 몰라 나는 사람들이 의견에 그것에 대해 쓸 것이라고 확신합니다 그러나이 코드는 작동합니다 Runway GitHub 리포지토리의 코드가 작동합니다 너무 재밌어요 그걸 써

그것으로 무언가를 만드십시오 나에게 공유하십시오 프로세싱에 대한이 튜토리얼을 즐기 셨기를 바랍니다 활주로 및 로컬에서 실행되는 PoseNet 모델 컴퓨터에서 안녕

[철도 휘파람] [음악 재생]

Introduction to Runway: Machine Learning for Creators (Part 1)

[땡땡] 여보세요 새로운 튜토리얼 시리즈에 오신 것을 환영합니다 소프트웨어에 대한 코딩 트레인 활주로라고 런웨이 란? 런웨이와 땜장이 종류를 다운로드하고 설치하는 방법 주위에? 이것이이 특정 비디오에서 할 것입니다

런웨이는 내가 만든 것이 아닙니다 활주로는 회사, 새로운 회사에 의해 만들어집니다 활주로 자체 그리고 그것은 소프트웨어의 한 조각입니다 사용하고 무료로 다운로드 할 수 있습니다 무료로 사용할 수 있습니다

클라우드 GPU 크레딧이 필요한 측면이 있습니다 나중에 살펴 보겠습니다 그리고 무료 크레딧과 쿠폰 코드를 얻을 수 있습니다 이 비디오의 설명에서 찾을 수 있습니다 하지만 난 정말 당신과 이야기하고 싶어 그게 너무 흥분되어서 앞으로 사용할 계획입니다 미래의 많은 튜토리얼과 코딩 문제, 그리고 교육 내가 할 일

그리고 나는 또한 내가 회사 활주로 자체의 고문입니다 그래서 저는 그 능력에 관여하고 있습니다 괜찮아 런웨이 란? 바로 여기에는 광고 소재에 대한 머신 러닝이 있습니다 인공 지능의 힘을 가져 오십시오 직관적이고 간단한 방법으로 창의적인 프로젝트에 시각적 인 인터페이스

오늘 새로운 제작 방법을 탐색하십시오 이것이 나에게있어 활주로의 핵심입니다 저는 창의적인 코더 인 사람입니다 처리 및 P5JS 작업 중입니다 다른 소프트웨어를 사용하고있을 수 있습니다

그것은 단지 상용 소프트웨어, 코딩 환경입니다 당신은 당신의 자신의 소프트웨어를 작성하고 있습니다 그리고 당신은 최근의 진보를 활용하고 싶습니다 기계 학습에서 이 모델에 대해 읽었습니다 이 모델에 대한이 YouTube 비디오를 보았습니다

당신은 당신의 일에 그것을 사용할 수 있습니까? 글쎄, 활주로 전에 당신이 한 일 중 하나 GitHub 리포지토리로가는 길을 찾으십시오 이 매우 긴 ReadMe를 좋아했습니다 설치 및 구성해야 할 다양한 종속성 그런 다음이 파일을 다운로드하여 설치 한 다음 이 라이브러리를 빌드하십시오 그리고 당신은 정말 오랫동안 거기에 갇힐 수 있습니다 따라서 Runway는 하나의 소프트웨어로 구성됩니다 기본적으로 머신 러닝을 실행하는 인터페이스 당신을위한 모델, 설치 및 구성 다른 일을하지 않아도 Install이라는 버튼을 누릅니다

그리고 그것은 당신에게 그 모델들을 가지고 놀 수있는 인터페이스를 제공합니다 해당 모델을 실험 한 다음 브로드 캐스트 이러한 모델의 결과를 다른 소프트웨어에 적용합니다 그리고 당신은 다양한 방법이 있습니다 HTTP 요청을 통해 방송을 할 수 있습니다 OSC 메시지를 통해 그리고이 모든 것이 말이되지 않을 수도 있습니다 당신에게, 그것은 완전히 괜찮습니다 나는 그들을 통해 찌르고 당신을 보여줄 것입니다 적어도 당신을 보여주기 위해 그들이 어떻게 작동하는지 활주로와 처리 방법 Runway와 P5JS를 페어링하는 방법, 그리고 다른 많은 예제가있는 곳을 보여 드리겠습니다 다른 플랫폼으로 할 수있는 것들과 같은 것들

첫 번째 단계는 여기를 클릭하는 것입니다 런웨이 베타 다운로드에서 자동으로 다운로드를 시작합니다 Mac OS, Windows 또는 Linux 용 실제로 Runway를 이미 다운로드하여 설치했습니다 이 단계를 건너 뛰겠습니다 실제로는 이제 소프트웨어를 실행하십시오 아 이제 런웨이에 오신 것을 환영합니다

시작하려면 로그인하세요 승인 이미 계정이 있다면 당신은 당신의 계정으로 로그인 할 수 있습니다 이미 계정이 있습니다 하지만 저는 새로운 것을 만들려고합니다

과정을 따르십시오 그래서 나는 여기에 갈 것입니다 계정을 만드십시오 이메일 주소를 입력하겠습니다 daniel@thecodingtrain

com에게 아무에게도 말하지 마십시오 그런 다음 사용자 이름과 비밀번호를 만들겠습니다 매우 강력한 비밀번호를 입력 했으므로 다음을 클릭하겠습니다 다니엘 쉬프 먼은 코딩 기차 계정을 만드십시오

아 인증 코드를 제공합니다 daniel@thecodingtraincom으로 계정이 생성되었으며 시작을 클릭 할 수 있습니다 일단 다운로드하고 Runway를 설치하고 가입하면 계정으로 로그인 한 경우 이 화면이 나타납니다 런웨이를 오랫동안 사용했다면 그런 다음 열린 작업 공간을 클릭하여 여기에 올 수 있습니다

작업 공간은 수집 방법이기 때문에 당신이 다른 모델의 무리 특정 프로젝트에 작업 공간으로 사용하고 싶습니다 그러나 우리는 그 어떤 것도하지 않았습니다 제가 가장 먼저 할 일은 모델 찾아보기를 클릭하기 만하면됩니다 그래서 당신이 제안하는 첫 번째 일은 그냥 모델을 클릭하고 무엇을 참조하십시오 Runway 인터페이스 자체에서 게임을 할 수 있습니다 런웨이에서 정말 멋진 것 중 하나가 탐색 할 수있는 소프트웨어 및 인터페이스 모델을 실험하여 작동 방식을 이해하고 그것이 잘하는 것, 잘하지 않는 것, 시작하기 전에 무엇을 하는가 자신의 소프트웨어 나 프로젝트로 가져옵니다

저는이 스페이드 코코 모델을 고를 것입니다 전에 보았다 이것은 매우 합법적입니다 나는 그것을 클릭했을 때 어떤 일이 일어날 지 전혀 모른다 이제 여기에 더 많은 정보가 있습니다 모델에 대해

모델이 무엇을하는지 알 수 있습니까? 스케치와 낙서에서 사실적인 이미지를 생성합니다 모델에 대한 자세한 정보를 찾을 수 있습니다 예를 들어,이 모델을 설명하는 논문입니다 "공간적으로 적응하는 시맨틱 이미지 합성 COCO-Stuff 데이터 세트에 대한 정규화 " 누군가가 물었을 때 이것은 초보자를위한 튜토리얼이라는 것을 기억하십시오 글쎄, 당신이 초보자라는 점에서 초보자를위한 것입니다

여기 와서 놀 수 있습니다 하지만 논문을 찾으려면 아주 깊이 갈 수 있습니다 메모를 읽고 이해 이 모델에 대한 자세한 내용, 모델 작성 방법, 어떤 데이터를 훈련 받았는지 항상 당신이있을 때마다 물어 매우 중요한 질문 기계 학습 모델을 사용합니다 여기에 귀속이있는 것을 볼 수 있습니다 이것이 모델을 훈련시킨 조직입니다 이들은 논문의 저자입니다

크기가 만들어 졌을 때 CPU 및 GPU가 지원되는 경우 갤러리 아래로 갈 수도 있습니다 그리고 우리는 생성 된 일부 이미지 만 볼 수 있습니다 아이디어를 얻을 수 있습니다 이것은 무언가를 테마로 한 모델입니다

이미지 분할이라고합니다 여기에 이미지가 있습니다 이미지 세분화는 무엇을 의미합니까? 이 이미지는 여러 조각으로 나뉘어져 있습니다 다른 세그먼트의 이러한 세그먼트는 색상으로 표시됩니다

보라색 부분, 분홍색 부분이 있습니다 연한 녹색 세그먼트 그리고이 색상들은 모델의 레이블과 연결되어 있습니다 본질적으로, 그것은 일종의 일에 대해 알고 있습니다 그 영역에 그릴 수 있습니다

따라서 이미지 분할을 두 가지 방법으로 수행 할 수 있습니다 내 이미지처럼 기존 이미지를 가져올 수 있습니다 오, 나는 그것을 분류하려고합니다 여기가 내 머리입니다 여기가 내 손입니다

여기가 내 손입니다 또는 정렬별로 이미지를 생성 할 수 있습니다 빈 이미지에 그리기, 여기에 손을 넣어 말하는 여기 머리를 올려 이것이 바로 이미지 분할입니다 적어도 내가 이해하는 방식입니다 내가 지금까지 무엇을 했습니까? Runway를 다운로드했습니다

나는 모델을 찔렀습니다 그리고 방금 하나를 클릭했습니다 이제 그 모델을 사용하고 싶습니다 나는 그것을 가지고 놀고 싶다 나는 그것을보고 싶다

여기 작업 공간에 추가로갑니다 바로 여기에 있습니다 작업 공간에 추가하십시오 이제는 아직 작업 공간이 없습니다 그래서 하나를 만들어야합니다

이 작업 공간을 호출하겠습니다 코딩 기차 라이브 스트림을 말하겠습니다 그래서 저는 그렇게 할 것입니다 Create를 누르겠습니다 이제 작업 공간이 있습니다

보시다시피, 이것은 내 작업 공간입니다 이 작업 공간에 하나의 모델 만 추가했습니다 그리고 지금 당장해야 할 일을 강조하고 있습니다 입력 소스를 선택해야합니다 따라서 모든 기계 학습 모델이 다릅니다

그들 중 일부는 텍스트 입력을 기대합니다 그들 중 일부는 이미지 입력을 기대합니다 그들 중 일부는 입력을 기대할 수 있습니다 스프레드 시트에서 임의의 과학 데이터 그런 다음 모델은 입력을 받아 실행합니다

모델을 통해 출력합니다 그리고 그 출력은 숫자 일 수 있습니다 또는 이미지 일 수도 있습니다 또는 더 많은 텍스트 일 ​​수 있습니다 이제 우리는 사례별로 일종의 공간에 있습니다

그러나 이미지 분할을 올바르게 이해하면 나는 입력과 출력을 확신한다 둘 다 이미지가 될 것입니다 작은 다이어그램을 만들어 봅시다 우리는 이것을 가지고 있습니다 이 모델은 다시 무엇을 불렀습니까? 스페이드 코코 이 머신 러닝 모델이 있습니다

아마도 여기에는 신경망 아키텍처가 있습니다 어쩌면 컨볼 루션 레이어가있을 수도 있습니다 이것은 우리가 그 논문을 읽고 싶을 것입니다 자세한 내용을 알아보십시오 런웨이는 우리가 그것을 즉시 사용할 수있게 해줄 것입니다

그리고 나는 항상 추천합니다 사용 방법에 대해 자세히 알아 보려면 이에 대해 자세히 읽어보십시오 여기 내 가정은 내가 만들고 싶은 소프트웨어에 있습니다 소프트웨어의 그림 조각을 만들고 싶습니다 사용자가 이미지를 분할 할 수 있습니다 아마 당신은 내가 일종의 추첨을 할 것이라고 상상할 수 있습니다 한 가지 색입니다 다른 색의 마커를 사용할 수 있습니다

이 이미지를 무리로 채울 것입니다 다른 색상 그런 다음 모델에이를 공급할 것입니다 그리고 밖으로 이미지가 올 것이다 우리는 입력했습니다

그리고 우리는 출력했습니다 그리고 다시, 이것은 모든 모델마다 다를 것입니다 활주로에서 선택할 수 있습니다 그럼에도 불구하고 많은 규칙이 있습니다 많은 모델들이 이미지를 기대합니다 입력 및 출력 이미지로 그들 중 일부는 텍스트를 입력으로 기대하고 이미지를 출력합니다

또는 입력 및 출력 텍스트로 이미지 등등 그리고 등등 그리고 지금하고 싶은 것은 입력 소스를 선택하는 것입니다 모델의 활주로에서 세그먼트 화 된 이미지를 생성 할 것입니다

그래서 그것은 파일에서 올 수 있습니다 실제로 네트워크 연결에서 올 수 있습니다 앞으로의 비디오에 들어가서 또는 스스로 탐색 할 수 있습니다 난 그냥 세분화를 선택합니다 알아

이것은 가장 위대한 것입니다 방금 일어난 일은 이미지 분할입니다 머신 러닝 모델의 일반적인 기능입니다 활주로에 전체 드로잉 엔진이 내장되어 있으므로 이미지 세분화로 놀 수 있습니다 보시다시피, 이것은 다른 라벨의 색상입니다 많은 교통 수단 인 것 같습니다

어쩌면 내가 원하는 것은 시도하자 사람들을 그려 봅시다 [음악 재생] 비행기와 와인 글라스 비행 오버 헤드와 두 사람 승인 일은 잘되고 있니? 이제 출력을 선택하겠습니다 그리고 나는 단지 미리보기를 원합니다

권리? 미리보기는 지금 내 보내지 않아도됩니다 다른 곳에서는 사용할 필요가 없습니다 난 그냥 Runway 자체에서 놀고 싶습니다 미리보기를하겠습니다 이제 입력을 선택했습니다

세그먼트입니다 활주로 자체의 인터페이스 출력을 선택했습니다 미리보기입니다 이제 모델을 실행할 차례입니다

우리가 간다 원격으로 실행하십시오 따라서 원격 GPU가 활성화되었습니다 가입 만하면 볼 수 있습니다 Runway의 경우 원격 GPU 크레딧 10 달러 한 번만 얼마나 실행하는지 보는 것이 재미있을 것입니다 실제로 사용합니다

한 가지만 말씀 드리겠습니다 추가 크레딧을 받고 싶은데 여기로 갈 수 있습니다 이것은 내 프로필의 일종의 아이콘과 같습니다 클릭 할 수 있습니다 이제 여기로갑니다

더 많은 크레딧 받기로갑니다 그리고 이것은 나를 브라우저 페이지로 데려 갈 것입니다 그리고 더 많은 크레딧을 지불 할 수있었습니다 하지만 여기를 클릭하겠습니다 CODINGTRAIN을 말하여 크레딧을 사용하겠습니다

바로 여기에 따라서 10 달러의 크레딧을 추가로 받으려면 당신은 이것을 할 수 있습니다 그리고 우리는 지금 20 달러의 크레딧이 있어야한다는 것을 알 수 있습니다 여기이 아이콘이 표시되어 있습니다 여기이 아이콘은 작업 공간입니다

그 중 하나의 모델로 하나만 가지고 있습니다 원격 GPU에 연결되어 있습니다 다른 모델을보고 싶다면 이 아이콘으로갑니다 괜찮아 이제 원격 실행을 누르겠습니다

[드럼 롤] 모델을 원격으로 실행 우와! [TA-DA] 어머 아 너무 예뻐요 무아 믿을 수 없어 이것이 바로 스페이드 코코 머신 러닝입니다 모델 생성

여기서 결과를 보는 것은 정말 흥미 롭습니다 그래서 당신은 생각할 수, 아무것도 몰라 이 모델에 대해, 작동 방식과 기대하는 것, 당신은 그것으로 꽤 이상한 결과를 얻을 수 있습니다 아마도 내가 좀 더 사려 깊다면 아마도 전체 공간을 가득 채우고 아마 너무 많이 비워두고 또한 두 사람과 함께 거대한 와인 잔을 포함 시켰습니다 좀 소름 끼치 네요 비록 이런 종류의 저와 비슷하다고 생각합니다 이상한 방식으로 그리고 우리는 여기서 볼 수 있습니다

이것 좀봐 $ 005 제가 언급해야 할 것은 이유입니다 왜 오랜 시간이 걸 렸어요 서버와 실제로 시작할 모든 것 모델을 실행합니다 하지만 이제 실시간으로 실행되므로 훨씬 빨리 일어날 수 있습니다 작성해 봅시다

그렇다면 그것을 채우는 것이 좋은 것입니까? 바닥재를 사용해 봅시다 나무 바닥으로 채우도록하겠습니다 오 우와 그런 다음 과일을 넣으십시오 아 이것은 지금 훨씬 나아 보입니다 옆에 오렌지를 넣자

오렌지 몇 개를 넣고 작은 과일 그릇을 만들어 봅시다 와우 이건 미친 짓이야 와우 나는 멈춰야했다 꽤 놀랍습니다

다시 한 번, 여기 잠시 후 방법에 대해 조금 더 생각하는 이 모델은 실제로 작동합니다 그리고 잘 알려진 데이터 세트를 살펴보면 코코 이미지 데이터 세트가 아마 나에게 더 많은 정보를 줄거야 그것이 잘 될 일에 대해 생각합니다 그러나 당신은 그것이 어떻게 볼 수 있는지 볼 수 있습니다 여기 나무 배경에 과일의 작은 더미 거의 천처럼 보입니다

마치 테이블 위에 앉아있는 것처럼 말입니다 매우 현실적입니다 그리고 그렇습니다 찰리 잉글랜드는 지적합니다 이것은 GPU 크레딧을 계속 사용하고 있습니다

그래도 여전히 볼 수 있습니다 라이브 페인팅을 많이해도 방금 $ 010을 사용했습니다 무료 $ 10로 많은 것을 할 수 있습니다 그냥 놀면서

현명하게 입력하면, 여기에서 분할을 선택했습니다 그러나 파일을 사용할 수도 있습니다 컴퓨터에서 파일을 열려면 나는 그렇게 할 수 있었다 그런 다음 내보내기로 변경하면 출력 나는 또한 실제로 그것을 내보낼 수 있습니다 다양한 형식으로 하지만 물론 여기서도 바로 미리보기에서이 다운로드 저장 버튼을 클릭 할 수 있습니다

이제이 특정 이미지를 영원히 더 많이 저장하고 있습니다 파일로 자, 여기서 실제로 중요한 것은 여기서 더 중요한 것은 네트워크 아래입니다 네트워크에서 여기를 클릭하고 싶었다면 이것은 이제이 특정 기계와 통신 할 수 있다는 것을 의미합니다 내 소프트웨어에서 학습 모델 내가 다운로드했거나 구매 한 소프트웨어인지 여부 다른 사람이 말한 것을 이러한 특정 프로토콜 중 하나 또는 내가 쓰고있는 자체 소프트웨어 거의 모든 프로그래밍 언어 또는 환경 프레임 워크, 모듈 또는 라이브러리가있는 경우 또는 이러한 유형의 프로토콜을 지원하십시오 여기 JavaScript의 좋은 점 중 하나는 JavaScript를 클릭하면 실제로 여기에 약간의 코드가 있음을 알 수 있습니다

실제로 자바 스크립트에 복사 / 붙여 넣기 만하면됩니다 직접 다시 올게요 OSC는 또한 매우 인기있는 메시징 네트워크 프로토콜입니다 창조적 인 코더를 위해 Open Sound Control의 약자이며 응용 프로그램간에 데이터를 보내야합니다

별도의 동영상으로 다시 돌아오겠습니다 이 중 일부가 어떻게 작동하는지 보여줍니다 또한 귀하의 Runway 소프트웨어에 대해서도 언급해야합니다 자체는 소프트웨어와 매우 유사한 방식으로 작동합니다 익숙한 Wekinator라고합니다 Wekinator는 Rebecca Fiebrink가 만든 소프트웨어입니다 몇 년 전에 OSC 메시징을 통해 데이터가 전송되는 신경망 그리고 사실 후에 그 결과를 얻습니다 비록 여기서 중요한 차이점은 런웨이라고 생각합니다

정말 큰 보물을 지원하도록 설정되어 있습니다 사전 훈련 된 모델 Wekinator는 신경망 교육에 더 많은 반면 작은 비트의 데이터로 즉석에서 런웨이가 계획하고있는 것 중 하나는 아마 9 월에 나올 것입니다 자신의 모델을 훈련시키는 기능도 있습니다 이번 런웨이 소개를 시청 해 주셔서 감사합니다 다운로드 및 설치의 기본 사항 소프트웨어, 높은 수준의 관점에서 볼 때 인터페이스 작업의 특징, 무료 클라우드를 얻는 방법 크레딧 그리고 내가 당신에게 제안하는 것은 이 비디오가 다운로드 된 후 소프트웨어를 실행 한 후 이 모델 찾아보기 페이지로 이동하십시오

보시다시피, 다양한 모델이 있습니다 모션, 생성, 커뮤니티, 텍스트, 인식 여기를 클릭하십시오 이 인식을 시도해 봅시다 얼굴 인식 조밀 한 캡

여기 PoseNet은 어디에 있습니까? 동작이 어려울 수 있습니까? DensePose PoseNet 여기 PoseNet이라는 모델이 있습니다 한 명 이상의 사람에 대한 실시간 골격 추적을 수행합니다 이 모델을 다른 라이브러리에서 다루었습니다 TensorFlow JS가있는 ML5 JS 라이브러리와 같습니다

다음 비디오에서하려고하는 것은 내 웹캠으로 Runway에서이 모델 PoseNet을 사용하고 있습니까? 이 컴퓨터에서 로컬로 실행 클라우드 크레딧을 요구하지 않고 이 모델의 결과를 [? 처리?] 자체 전체 워크 플로우를 보여 드리겠습니다 그러나 찌르십시오 주위를 클릭하십시오 원하는 모델을 찾으십시오

의견에 대해 알려주십시오 당신이 만든 이미지를 공유하십시오 그리고 난 당신이 활주로로 무엇을보고 기대합니다 큰 시청 해 주셔서 감사합니다

[음악 재생]

Crowdsource by Google: Building better products for everyone with machine learning

머신 러닝에 대해 들어 봤지만 무엇입니까? "기계 학습"은 컴퓨터가 몇 가지 예를보고 기술을 습득 할 수있게하는 기술입니다 규칙 세트 대신에

기계 학습을 통해 일상적인 작업을보다 쉽게 ​​수행 할 수 있습니다 좋아하는 사진 검색, 어떤 언어로든 사람과 대화하고 전 세계 어디든 가고 싶은 곳으로 정확하게 이동할 수 있습니다 기계는 어떻게 배우나요? 기계 학습에서 컴퓨터는 일련의 데이터를 통해 공통 패턴을 찾고 식별하고 학습합니다 예를 들어 컴퓨터에 많은 자동차 이미지를 보여 주면 어떤 그림에서든 자동차를 인식하는 방법을 배울 수 있습니다 우리가 보여주는 다양한 자동차 이미지는 더 잘 인식됩니다

따라서 Crowdsource 앱에 대한 귀하의 기여가 중요합니다 컴퓨터가 배울 수있는 정확한 예를 만들고 확인하는 데 도움이됩니다 이는 모든 사람에게 혜택을 줄 수있는 기능을 활성화합니다 이미지 레이블을 확인하면 Google 포토 및 Google 렌즈와 같은 앱이 사진을 분류하고 물체를 식별하는 데 도움이됩니다 문장의 정서에 라벨을 붙이면 Google지도 및 Google Play에서 사용자 언어로 리뷰를 구성하는 데 도움이됩니다

번역을 확인하면 Google Translate가 귀하의 언어로보다 정확한 번역을하도록 도와줍니다 덕분에 좋아하는 앱이 모두에게 도움이됩니다 전 세계 크라우드 소싱 커뮤니티의 일환으로 귀하의 국가 및 전 세계의 기고자들과 함께 수백만의 사례를 제공하고 있습니다 귀하의 답변은 수천 명의 다른 사용자의 답변과 결합되어“최상의”답변을 결정합니다이를“지상 진실”이라고합니다

실제 기술은 특정 기술을 습득 할 수있는 패턴을 찾는 기계 학습 모델에 적용됩니다 사진에서 자동차를 식별하는 방법 또는 한 언어에서 다른 언어로 번역하는 방법 등이 있습니다 기계가 배우는 것은 주어진 데이터에 의해 제한됩니다 세계의 작은 지역에서 온 이미지로 이미지 인식 알고리즘을 개발하면 세계의 해당 부분에서만 객체를 인식합니다 사진과 같은 앱이 모든 사람에게 잘 작동하려면 세계 각지의 이미지를 사용하여 기계를 훈련시켜야합니다

Crowdsource를 사용하면 교육 데이터에서 지역, 언어 및 의견을 나타냅니다 커뮤니티에 참여해 주셔서 감사합니다!

[CVPR 2019] AD-PSGD Algorithm for Deep Learning, Prof. Ji Liu, Director @ Kuaishou Seattle AI Lab

중국에서 35 세 미만의 MIT 혁신 자 중 하나 인 비동기 분산 형 병렬 확률 적 경사 구배 알고리즘 (AD-PSGD) 이 알고리즘의 기여는 무엇입니까? 네

비동기 및 분권화는 매우 중요하고 강력한 도구입니다 깊은 학습의 훈련 과정 이 두 가지 새로운 기술은 실제로 동기화 오버 헤드를 줄입니다 그것을하는 전통적인 방법을 끊습니다 그리고이 두 기술은 현재 TensorFlow 및 PyTorch와 같은 널리 사용되는 서버에서 널리 사용되었습니다

그리고 우리는 이런 종류의 것들이 전통적인 최적화 사람과 구현 사람들 사실,이 두 집단의 사람들 사이에는 큰 격차가 있습니다 최적화 사람들 알고리즘을 이해할 수 있지만, 하드웨어에 대한 지식은 매우 제한적입니다 구현이므로 알고리즘을 설계 할 때 구현에서 거의 고려하지 않습니다 원근법

그러나 사람들을 구현하는 사람들은 코드를 하드웨어로 프로그래밍합니다 운수 나쁘게, 알고리즘 측면에 대한 지식은 매우 제한적입니다 그래서 이것은 차이입니다 그리고 내 일 이 격차를 메우고 공동 최적화를 시도하고, 알고리즘과 하드웨어를 사용하여 성능을 최적화하고 교육 프로세스를 최적화합니다 이것이 주요 기여입니다

이 작품의 목적

Data Efficient Reinforcement learning for Autonomous Robots with Simulated and Off-policy Data

[음악] >> 좋아 고맙습니다

저를 여기 데려다 주셔서 감사합니다 내가하고있는 것을 공유 할 기회 그래서 우리는 세계의 아이들을 봅니다 걷고 경험을 통해 배울 수 있습니다 그들은 더 빠르고 안정적으로 걷는 법을 배웁니다

로봇 공학에서 로봇을 프로그래밍하여 아무리 얼마나 걸어도 걷는다 이 로봇은 들판을 따라 앞뒤로 걷고, 더 빠르고 안정적이지는 않습니다 그래서 제 연구에서, 나는 로봇이 실제로 경험을 통해 어떻게 배울 수 있는지 보여 줬다 그들이 배울 수있는 경험이있는 걷는 것이 훨씬 빠르고 안정적이게됩니다 실제로 누구보다도 빠르게 전에이 특정한 로봇을 프로그램하십시오

내 연구의 일반적인 그림은 내가 원하는 것입니다 컴퓨터와 로봇이 목표를 달성하기 위해 행동을 취하는 방법을 배우십시오 따라서 로봇에만 집중하는 것이 아니라 잠재적으로 더 많은 분야에 적용 가능합니다 이것은 구체적으로 무엇을 의미합니까? 그 컴퓨터 또는 로봇, 내가 에이전트라고 부르는 것은 정책을 배울 수 있어야한다 주어진 세계의 어떤 주를지도 할 것입니다 목표 달성을위한 행동으로 옮깁니다

따라서 이것은 분야의 목표와 동일합니다 보강 학습과 나는 아마 많은 것이라고 생각한다 너 모두 여기에 익숙하다 많은 관심을 끌고있다 강화 학습이 진행되고있는 성공 사례

그것은 지난 몇 년 동안 학습 강화에서 나왔습니다 그래서 초인간 공연과 비디오 게임, 고어 게임에서의 퍼포먼스, 축구를 배우는 시뮬레이트 로봇, 그리고 나서 일부 산업 웹 마케팅과 같은 성공 사례 Microsoft에서 이뤄진 일부 작업은 그 중 일부에 기여합니다 데이터 센터 제어 또는 가정 자동 온도 조절 시스템 제어 그러나 이러한 모든 성공과 함께, 물론 좀 더 가까이서 보면, 우리가 볼 수있는 것은 이러한 학습 시스템은 그리 효율적이지 않습니다

그래서이 Atari 비디오 게임 결과 전에는 5 천만 건의 행동을 취하는 요원을 동원해야한다 바둑 게임의 좋은 정책 21 일간의 셀프 플레이, 수백만 및 수백만 개의 게임과 하나의 예로서, 여기에 시뮬레이션 로봇, 계산 시간의 1 년 반 축구를하는 모든 기술을 배우기 따라서 우리가이 보강 학습이 적용되기를 원한다면 실제 로봇 또는 건강 관리 또는 더 많은 데이터 희소 한 설정, 아직해야 할 일이 많이 남아 있습니다 나는 많은 사람들이 산업계와 학계 모두가 요구하는 것은, 강화 학습이 데이터 효율적 일 수 있는가? 실제 응용 프로그램에 충분합니까? 이것이 나의 연구에도 동기를 부여하는 질문입니다 그러나 나는이 질문에 답하기 전에, 실제로 또 다른 질문이 있습니다

우리가 무엇을 요구해야하는지, 에이전트가 어떻게 행동의 효과를 예측할 수 있습니까? 의미, 내가 이것을한다면, 그 때 이것은 예상 한 결과이고, 대신에 나는 그것을 한 경우에, 이것은 내가 기대해야하는 것입니다 나는 몇 가지 이야기를 할 것이다 우리가 본 다른 방법들 내 연구에서이 예측 질문에 첫 번째 정책은 고정 된 정책을 제공하는 것입니다 작업을 수행하는 방법

우리가 기대하는 성과는 무엇입니까? 그 일을 성취하기 위해 우리가 그 정책을 사용했는지 확인하십시오 내가 이야기 할 또 다른 점은 에이전트가 행동이 어떻게 될지 예측하라 세계의 기본 상태를 변경하십시오 그래서 저는 어떻게 우리가 어떻게 이런 질문을 할 것인가부터 시작하려고합니다 고정 된 동작의 성능을 평가합니다

그러나 그것에 뛰어 들기 전에, 보강 학습 설정을 간단히 소개하겠습니다 이미 익숙하다면, 이것은 내 가정의 일부를 얻을 수있는 유일한 방법입니다 나는 테이블에 나와 열려서 우리는 모두 같은 페이지에 있습니다 그래서 보강 학습 세계 일반적으로 정의되는 몇 가지 구성 요소가 있습니다 나는 이것을 다음과 같이 소개 할 것이다

토크의 첫 부분에서 사용할 예제 목적지에 도달하기 위해 운전하는 자율 차량의 따라서 정의해야 할 첫 번째 것은 자율 차량을위한 주 공간 이 위치는 세계 또는 다른 차가 그것에 관련되어있는 곳 이것은 의사 결정에 필요한 모든 정보입니다 차량은 그것에 영향을 미치는 행동을 이용할 수 있습니다 세계와 같은 기본 상태 휠 조향, 제동 또는 가속

그렇다면 보상에 대한 개념이 있습니다 작업에서 성공할 수있는 것을 캡처합니다 어쩌면 당신은 단지 작은 보상을 얻습니다 목적지에 도달하고 사고가 났을 때, 매우 큰 부정적인 형벌을받을 수 있습니다 마지막으로, 정책 에이전트의 동작을 정의하는 것입니다

그래서 세계 어느 주에서도, 정책은 에이전트에게 에이전트에게 목표를 달성하기위한 조치를 취해야합니다 설정의 상호 작용이 순차적으로 발생합니다 그것은 단지 하나의 행동을 선택하는 것이 아닙니다 그러나 에이전트는 한 상태에서 시작합니다 그것은 행동을 취할 것이고, 그 행동이 얼마나 좋은지에 따라 보상을 받는다

특정 상태로 전환 한 다음 새로운 상태로 전환합니다 이 과정이 반복되므로 제가 일반적으로 저의 작업에서 가정하는 한 가지는 이 상호 작용은 몇 단계의 고정 된 숫자 에이전트는 초기 상태로 돌아가서 작업을 다시 시도 할 수 있습니다 이 전체 상호 작용 순서는 다음과 같습니다 국가 행동 보상 공간을 통한 궤도라고 부른다 이제 보강 학습에서, 대부분의 사람들이 생각하는 문제 정책 개선에 관한 것입니다

우리는 몇 가지 구체적인 임무를 부여 받았다 어떤 정책을 찾아야합니까? 우리가 얻을 수있는 보상의 양을 극대화합니다 하지만 또 다른 중요한 요소가 있습니다 보강 학습 문제는 우리가 고정 정책을받는 곳에서의 정책 평가 우리는 그것을 개선하려고 노력하지 않을 것이지만 우리는 단지 그것을 알고 싶어합니다

이 정책을 실행하면 얼마나 많은 보상을받을 수 있습니까? 나는 이것이 더 중요한 문제라고 주장 할 것이다 정책 개선보다 우선, 일반적으로 필요한 첫 번째 단계입니다 좋은 정책을 배우고 싶다면, 먼저 현재 정책을 평가할 수 있어야합니다 둘째, 현실 세계에서 시스템을 배포하려는 경우, 이게 얼마나 잘되고 있는지 알고 싶어 내가 그것을 밖으로두고 그것을하기 전에 할 일 그것은 실제 사람들과 실제 물건들과 상호 작용합니다

그럼 내가 가자 정책 평가 문제에 대해 좀 더 자세히 살펴 보겠습니다 그래서이 자치 차량을 상상해보십시오 운전할 때 두 가지 결과 중 하나가 나타납니다 나는 여기에서 확실히 단순화하고있다

물론 현실 세계에는 무한한 수의 다른 가능성들 이 차량이 경험할 수있는 것 하지만 아주 높은 확률로 말하자 그것은 목적지에 도달하고 매우 낮은 확률이있다 안전 운전자는 차 충돌을 막기 위해 개입하십시오 이러한 결과는 다음과 같이 계량 할 수 있습니다

차량이받을 보상의 금액 그래서 목적지에 도달하는 것은 아마도 작은 긍정적 인 사건 일 것입니다 개입하는 안전 운전자 매우 강한 부정적인 사건이다 따라서 정책을 평가하는 것은 평가의 문제 일뿐입니다 결과가 될 것으로 예상되는 가치 이것이 어려워지는 곳 강화 학습 설정은 이러한 결과가 단 한 번의 사물이지만 그들은 실제로 탄도에서 일어나고 있습니다

그래서 우리는 모든 개인 결정을 가지고 있습니다 이러한 결과를 얻기 위해 함께 결합 될 수 있습니다 그래서이 확률은 그 자체가 알려져 있지 않습니다 분석적으로 만 할 수는 없습니다 정책을 실행할 때 발생할 일을 계산하십시오

이것이 실제로있는 곳 중 하나입니다 우리가 정책 평가를하는 방법을 고려하는 것이 중요합니다 이것의 더 형식적인 개념은, 이 예제에서 벗어나는 대신에 우리는 우리가 평가하기를 원하는 목표 정책 우리는 목표 정책이 현재 상태에서 주어진 행동에 대한 분포, 우리가 알고 싶은 것은 예상되는 총 보상 우리가이 방침을 실행할 때 궤적을 따라 받게됩니다 그렇다면 왜 우리는 이것을 신경 쓰나요? 그래서 당신이 스스로 운전하는 자동차 회사의 엔지니어라고 상상해보십시오

당신은 새로운 정책을 추진하고 있습니다 사용자는 차를 제어하려고했습니다 그래서 내가 바라는 한가지 엔지니어가하는자가 운전의 자동차 이 상황에서 그들은 것입니다; 그걸 밀어 내기 전에, 그들은 정책을 테스트하는 데 약간의 시간을 할애하고, 무슨 일이 일어나고 있는지에 대한 매우 정확한 평가를 얻으려고 노력한다 이 정책을 실제 사용자에게 적용 할 때 일어날 수 있습니다 그런 다음이 테스트 단계가 끝난 후, 배포 단계가있을 것입니다

정책은 실제로 현실 세계에서 나옵니다 배포 단계에서 당신은 거기에있을 것이라고 기대할 수 있습니다 안전 메커니즘이 훨씬 적다 정책이 정말 나쁜 일을하는 곳 따라서 테스트 시간은 정책 평가가 필요한 부분입니다

그래서 이것이 아마도 이루어질 것이라고 상상했던 것은, 당신은 매우 많은 수의 테스트 드라이버를 고용 할 것입니다 당신은 그들에게이 정책을 실행하는 차를 줄 것입니다 그들은 각각 정책을 실행하는 궤적을 수집 할 것입니다 정책이 얼마나 잘 수행되었는지보고하고, 당연히 보상을 받고 이것을 정량화하십시오 이 정보에서, 당신이 이것을하면, 너는 어떻게 할 수 있겠는가? 잘 정책은 수행 할 것입니다

그래서 이것은 매우 자연스러운 방법입니다 정책을 평가하지만 내가 원하는 것은 무엇인가? 여기에서 강조하고 싶은 것은 이것을하기위한 매우 수동적 인 접근법입니다 방금 정책을 실행하고 어떤 일이 벌어지고 있는지보고 있습니다 왜 그렇게 나쁜지에 대해 잠깐 이야기 할 것입니다 하지만 먼저 나는 이 일을하는 일반적인 방법은 몬테카를로 평가라고합니다

보강 학습 환경에서, 대상 정책을 반복적으로 실행하고, 국가 행동이나 보상 궤적을 관찰하고, 총 보상의 평균을 구하십시오 각 궤적을 가로 질러 보입니다 이 작업을 수행하는 정말 간단한 방법입니다 이 방법으로 문제를 일으키는 것은 매우 드문 결과가 있지만 매우 큰 영향 귀하의 정책 가치에 대한 귀하의 예상치는 얼마입니까? 예를 들어,이 경우, 안전 운전자는 거의 볼 수 없습니다 개입해야하고 그리울지도 모른다

더 자주 보게되면 진정한 확률은 그런 식으로 매우 부정확 한 추정을 얻을 수 있습니다 그래서 이것은 x 축상에 이것을 보여주는 것이고 여기서 얼마나 많은 데이터가 수집되는지 y 축은 예상치를 나타냅니다 파란색 파선은 당신이 추정하려고하는 진정한 가치 너는 과대 평가일지도 몰라 당신의 정책 가치, 그리고 당신이 얻을 때 이 희귀 한 사건 하나, 당신의 가치는 흔들릴 것입니다

주위에 당신이 수집 할 때까지되지 않을거야 매우 많은 양의 큰 숫자의 법칙에 의해서만 나온 데이터 당신의 정책 가치를 잘 예측할 수있게 될 것입니다 따라서 실제로이 설정에서 수행하는 것이 더 나은 것은 무엇입니까? 데이터를 수집하는 방법에보다 적극적으로 접근하는 것입니다 즉, 여기서하고 싶은 것은 우리가 원하는 것입니다 확률을 높이다 안전 운전자가 개입해야합니다

우리가 그렇게한다면, 우리는 더 나은 정량화를 얻을 수 있습니다 그 사건이 우리의 예상 보상에 미치는 영향 나는 정책 평가가 다소 안전의 적용에 의해 동기 부여됩니다 그래서 나는 지금 우리가해야한다고 옹호하고있다 매우 나쁜 사건의 확률을 증가시킨다

그래서 이상하게 들리면, 이런 종류의 설정에 대해 정확히 생각하고 있습니다 우리는 안전 메커니즘을 적절히 배치 할 수 있습니다 여기에 개입 할 안전 운전자가있는 것처럼, 그래서 우리는 아주 좋은 견적을 얻을 수 있습니다 우리가 오기 전에 정책 가치 컨트롤이없는 설정입니다 무슨 일이 일어나 든간에 큰 손해 등을 초래할 수 있습니다

그래서 나 한테 동의한다면 우리가 정책 평가를하는 방식에보다 적극적으로, 확률을 높이는 이러한 중요한 부정적인 사건은 좋은 것일 수 있습니다 기술적 인 문제가 여전히 남아 있습니다 이 일을 할 수있게 남아 있습니다 따라서 이러한 기술적 과제 중 첫 번째는 일단 데이터 수집에 대한보다 적극적인 접근을 취하면, 지금은 우리가 볼 결과의 분포 우리가이 분포를 이동했기 때문에, 우리는 더 이상 평균을 낼 수 없다

우리가 수동적 접근에서하는 것처럼 관찰 한 보상 두 번째 것은 우리가 궤적을 생성하기 때문에, 그림을 그릴 수있는 특별한 정책이 필요합니다 이러한 중요한 사건들을 어떻게 일으키는 지 알아보십시오 그래서 우리는 무엇이 필요한지 알아야합니다 올바른 데이터 수집 정책을보다 적극적으로 활용할 수 있습니다

이 두 번째 기술적 과제에 내 작품이 기여한 곳 먼저 우리가 어떻게 대응할 수 있는지에 대해 조금 이야기 할 것입니다 이 변화하는 데이터 분배 문제 이는 두 번째 부분에서 필요하기 때문입니다 하지만 계속하기 전에 일부 용어를 곧바로 이해하는 것만 큼 좋습니다 내가 목표 정책을 말할 때, 나는 우리가 평가하고자하는 정책을 의미합니다

내가 행동 정책을 말할 때, 우리가 데이터를 수집하기 위해 배포 할 정책을 의미합니다 처음으로이 첫 번째 문제를 먼저 생각해보십시오 변화하는 데이터 분포를 어떻게 처리 할 것인가? 우리가 실행하는 정책을 변경할 때? 이제 우리가 지금 달리고 있다고 상상해보십시오 50 퍼센트의 확률을 가진 행동 정책, 목적지에 도달하고 나머지 50 % 확률은 안전 운전자가 개입해야 할 필요가 있습니다 그래서 첫 번째 결과 만보고, 우리는 이제 우리가 목적지에 약 절반 정도 자주 도착하십시오

그래서 이것을 바로 잡기위한 아주 간단한 트릭입니다 당신이 보는 결과를 단지 곱하는 것입니다 요인의 주위에 두 가지가 있습니다 따라서 이것이 우리가 그 사건을 우리가 그렇지 않은만큼 많이 보지 못했습니다 이렇게하는 일반적인 방법은 중요한 샘플링 및 널리 사용되는 기술입니다

간단히 소개하겠습니다 또는 RL 설정에서 사용 된 방법 우선 우리는 반복적으로 행동 정책을 실행합니다 우리는 다음과 함께받은 모든 보상을 합산합니다 각각의 궤도는 우리가 수동적 인 접근에서와 마찬가지입니다

하지만 여기서 핵심은 우리는 보상 총계를 다시 재 계산합니다 이것이 정확히 어떻게 이해해야 할 필요는 없습니다 완료되었지만 기본적으로 보상을 합산하는 것입니다 수동적 접근 방식에서와 마찬가지로 상대 우도 요소를 곱하는 것입니다 따라서이 요소는 if 이 결과는 저의 목표 정책에 따라 더 많이 나타났습니다

행동 정책은 그것에 대한 무게를 증가시킵니다 가능성이 낮 으면, 그 위에 무게를 줄이자 일단 우리가 다시 가중치를 주면, 우리는 관찰 된 데이터를 사용할 수 있습니다 마치 우리의 이익 정책에서 나온 것처럼 말입니다 그래서 이것은 중요한 샘플링을 만든다

매우 일반적인 기술 우리가 해결할 수있게 해준다 우리가 여기에서 가지고있는 첫번째 기술적 도전 그러나 우리는 여전히 올바른 행동 정책이 무엇인지 알지 못합니다 이것이 내가 다음에 이야기 할 내용입니다 그래서 나 자신과 공동 작업자 이 문제를 보거나 질문하기 우리가 보낼 수만 있다면 우리가 설명한 설정에서 단일 테스트 드라이버

>> 그게 나를 괴롭 히고있어 그래서 국가가 있다고 가정 해 봅시다 안전 운전자가 필요한 곳 거칠게 상태에 도달하는 것처럼 그래서 측면에서, 나를 데려 오는 정책에 대해 생각합니다 당신의 예를 들어 그 주 서식지 예를 들어, 나는 내 마음 속에서 그 목표를 가질 수있다

그러나 그 방침으로 떠오른다 거칠게 보인다 보강 학습 문제를 해결하는 것으로, 왜냐하면 나는 지금 능력을 생각하고있어 실제로이 상을 최대화하십시오 MDP에서 그 상태에 도달하고있다

그래서 아마도 그것은 개념적 어려움 일 것입니다 문제가있다 좋은 데이터 연결 정책을 알아 내려고 노력한 결과, 기본적으로 힘들 수 있습니다 보강 학습 문제로서, 아니면 이런 것들을 하나로 묶는 구조가 있습니까? >> 네, 큰 질문입니다 우선, 우리는 주로 집중하고 있다고 생각합니다

여기에서 정책 평가의 문제에 대해 그래서 우리가 묻는 주요 질문은, 그냥 달리다 해당 정책을 사용하여 데이터를 생성하고, 보다 효율적입니다 정책을 적용하고이를 사용하여 데이터를 생성합니까? 그래서 이야기에서 조금 건너 뛰는 대답은, 예, 그렇게하는 것이 더 효율적입니다 정책 개선 질문의 관점에서, 우리가 여기있는 일을 그 환경에 적응시킬 수 있겠 어? 대답은 다시 예입니다 원칙적으로, 거기에 몇 가지 다른 도전이 있습니다

우리가 할 일은 직관적으로 생각합니다 발견을위한 강화 학습 더 나은 데이터 수집 정책 그래서 우리는이 질문으로 시작했습니다 만약 우리가 하나의 궤도를 수집 할 수 있다면 어떨까요? 우리는 완벽한 평가를 얻을 수 있을까요? 여기에 하나의 테스트 드라이버를 보내는 것만으로도 우리의 정책은 어떻습니까? 따라서 이것은 중요한 샘플링 추정치입니다 당신은 모든 수학을 따를 필요가 없습니다 그러나 우리는 기본적으로, "단일 궤적으로, 이것이 우리가 추정 한 것입니다

우리는 이것을 정확히 할 수 있을까요? 정책의 진정한 가치와 동등한가? 그래서 그것은 밝혀졌습니다 네, 그렇게 할 수 있습니다 그러나 얼마 동안은 이론적으로는, 당신은 그것이 존재한다는 것을 보여 줄 수 있습니다 실제로는 할 수 없습니다 가장 좋은 정책이 무엇인지 분석적으로 경쟁하십시오

그래서 우리는 알렉스가 여기서 제안하는 것을 할 것입니다 그리고 우리는 단지 검색 할 것입니다 우리는 더 나은 데이터 수집 정책이 무엇인지 배우게 될 것입니다 그래서 우리는 목표를 적었습니다 이것은 기계 학습에서 꽤 표준화되었습니다

이게 정확히 무엇인지 따를 필요가 없습니다 그러나 이것은 평균 제곱 오류입니다 그래서 우리는 기본적으로 진정한 가치를 봅니다 그 가치에 대한 우리의 추정치, 어떤 데이터가 주어지면 멀리 제곱 오류 관점에서 우리가 있습니다 따라서이 양을 실제로 추정 할 수 있습니다

그것은 정책의 진정한 가치를 아는 것에 달려 있기 때문에, 당신이 이미 알고 있다면 평가 문제로 끝났습니다 그러나 우리가 작업에서 보여 주었던 것은 이 목적의 기울기를 추정 할 수 있고, 행동 정책과 관련하여 그래서 이것은 지금 우리에게 메커니즘을 제공합니다 행동 정책을 적용하기위한 우리에게 더 정확한 평가를 줄 것입니다 이것이 그래픽처럼 보이는 것은, 가능한 모든 정책의 공간을 상상할 수 있다면, 여기에 x 축을 따라 압축됩니다 목표 정책부터 시작해 보겠습니다

우리가이를 사용하여 데이터를 수집한다면, 평균적으로 일정량의 오류가 발생할 것으로 예상 할 수 있습니다 그런 다음 그라디언트를 추정합니다 그 그라디언트를 따라 한 걸음 나아가십시오 우리는 평균적으로 행동 정책에 봉착하게됩니다 정책 평가를 위해 더 나은 데이터를 제공 할 것입니다

그래서 이것이 어떻게 연결되는지 궁금하면 중요한 희귀 사건의 증가에 대한 이야기, 우리가 표현한 것은 그래디언트에서 파생 된 것은 정확하게 우리에게 알려줍니다 확률을 높이는 법 심각한 희귀 한 사건이 발생할 수 있습니다 그래서 다시, 당신은 따를 필요가 없습니다 정확히이 표현이 말하는 것, 그러나 우리는 다음과 같은 한 가지 요소를 가지고 있습니다 "이러한 행동들이 그들의 확률을 증가 시킨다는 것"과 또 다른 요인 그것은 얼마나 희귀한지, 중요한 사건은 전반적으로이 표현은, "결과가 매우 드문 경우, 그것을 보는 확률을 높이는 데 큰 영향을 미칩니다

" 이제 우리는 우리가 더 나은 행동 정책을 배울 수있게 해줍니다 이 설정에서이 모양이 어떻게 보이는지, 우리는 소량의 데이터를 수집 할 것인가? 초기 목표 정책을 사용하여, 언제든지 이벤트를 발견합니다 우리 추정치에 큰 영향을 미칠 것으로 예상되는 우리는 확률을 높이고, 그리고 이것은 될 수있다 매우 좋은 데이터 수집 전략을 얻을 때까지 반복됩니다 여기에서 핵심적인 것은, 당신은 모든 데이터를 사용할 수 있습니다

정책을 평가하는 방법을 배우면서 수집하십시오 여기에 아무 낭비가 없습니다 계속해서 개선 될 것입니다 타트는 데이터를 수집하는 수동적 인 방법입니다 일반적인 전략은 우리가 목표 정책을 가진 적은 수의 궤적, 지역 정책을 개선하고, 더 많은 궤도를 수집하고, 그런 다음 모든 데이터를 사용하여이를 평가할 수 있습니다

선택적으로 원하는만큼 반복합니다 그래서이 공헌으로, 우리는 지금 올바른 행동 정책이 무엇인지 알고 있습니다 이를보다 정확한 정책 평가에 사용할 수 있습니다 그래서 몇 가지 경험적 결과를 간략하게 보여 드리겠습니다 이것들은 약간의 보강 학습 벤치 마크 문제에 있으며, y 축은 평균 자승 오차이며, 그래서 더 낮은 것이 좋습니다, x 축은 수집 된 데이터의 양입니다

몬테카를로 접근 방식입니다 그것 때문에 낮아질거야 진정한 가치에 대한 일관된 추정치 그러나 당신이 그들의 행동 정책을 동시에 적용하고 있다면, 더 많은 정확성을 더 빨리 얻을 수 있습니다 이것은 로그 – 로그 스케일에 있음을 유의하는 것이 중요합니다

따라서 결과는 30 ~ 70 %입니다 보다 정확한 정책 평가 수집 할 수있는 고정 된 양의 데이터 그래서 이것은 이야기의 첫 번째 부분을 마무리 짓고, 그냥 주요 테이크 아웃 이 점에서 나는 먼저 그것을 강조하고 싶다 정책 평가는 안전하고 신뢰할 수있는 자율 시스템 배치, 활성 데이터 수집은 이 작업을 실제로 안정적으로 수행하기위한 중요한 단계입니다 이 작품은 또한 논증 론적 추론의 더 큰 문제로, 이는 자율 요원이 갖기 위해 매우 중요합니다

그래서 내 작품도 만들어졌다 이 광범위한 질문에 여러 기여 가장 최근의 결과 중 하나는 다시, 이 중요한 표본 추출 유형 방법을 살펴 보았습니다 이는 일정 비율의 컴퓨팅에 의존합니다 그래서 우리는 그 사실을 보여주는 몇 가지 작업을 제시했습니다

이 표현의 분모를 취하면, 데이터를 샘플링하는 진정한 확률입니다 경험적 추정치로 대체한다 중요한 샘플링의 품질을 향상시킬 수 있습니다 가장 최근의 작업 중 일부입니다 이 주제에 관해서 그래서- >> [들리지 않음] 나는 특히 차에 대해 호기심이 많았던 것으로 생각한다

예를 들어 대상 정책에 대해 어떻게 생각해야합니까? 그것은 매우 좋은 정책입니다 가까운 직립 자세에서 많은 시간을 보냈습니까? 아니면 나쁜 정책입니까? 그곳에 도착하지 않는 것이 대부분입니까? 그게 할 일 이니까 정책 적응의 효과에도 영향을 미친다, 맞습니까? 그럼 그 말을 좀 할 수 있니? 네 그래서 그 정책은 부분적으로 최적화되었거나 두 극단 사이의 어딘가에 있습니다 그래서 당신이 얻는 개선의 양은 대상 정책에서 얼마나 많은 차이가 반환되는지에 따라 다릅니다

그래서 당신이 극단적 인 사람이라면, 항상보고있는 대상 정책을 실행중인 경우 똑같은 일에는 이점이 없습니다 있을 경우 항상 개선을 보게 될 것입니다 목표 정책 결과의 차이 네 그래서 실제로 전환하려고합니다

기어와 더 많은 이야기 마치 내가 한 일의 다른 부분처럼 이야기의 첫 부분에 질문이 있으면 나는 여기서 잠시 멈추고 부부를 데려 갈 수있다 예 >> 카풀에 결과를 보여 줬어 정확한 복잡한 링크는 무엇입니까? 가장 큰 링크는 무엇입니까? 너가 실제로하는 상태 손상 카풀 기반 모델에 기대하십니까? >> 그래, >> 질문에 [들리지 않음]

네 그래서 저는 우리가했던 기본적인 방법을 말할 것입니다 본질적으로 보강 알고리즘이다 당신이 이것에 익숙하다면, 정책 구배 메서드 그래서 이것을 구현하는 것 이상으로하지 않았습니다 간단한 보강 접근법

우리는 그 이상으로 확장하려고하지 않았습니다 하지만 보강은 90 년대 초 도입 된 정책 기울기 방법이있었습니다 저와 당신의 규모를 조정하는 방법을 보여주는 많은 문헌들이있었습니다 여기서도 똑같은 기법을 많이 사용할 수 있습니다 그래

예? >> 나는 같은 질문을 가지고있다 당신이 당신의 [들리지 않음]에서 조사한 지평선은 무엇 이었습니까? >> 그런 것들, 제가 방금 전 보여준 것들은 200 시간 간격의 두 수평선 그래, 네가 원하는지 모르겠다 너의 질문은 어떤 것 같아 중요한 샘플링 및 긴 지평선 문제

직감적으로 무슨 일이 일어 났는지 생각합니다 목표 정책에 근접하게 될 정책을 학습하고, 그러나이 극단적 인 희소 한 사건에 도착하는 방법이있는 경우에, 그러한 행동의 가능성을 높일 것입니다 그래서 당신은 정말로 평상시와 똑같은 긴 지평선 문제 데이터가있을 때 중요한 샘플링에 역병 임의의 행동 정책에서 당신에게 주어진 것입니다 사실, 여기서 우리는 가중치의 분산과 같이 사용합니다 거기에있는 수익률의 분산을 방해합니다

>> 너무 많은 정책 그라디언트를 발견하지 못하면 [들리지 않음] >> 그래, 안돼 그래서 우리는 실제로 그렇게 열심히 찾지 못했지만 그래, 너 한테 일방 통행처럼 노력하고있어 그 그라데이션을 아주 가난한 견적은, 그렇습니다 그 질문에 대답 괜찮아

그래서 지금 이야기의 두 번째 부분으로 넘어갑니다 나는 또한 대리인이 매우 중요하다고 생각한다 그들의 행동을 예측할 수있다 세계의 기본 상태에 영향을 미친다 심지어 다소 작업 불가지론적인 방법으로

그래서 이것으로 정확히 무엇을 의미합니까? 모델 기반 강화 학습에 연결할 수 있습니다 다시이 자율 차량 예제로 돌아가십시오 우리는이 차량이 여전히 서있다 그것은 빠른 속도로 앞으로 나아갈 것입니다 그러나 막 시작한 에이전트에게 그것의 통제가 국가를 바꾸기 위해 무엇을하는지 탐험해라

이것은 전혀 명백하지 않습니다 그래서 내가 의미하는 바는 구체적으로 주어진 것입니다 대리인이 선택할 수있는 모든 주 및 조치 우리는 무엇이 될지 알고 싶다 예측 된 다음 상태 결과 또는 다음 주에 대한 분포 일 수 있습니다 나는 이것이 자치 확대의 핵심이라고 생각한다

우리가 이것을 완벽하게 할 수 있다면, 정책 평가 문제, 우리는 매우 효율적으로 데이터를 처리 할 수 ​​있습니다 테스트 궤도를 수집하는 대신, 우리는 모든 다른 결과를 시뮬레이션 할 것입니다 우리는 어떤 정책을 할 것인지 알 수 있습니다 정책 개선과 마찬가지로, 실제 경험을 생성하는 대신, 우리는 그러한 방식으로 합성 또는 시뮬레이션 된 경험으로부터 배울 수 있습니다 이 부분의 이야기와 우리가 해낸 일 여기서 우리는 격차로 인해 많은 동기를 부여받습니다

시뮬레이트 된 도메인과 실제 도메인 사이의 로봇에서 확인하십시오 그래서 특히 이것은 약간의 내가 일하는 경험 RoboCup 3D 시뮬레이션 도메인, 그래서 재미있는 무엇입니까 여기서 로봇이 얼마나 부드럽게 움직이는지를 알아 두십시오 그들은 가질 수있다 이 긴 킥은 공으로 빠르게 움직입니다 그 이유는 신청할 수 있기 때문입니다

이와 같은 도메인에서 학습을 강화하면됩니다 로봇이 사용하는 모든 기술을 크게 최적화하여 너보다 훨씬 좋은 것을 얻으 라 아마도 손으로 조정할 수 있기를 바랄 수 있습니다 그럼 대신 실제 로봇과 비교해 봅시다 이것은 RoboCup 표준 플랫폼 리그 경쟁에서 나온 것입니다

이것은 내가 작업 한 로봇 플랫폼입니다 박사 과정 학생이었습니다 여기서 주목해야 할 것은 로봇은 훨씬 느리게 움직입니다 그들은 덜 멀리 덜 정확하게 공을 차고있어 네가 할 수있는 희망이 없다

이 플랫폼에서 직접 학습 강화 로봇은 실제로 깨질 것입니다 나는 너를 보았다고 생각한다 모두 3 층에 네트 로봇이있다 신청하는 것을 상상하는 것처럼 그것에 강화 학습 알고리즘, 당신은 훨씬 더 많은 로봇이 필요합니다

그래서 한 가지 희망은 우리가 우리가 시뮬레이션에서하는 것과 똑같은 학습을 적용하고, 우리가 시뮬레이션에서 그렇게한다면 우리는 그냥 물리적 로봇에 넣어 그리고 그것은 모두 밖으로 작동합니다, 실제로 로봇을 배울 필요가 없습니다 그래서 당신은 초기 기술을 가지고있는 환경을 가질 수 있습니다 아마도 그게 잘 작동하지 않는 시뮬레이션에서, 느린 걷기 같이, 실제 로봇에서 동일한 상황을 가질 수 있습니다 걸을 수는 있지만 원하는만큼 빨리 갈 수는 없습니다 정책 최적화 알고리즘 적용 시뮬레이션과 당신이 나가는 것은 결국 훨씬 더 빨리 걷는 것입니다

그러면 어쩌면 끝났을지도 모릅니다 너는 이걸 빨리 걷는다 실제 로봇이지만, 불행하게도, 그렇게 할 때 일반적으로 보는 것은 정책은 시뮬레이션 된 환경에서 무언가를 찾는다 그것은 그것에 지나치게 맞 춥니 다 시뮬레이션에서 높은 보상을 얻고, 그리고 그것은 육체적 세계에서 실패하게됩니다

그래서 이것은 추측이지만 일어난 것처럼 보입니다 제가 방금 보여준 비디오는 로봇이 시뮬레이션에서 배우는 것입니다 그것은 단지 땅을 따라 슬라이딩 속도로 매우 빠르게 걸을 수 있습니다 네가 할 때 작동하지 않는다 이런 식으로 카펫을 걸 으면서

그래서 저는 우리가 어떻게 할 수 있는지 보여줄 것입니다 실제로 시뮬레이션을 통해 배우고 실제 로봇에 전송하고 이를위한 알고리즘을 소개합니다 이것을 좀 더 구체적으로 만들기 위해서, 이것은 걷는 것을 배우는 로봇의 문제입니다 그래서 이것을위한 일반적인 MDP 설정에서, 우리는 모든 로봇의 신체 부위의 위치와 속도 우리가 잘 측정 할 수없는 다른 변수가있을 수 있습니다

액션은 로봇이 각각의 명령을 선택하게 될 것입니다 그 관절과 우리는 그것이 움직이는 전진 속도에 기초하여 그것을 보상하십시오 우리는 단지 직선으로 움직이는 것에 관심이 있습니다 그래서지도 작성법을 알려주는 정책을 배우고 싶습니다 관절의 현재 위치 빨리 걷게 할 명령

따라서 궤도 상호 작용에서 이것을 생각할 수 있습니다 루프에서 일어나고있다 에이전트가 상태를로 보내는 곳 정책 및 정책은 조치로 응답합니다 그래서 우리가 지금하고 싶은 것은, 실제 로봇과 상호 작용하는 대신, 우리는 시뮬레이션 된 버전의 로봇과 배우기 이 루프를 통해 생성 된 경험 일반적인 방법론이 있습니다

우리는이 부분에서 이야기 할 것입니다 이를 접지 시뮬레이션 학습이라고합니다 그래서 이것은 우리가 우리가 우리가 현실 세계에서 실행할 수있는 정책이 있습니다 이 정책을 사용하면 상태 행동 궤적의 초기 집합 이러한 궤도는 세계에 대한 우리의 행동 그리고 그것은 우리에게 우리가 어떻게 볼 수있는 몇 가지 데이터를 제공합니다

우리의 행동이 물리적 세계에 미치는 영향 시뮬레이터를 접지하는 단계가 없었습니다 시뮬레이터가 우리에게주는 것을 의미합니다 우리가 육체적 세계에서 관찰 한 것과 유사한 궤도 일단 시뮬레이터가 접지되면, 우리는 강화 학습을 적용하고, 개선 된 정책이 이전 될 것으로 기대할 수 있습니다

이 접지 단계가 있었기 때문에 실제 로봇으로 돌아 왔습니다 그래서이 문제로 돌아가서, 이걸 좀 더 구체적으로 만들거야 우리가하고 싶은 일은 현재의 조인트 포지션을 받는다 센서로부터 얻을 수있는 로봇, 정책은 거기에 보낼 명령을 계산할 것입니다 그래서 우리가 시뮬레이션을 접지하는 것에 대해 이야기 할 때, 이것이 정책의 관점에서 무엇을 의미하는지, 그것이 전송 사이 어딘가에있다

시뮬레이션에 대한 공동 명령 새로운 관절 자세를 되 찾는 우리는 몇 가지를 바꿔서 결과로 나오는 다음 조인트는 그것을 위치시킨다 받아들이는 것은 그것이 가지고있을 것과 비슷하다 실세계에서 같은 명령을 받았다 우리가하는 일에서 우리가하는 일은 합동 명령 수정하기 로봇이 시뮬레이션에 전송하는 것, 이렇게하면 우린 갈거야 명령을 변경하는 방법 시뮬레이션을 통해 우리가 원하는 것 같은 조인트 포지션 육체적 인 세계에서 보았다

이렇게하는 우리의 접근 방식은 우리가 시뮬레이션을 접지 모듈이라고 부릅니다 그래서 로봇이 공동 명령을 보낼 때, 먼저 접지 모듈을 통과합니다 그것들을 수정 된 공동 명령 시뮬레이션을 일으킬 그것과 다르게 반응한다 우리는 원래의 명령을 그냥 통과했을 것입니다 우리는이 접지 모듈을 만들 수 있습니다

두 가지 감독 학습 문제 그래서 첫 번째 단계 우리는 우리의 데이터를 관찰 할 것이고 우리는 실제 효과가 어떻게 될지 예측하는 법을 배우십시오 관찰 한 데이터를 기반으로합니다 그래서 이것은 감독 된 학습 문제이며 우리는 실제 데이터를 사용하면이 궤적을 결과로 나오는 일련의 상태 액션을 얻는다 다음 상태는 적어도 상태 피쳐의 일부 구성 요소에 대해, 이제는 우리에게 우리에게 알려주는 모델을 훈련시킬 수 있습니다

몇 가지 조치가 주어지면 실제 효과가 될 것입니다 그러면 우리는 단지 행동을 선택해야합니다 시뮬레이션 된 환경 내에서 동일한 효과 이것은 감독 학습으로 다시 할 수 있습니다 우리는 시뮬레이션을 통해 국가 행동 궤도를 수집하고 학습 할 수 있습니다

우리에게 알려주는 역 모델 어떤 행동으로 전환 할 것인지, 기본적으로 어떻게 재현 하는가? 시뮬레이션 된 환경에서 동일한 효과 그래서 우리가이 접지 모듈을 갖게되면, 우리는 이것을 강화 학습 루프 여기 그리고 정책의 관점에서 볼 때, 그것이 마치 보이게 될 것입니다 현실 세계와 더 유사한 환경과 상호 작용합니다 그래서 저는 토론하거나 보여줄 것입니다 당신은 로봇 걷기의 과제에 이것을 한 가지 적용합니다

다시 로봇에 대해 배우고 있습니다 RoboCup 대회에서 사용하십시오 우리는이 로봇을 5 분간 걷기로했습니다 실제 경험을 수집하고, 그런 다음 우리는 강화 학습 알고리즘 시뮬레이션은 5,000 분의 걷기가 필요합니다 이것은 완전히 다루기 힘든 금액이 될 것입니다

실제 로봇을 수집하는 경험 그래서 이것은 우리가 시작하는 초기의 걷기입니다 여기서 주목해야 할 중요한 점은 RoboCup 대회를 위해 개발 된 워크 엔진 그래서 전 세계에 걸쳐 많은 사람들이 노력하고 있습니다 이 로봇이 매우 빨리 걸을 수있게하려면, 이것은 우리가 알고있는 한 가장 빠른 것 중 하나입니다

사람들이이 로봇을 위해 개발 한 도보 그럼 우리는 똑같은 걸음 걸이를 시뮬레이션에 직접 넣을 수 있습니다 이것은 단지 움직이고있다 일반적으로 우리가 어떤 접지 작업을하기 전에 우리는 그저 내가 선택한 접지 알고리즘을 적용합니다

제안하고 당신은 로봇을 보게 될 것입니다 걷는 것이 더 어려워지기 시작할 것입니다 좀 더 불안정해질 것입니다 로봇이 걷고있을 때 볼 수있는 것과 더 비슷합니다 때보다 실제 세계 시뮬레이션 환경에서 걷기

그래서 일단 우리가 보강 학습을 적용하면 접지 된 시뮬레이션 정책에 대한 지역 정책 개선, 우리는 40 퍼센트의 산보를 끝내게된다 우리가 시작했던 이전의 걷기보다 빠릅니다 우리가 아는 한 가장 빠른 사람입니다 이 로봇을 가져 왔어 그래서이 부분을 끝내기 위해, 나는 다시 한번 강조하고 싶다

나는 더 나은 행동 모델링이라고 생각한다 매우 중요한 단계입니다 장기 자치 에이젼트들 물리적 세계에서 많은 일을 할 수 있어야합니다 현실 세계의 많은 문제들 물론 로봇 공학이 훌륭한 예일지라도 로봇 공학뿐만 ​​아니라, 기존 도메인 시뮬레이션이 있습니다 그리고 이러한 시뮬레이션이 가능할 때, 우리가 그들을 활용할 수 있다면, 그럼 먼 길을 갈거야

효율적인 보강 학습을 지향합니다 물론 환경도 있습니다 우리는 좋은 도메인 모델링이 없다고 생각합니다 도메인을 처음부터 모델링 할 수있는 것도 자율적 인 대리인에게 중요한 능력이되어야합니다 우리는 또한 당신과 관련된 다른 일을했습니다

시도하기 위해 도메인 시뮬레이션을 사용할 수있다 주위에 신뢰 구간을 두다 정책 실행 정책 전개의 안전과 같은 것에 관심이 있습니다 그래서 이것은 이야기의 일부를 마무리 짓고, 그 중 일부를 소개하고 싶었습니다 박사 학위 동안 내가 한 일

결론을 내리기 전에, 내가 실제로하는 다음 방향의 일부 탐험에 관심이있다 보강 학습 데이터 만들기 현실 세계에 충분히 효율적입니다 일반적인 논평으로 특정 연구 방향으로 들어가기 전에, 나는 공부하는 것이 좀 더 이론적 측면에서 학습을 강화하거나 알고리즘 측면뿐만 아니라 문제에 RL 적용 현재 순간에 그 얼굴에 평평하게 떨어진다 연구를하는 데 정말로 중요한 방법입니다 그래서 내가 계속할 계획의 문제 중 하나 장기간에 걸친 작업은 로봇 축구의 이러한 문제입니다

지금 당장은 정말 다루기 힘들 겠지 이 작업을 처음부터 배우는 것을 상상해보십시오 그래서 이것이 RL 알고리즘을위한 정말 좋은 테스트 베드라고 생각합니다 나는 또한 일하는 것이 정말로 중요하다고 생각한다 여러 애플리케이션 도메인 당신은 반드시 생산하고 싶지 않다

적어도 나를 위해, 그것은 단지 생산하지 않는 것이 중요합니다 알고리즘은 하나의 테스트 영역에만 한정됩니다 그래서 내 박사 과정을 통해 나는 또한 자율 주행 차량의 교통 시스템 반드시 배우는 것은 아니지만, 우리는 또한이 맥락에서 강화 학습을보고 있습니다 앞으로 나아가겠습니다 서로 다른 응용 분야에 걸쳐 작업하며, 어떤 알고리즘을 개발할 가능성이 있습니다

많은 다른 분야에 적용 가능합니다 그래서 연구 방향에 관해서는 생각하는 것은 정말로 이것을 성취하기 위해 탐험 할 것을 약속합니다 나는 다음과 같은 것들을 보는 것이 상태 및 동작 추상화는 RL 확장에 중요합니다 이론적 특성 이해하기 우리가 제안하는 방법 중 신뢰할 수있는 방법을 얻는 데 중요합니다 우리가 실제로 신뢰할 수있는 마지막으로, 비록 내가 예측에 초점을 맞추고 있지만, 나는 아직도있을 것이라고 생각한다

연결에서 남겨진 몇 걸음 정책 개선을위한 예측 주 및 행동 추상화 측면에서, 여기에있는 기본적인 생각은 당신이 그것을 생각할 수 있다는 것입니다 에이전트와 같이 의사 결정을 내릴 수있는 수준이 다릅니다 그래서 자치 차량의 경우, 어쩌면 그 자체가 "드라이브 홈"이라는 액션이 ​​있습니다 서로 다른 방향성 용어로 구성된 그 길을 따라 가야한다는 것, 그리고 그것들 각각은 거기에서 두건 아래의 아주 낮은 레벨의 컨트롤조차도

그래서 RL에서 시간적 추상화의 올바른 수준에서 추론하기 알고리즘이 얼마나 효과적인지에 큰 영향을 미칩니다 차량을 타려는 상상을하는 경우 집을 운전하는 법을 배우면 이것을 매우 낮은 수준의 행동처럼 추론하면, 그것은 매우 어려운 작업입니다 더 높은 수준의 추상화를 추론하려는 것 제가이 공간에서 특히 관심을 갖고있는 한 가지 문제는, 매우 낮은 충실도 시뮬레이션으로 학습 할 수있는 능력입니다

그래서 당신이 축구 경기에서 상상할 수 있다면, 당신은 수준에서 시뮬레이션 할 수 있습니다 로봇은 실제 통제 각각의 개별 관절 모터의 당신은 또한 수준의 시뮬레이션을 상상할 수 있습니다 그냥 공을 지나가는 원 이러한 문제 중 하나는 학습하기가 훨씬 쉬워야하며, 반드시 쉽지는 않지만 전략과 같은 것을 배우기 쉽습니다 그렇다면 적절한 수준의 트레이드 오프는 무엇입니까? 매우 추상적 인 표현으로 무엇을 배울 수 있습니까? 그런 다음 관심있는 실제 작업으로 다시 전송할 수 있습니까? 추상화를 도입하면서 상처를 입힐 수있는 근사치 당신이 방법을 사용할 수 있다는 보장

우리가 설립하는 것이 정말로 중요하다고 생각합니다 우리가 개발중인 메소드의 속성 예를 들어 통계적으로 내가 할 수있는 자신감과 같은 속성 내 견적을 받거나 일관된 방법이 있습니까? 의미, 결국 충분한 데이터만으로 올바른 답을 얻었습니까? 그래서 나는 확립 할 수 있다고 생각한다 이와 같은 방법은 실무자가 우리가하는 것을 신뢰할 수 있어야합니다 마찬가지로 중요하다

당신의 방법이 실무자가 그것을 사용할 수 없다면, 보증이 얼마나 좋은지는 중요하지 않습니다 당신이 알 수 있도록 설명 할 수있는 왜 당신의 예측은 그들이 무엇인지에 대한 것입니다 그래서 마침내, 내가하는 대부분이 예측에 중점을 둡니다 그러나 나는 아직도 한 번은 있다고 생각한다 우리는 우주에서 완벽한 예측을 할 수 있습니다

행동의 효과를 모델링하거나 고정 된 정책을 평가하는 것, 여전히 몇 가지 질문이있을 것입니다 이를 효율적인 정책 개선에 연결하십시오 그래서 나는 어떻게 우리가 공간을 탐색 할 수 있는지에 관심이 많습니다 가능한 최선의 정책을 찾는 모든 가능한 정책 과제 또는 한 가지 과제에 대해 배우면, 우리가 배운 것을 새로운 일로 어떻게 옮길 수 있습니까? 그래서 일단 우리가 할 수 있고 if 이 모든 것은 마침내 대답 할 수있게 될 것입니다 큰 질문은 강화 학습이 실제 응용 프로그램에 충분한 데이터 효율적입니다

이것이 내가 계속해서 기대하는 바입니다 정말 빨리 마무리하기 전에 물론 많은 사람들이 이 연구에 기여했습니다 내 고문 인 Peter Stone은이 모든 일에 관여했습니다 연설의 첫 번째 부분은 Scott Niekum, UT 오스틴, 필 토마스 (UMass Amherst) 그렇다면 교통 시스템의 공간에서 내가 한 일은 불행히도 자율 차량 오늘은 시간을 보내지 못했습니다

매우 많은 수의 공동 작업자도 보유하고 있습니다 그래서 그걸로와 주셔서 감사합니다 오늘 말씀하고주의를 기울이십시오 이제 더 많은 질문을 드리겠습니다 네

>> 이야기의 두 번째 부분, 많은 것을 이전하면 성장을 배우게됩니다 그래서 당신이 익숙하지 않다면 너는 기본적으로 무엇을 암기한다 델타가 있고 당신은 계속 머물러 있습니다 당신이 정책을 생각 해낼 때까지 각인을해라 당신이 기대하는 것처럼 현실 세계에서 행동합니다

네 >> 보통 통제 사람들은 그렇게하기 시작했기 때문에 그들은 복잡한 시스템의 경우, 모델링은 어렵습니다 그래서 만약 당신이 두려워 학습 컨트롤은 아무것도 아니지만 멋진 단어입니다 모델링을 우회하여 배우기 만하면됩니다 명목상의 모델이며 나는 델타를 배울 것입니다

이 한 가지 방법이 있습니다 당신은 명백한 모델을 배우고 모델에서 델타를 발견 할 수 있습니다 모델에 신호가 있습니다 당신이 신경 쓰는 공간의 문제 다른 방법은 내가 완전히 우회 할 것입니다

모델링하고 좋은 정책을 배웁니다 내가 약간의 세부 사항을 놓치지 않는 한, 내가가는 것처럼 너는 길을 벗어나는 것 같아 모델을 우회하려면, 맞죠? >> 우리는 시뮬레이션을 활용하고 있습니다 그 자체가 세계의 모델입니다 그래서 그 시뮬레이션 내에서, 우리는 모델이없는 방식으로 학습하고 있습니다

우리는 단지 거기에서 좋은 정책을 직접 얻으려고합니다 네 >> 그래서 당신은 당신의 생각이 무엇인지에 대해 논하겠습니까, 거기에 어떤 장점을 볼 수 있습니다, 특정 도메인에 있습니까? 지금 말하자면, 그건 아주 뜨거운 모델입니다 우리는 근사 모델을 수행 한 다음 주입 할 수 있습니까? 그 시뮬레이터에서의 습관은 배워야 할 델타를 배웁니다 네

아니, 정말 좋은 질문이라고 생각해 그래서 우리가하고있는 일이 실제로는 그것과 다소 비슷합니다 우리는 본질적으로 지역적으로 시뮬레이션을 수정하고 있습니다 이렇게 약간 슬라이드 등을 맞댄, 나는이 과정이 반복적임을 보여주고 있었다 그 이유는 시뮬레이션을 수정할 때 데이터에 의존하는 방식으로, 그것은 본질적으로 무엇에 묶일 것인가? 정책에서 얻은 데이터의 현재 배포가 >> 정확하게

>> 그런 의미에서 우리는 특정 정책에 국한된 시뮬레이션, 거기에서 최적화하지만 그때 우리는 다시 가야 해 현실 세계와 그 과정을 계속하기 위해 더 많은 데이터를 얻으십시오 그럼에도 불구하고 이 같은 수준 이상의 반복 학습 방식 네 그래서 나는 네가 어느 정도까지 할 수 있는지 궁금해

작업 공간을 변경하여 시뮬레이션을 수정하십시오 종종 많은 오류가 있습니다 시뮬레이션은 물리학에서 올 수 있습니다 카펫을 세우면 되 잖아 [들리지 않음] 발을 들기 만하면됩니다

더 높아질수록 더 많은 상황을 커버 할 수 있습니다 >> 네, 좋은 질문입니다 그래서 그것의 일부는 우리가이 일을했다는 것입니다, 나는 걷는 것에 대해 이야기하고 있었다 우리는 다른 작업을 보았지만 지금은 우리가 사물을 바로 잡을 수 있다는 것을 발견했습니다 나는 상황을 상상할 수 있었다

그 행동을 바로 잡는 것만으로는 충분하지 않습니다 그래서 카펫과 물건처럼, 비록 그것이 물리학 파라미터와 같다하더라도 잠재적으로 조정될 수있는 너는 실제로 볼 수 없다 사물이 감정을 바꾸는 방법에 사로 잡혀 있습니다 발이 막혔다면 그 대신에 시뮬레이션에서 카펫 당신의 발을 놓아주고 그것이 자유롭게 움직일 수 있도록 그런 다음 동작을 변경하여 표시 할 수 있습니다 마치 카펫 위에서 더 붙어있는 것처럼

그래서 나는 네가 포획 할 수 있다고 생각해 행동을 수정하는 것만으로도 이러한 것들을 얻을 수 있습니다 확실히 몇 가지 사항이 있다고 생각합니다 그것을하기에 충분하지 않다 뿐만 아니라

예 >> 그 질문도 끝내 실제 작은 로봇의 운동학 이 로봇은 악명이 높습니다 올바른 조인트 위치를 갖는

얼마나 실험을 해봤 니? 더 나은 알고리즘 제공 실생활에의이 전달 다른 사람의 무작위 잡음을 그냥 주입하는 것과 비교하면 어떨까요? 왜냐하면 당신이 모터의 무작위 순열을 취해야한다면, 얼마나 잘하는거야 귀하의 시뮬레이터는 단지 그 모든 것을 조정하는 대신에 근사치입니다 그 작은 모터를 계속해서 시험해보고 실제 세계 문제를 엔진에 적용 할 수 있을까요? >> 네, 좋은 질문입니다 그래서 우리는 보았다 그 기준선을 접근법으로 그래서 우리는 더 빠른 걷는 성능으로 끝났습니다

나는 다른 흥미로운 무역을 생각한다 당신은 그 방법이 무엇인지 알 것입니다 보다 강력한 정책을 배울 수있는 방법을 주입합니다 그래서 나는 다시 정책의 지역적 개선이라는 개념 소음을 주입하면 우리는 더 오랫동안 배울 수 있습니다

여전히 안정적인 정책을 구할 수있다 그 로봇에 전송할 것이고, 하지만 당신은 현실 세계를 착취하는 사람들 중 일부를 포기했습니다 빠르지 만 여전히 안정적이라면 말이됩니다 네 그러나 나는 동시에, 실제 세계를 근사값으로하려는 알고리즘이 약간의 오류는 있지만 여전히 오류를 로봇으로 번역하고 있습니다

>> 아니, 맞아 아직도 오류가 있습니다 우리가 경험적으로 본 것은 사물에 노이즈를 추가하는 것보다 오류가 적습니다 >> 그러나 결과를 보는 것은 멋지다 그 작은 녀석을 위해 문서화 된 가장 빠른 산책이 진정한 것인가? >> 그것은 주로 RoboCup 대회를 기반으로합니다

도착하려고하는 사람들이 많이 있습니다 이 nanos에 가장 빠른 도보 우리는 지난해이 대회에서 이것을 사용했고 더 빠른 걷기를 사용하는 팀은 없었습니다 그럼 우리가 아는 한, 보고 된 속도도 그렇습니다 >> 하위 작업이 필요한 것 같습니다

의 나노 경쟁 누가 나노를 더 빨리 걷게 할 수 있겠습니까? >> 네 그래서 거기에 어떤 사람들은 그 (것)들을 얻는 것을 시도에 종사한다 엄청나게 빠르며 로봇이 넘어 지는지 신경 쓰지 않아도됩니다 그래서 그 경우에, 그것이 우리가하는 것과 정확히 똑같지는 않습니다 우리와 비교하기 위해 여기에서 비교하려고 노력합니다 실제로 유용한 것을 얻고 싶다

RoboCup의 작업을 위해 그래서 이것은 빠르고 안정적인 반면 당신은 그들을 빨리 갈 수 있습니다 로봇을 끝까지 쓰러 뜨릴 수 있습니다 그것의 뛰기 또는 이렇게 네

>> 음, 다시 Josiah에게 감사드립니다 >> 감사합니다

Machine Learning Systems for Highly Distributed and Rapidly Growing Data

>> 그래서 내 기쁨이야 Kevin을 소개하고 오늘 우리에게 이야기하게하십시오

Kevin Hsieh는 Carnegie Mellon 출신입니다 Phil Gibbons와 Owner와 그는 교차로에서 정말로 흥미로운 일을했습니다 시스템 아키텍처 및 기계 학습 실제로, 그는 Garnish, Peter, Matias와 함께 여기에서 구금 중입니다 그는 그들 모두와 함께 일하고 있습니다

나는 장식물이 그의 스승이라고 생각합니다 그는 오늘 다른 일에 대해서 이야기 할 것입니다 서빙 시스템과 트레이닝 시스템 케빈과 나는 언젠가 실제로 함께 일해왔다 비 ID 데이터가있는 데이터를 사용하여 교육 모델을 살펴보면, 나는 그가 오늘 그걸 만질 것이라고 생각합니다

그래서, 네, 여기 케빈 씨를 초대하게되어 매우 기쁩니다 환영 >> Amar 소개해 주셔서 감사합니다 그래서 오늘 저는 제 연구에 대해 이야기 할 것입니다 "에 대한 기계 학습 시스템 설계 고 분산 및 급성장 데이터

" 질문이 있으면 언제든지 저를 방해하십시오 매우 빠른 개요로 이야기를 시작하겠습니다 우리 모두 알고 있듯이 기계 학습의 폭발적인 발전은 많은 흥미 있고 중요한 응용 프로그램을 가능하게했습니다 얼굴 인식, 물체 감지,자가 운전 자동차, 언어 번역 및 기타 많은 기능을 제공합니다 이러한 기계 학습 응용 프로그램의 핵심에는, 두 가지 핵심 기계 학습 얼굴, 훈련과 봉사입니다

그래서 훈련 장소, 우리는 일반적으로 일련의 훈련 데이터를 수집하고 기계 학습 교육 시스템에 통합 기계 학습 모델을 생성합니다 그런 다음이를 기계 학습 서빙 시스템에 공급할 것입니다 검색 데이터를 토대로 질문에 답변합니다 예를 들어 우리는 이미지들의 세트에 기초한 이미지 분류 모델, 그런 다음 어떤 유형의 질문에 답할 수 있습니다 개체의 이미지가이 이미지입니까? 그래서, 교육과 훈련의 핵심 목표는 서빙은 낮은 대기 시간과 낮은 비용입니다

낮은 대기 시간은 교육에 매우 중요하며, 모델을 훈련하는 데 일반적으로 몇 시간 또는 며칠이 걸릴 수 있기 때문입니다 서빙 측에서도 매우 좋습니다 낮은 대기 시간을 유지하는 것이 중요합니다 서비스는 대개 사용자 대면 서비스의 일부이기 때문에 따라서 대기 시간은 서비스의 유용성을 결정합니다 반면에 낮은 비용, 그것이 결정하기 때문에 또한 매우 중요합니다

실용성과 타당성 Machine Learning 응용 프로그램을 배포합니다 그러나 배포 할 때 실제 세계에서 기계 학습 응용 프로그램, 우리는 그러한 훈련 및 데이터 제공에 더 많은 관심을 기울여야합니다 이것은 현실 세계에서, 많은 기계 학습 데이터가 실제로 있습니다 다른 장소에서 빠른 속도로 생성됩니다 예를 들어 Microsoft 또는 Google은 전 세계에 수많은 데이터 센터를 배치하고 있으며, 및 이미지와 같은 많은 기계 학습 데이터, 동영상, 사용자 활동이 다른 장소에서 생성됩니다

그 결과, 기계 학습 데이터는 고도로 분산되고 빠르게 성장하고 있으며, 그들은 새로운 도전을 제기 할 수 있습니다 낮은 지연 시간과 낮은 비용을 실현하는 기계 학습 그래서 좀 더 구체적인 예를 들어 드리겠습니다 먼저 제공 측을 살펴 보겠습니다 얼마나 빠르게 성장하는 데이터가 게재에 영향을 미치는지에 대한 정보를 제공합니다

예를 들어 트래픽이 많은 카메라를 빠르게 성장하는 비디오를 계속 녹화하는 도시, 그런 다음 우리는 기계 학습 서빙 시스템 질문에 답하기 위해 트럭과 같은 특정 물체에 대한 비디오 프레임을 찾습니다 일반적으로 여기에는 두 가지 옵션이 있습니다 라이브 비디오의 경우 Ingest Time에서 모든 처리를 수행 할 수 있지만, 하지만 비용이 많이 들게됩니다 우리는 그 비디오가 질의를 받을지조차 모릅니다 반면에 우리는 모든 처리를 할 수 있습니다

검색어 시간 우리가 질의하는 질의를 알고있는 시간, 그러나 그것은 긴 대기 시간을 유발할 것입니다 왜냐하면 쿼리 시간에 모든 작업이 진행되고 있습니다 다른 예는 교육 측면을 살펴 보는 것입니다 기계 학습 모델을 기반으로 Geodistributed 인 데이터에 우리가 그렇게 할 때, 훈련은 끝나야 할 것입니다

이 광역 네트워크는 일반적으로 각 데이터 센터 내의 로컬 영역 네트워크에 비해 느립니다 결과적으로이 훈련은 높은 비용과 우리가 이런 종류의 훈련을하면 긴 대기 시간이 필요합니다 예 >> 그래서 나는 물어 보려고했다 오늘 모든 데이터를 얻는 것이 관례입니까? 장소와 훈련을하거나 훈련 할 수 있습니까? >> 데이터를 중앙 집중화하는 것이 더 일반적인 방법이라고 생각합니다

하지만 거기에 문제가 있습니다 예를 들어, 일부 데이터의 경우 이동하는 데 비용이 많이 듭니다 또한 다음과 같은 몇 가지 법률 제약이있었습니다 이제 당신이 할 수있는 데이터 주권 법 예를 들어 EU에서 데이터를 이동하십시오 그래서 우리가 이 지리적 분산 교육을 수행해야합니다

네 괜찮아 그래서이 이야기에서 나는 기계 학습 시스템에 관한 이야기 ​​I 이 고도로 분산되고 빠르게 증가하는 데이터를 위해 설계되었습니다 Focus를 먼저 소개하겠습니다 이것은 제공하고자하는 기계 학습 서비스 시스템입니다

급격히 증가하는 데이터에 대한 낮은 대기 시간 및 저렴한 비용의 쿼리, 유스 케이스로 비디오를 사용하겠습니다 이것은 또한 제가 한 인턴 프로젝트입니다 장식하고 당신 중 일부는 이미 그것에 대해 알고 있습니다 제가 설명 할 두 번째 시스템은 비뚤어 짐입니다 이것은 기계 학습 교육 시스템입니다

훈련을 가능하게하는 지리적으로 분산 된 데이터로 단일 데이터 센터 내에서 신속한 교육을 제공합니다 마지막으로 몇 가지 진행 방향에 대해 이야기하겠습니다 저도 같이하고 있어요 아마르에 대한 훈련 스큐 데이터 세트 및 향후 작업 방향에 대해 설명합니다 먼저 초점 측면의 게재 측면에 대해 알아 보겠습니다

따라서 동영상은 실제로 가장 빠르게 성장하는 데이터 이번에는 우리가 너무 많은 카메라를 가지고 있기 때문입니다 우리는 도시에 교통 카메라를 가지고 있습니다 우리는 가정용 카메라를 가지고 있습니다 우리는 또한 소매점 기업에서 카메라를 모니터링합니다 사실, 우리는이 방에 카메라가 있습니다

지금 많은 카메라가 있습니다 따라서 Machine Learning의 주요 응용 프로그램 중 하나가 이 비디오는 모두 우리는 해당 비디오의 객체를 쿼리 할 수 ​​있습니다 예를 들어 도시 계획 담당자가 관심을 가질 수 있습니다 일정 기간 동안 도시에 나타나던 모든 트럭에서, 또는 차고에서 일어난 강도 사건이라고 말했을 때, 그러면 우리가 관심을 가질 수 있습니다 그 안에있는 사람들과 모든 비디오 프레임

그래서 그 쿼리를 실행하면, 우리는 탐지기를 사용해야하며 CNN으로 분류해야합니다 대규모 동영상이있을 때 일반적으로 비용이 많이 들고 느려집니다 나는 그것을 매우 빨리 다룰 것이다 따라서, 내가 처음에 말했던 이러한 낮은 대기 시간의 쿼리는, 우리는이 섭취량 분석을 할 수 있습니까? 라이브 비디오가 녹음 된 다음 실행 만하면됩니다 그 값 비싼 신경 네트워크를 통해, 그런 다음 색인을 생성합니다

역 색인은 비디오 프레임에 명명 된 객체 클래스가 될 수 있습니다 그런 다음 쿼리 시간에 에 기초한 질의를 찾는 방법 사용자가 관심을 가지는 객체 클래스 프레임을 반환합니다 이 접근법은 쿼리를 매우 빠르게 만들 것이며, 그러나 단점은 매우 비싼 것입니다 예를 들어, 우리가 YOLOv2와 같은 최근 신경망을 사용한다면, 그것은 스트림 당 매달 거의 400 달러를 소비 할 수 있습니다 그래서 우리가 섭취 할 수천 개의 비디오가 있다고 상상해보십시오

매우 높은 비용이 소요될 것입니다 반면에, 또한 잠재적으로 낭비 적입니다 예를 들어, 처음에 논의한 강도 사건, 우리는 특정 차고 비디오에만 관심이있을 수 있습니다 그러나 Ingest Time에서는 우리가 관심있는 차고 비디오를 알고, 그래서 우리는 그것들 모두를 분석해야합니다 그것은 많은 낭비 일 수 있습니다

그래서 다른 접근법, 우리가 Ingest Time에서 아무것도하지 않는다는 것입니다 Query Time에서 모든 작업을 수행합니다 Ingest Time의 비용을 절감하고 낭비를 줄일 수 있습니다 그러나 또한 우리는 프레임 다운 샘플링 건너 뛰기 또는 사용을 사용하여 최적화 전문화 된 쿼리 CNN과 값 비싼 CNN으로 계단식 연결하여 더욱 빨라졌습니다 실제로, 그들의 체계의 국가가있다 정확하게 그것을하는 No-Scope이라고합니다

그러나 이런 종류의 전문화 된 비디오 시스템은 여전히 ​​매우 느립니다 한 달 동안 긴 동영상을 조회하는 데 5 시간이 걸릴 것입니다 이 작업에서 우리의 목표는 낮은 대기 시간 및 저렴한 비용의 쿼리 빠르게 성장하는 비디오 데이터 세트 이상 특히 우리는 많은 것을 처리 할 수있는 시스템을 구축하고자합니다 동영상 스트림과 사용자는 값 비싼 CNN과 정확도 목표를 제공하고, 쿼리 시간에 다음과 같은 쿼리를 사용합니다

특정 객체를 반환하면 프레임이 반환됩니다 그래서 전에 – 네 >> 네가 5 시간을 말했다 당신이 묘사 한 모든 시나리오는 그것은 받아 들일 수있는 지연 일 것입니다 >> 네, 5 시간

>> 당신이 묘사 한 시나리오에 대해서는 그 같은 것은 받아 들일 수있는 지연 일 것입니다 >> 수용 가능한 지연? 네 나는 경찰 수사 중일 때, 도시 계획을하는 데 며칠이 걸립니다 계획 수년이 걸립니다 >> 네

그래서 그것은 응용 프로그램에 따라 달라집니다 예를 들어, 우리가 어떤 것을하고 있다면, 예를 들어, 어떤 사건이있다면 도시에서 일어나고 우리는하고 싶다 특정 종류의 자동차 또는 특정 종류의 트럭을 찾으십시오 대기 시간 요구 사항이 훨씬 더 높아집니다 또한 일반적으로 서비스로서, 우리가 달리기까지 몇 시간이 걸리는 서비스를 제공한다면, 나는 일반적으로 대부분의 사용자에게 좋지 않을 것이라고 생각합니다

네 >> 그래서 당신은 또한 건물을 생각할 수 있다고 생각합니다 높은 수준의 서비스 이벤트가 트리거되고 상위 레벨 [들리지 않음] 예를 들어, 사고가 발생했습니다 그 사실을 감지하고 실제로 트리거하고 이미지를 보내 실제로 알림을 보냅니다

'들리지 않음'을 원한다 >> 그러나 그것은 훨씬 더 오래 걸릴 것입니다 >> 그것은 응용 프로그램에 따라 다릅니다 예 >> 나는 정말로 긴급한 질문이 있으면 말할 것입니다

아마 미스테리를 통해 데이터를 보냈을 것입니다 분석해야하는 데이터의 양도 균형을 맞춰야합니다 그래서 나는 아마 긴급한 질문이 없습니다 한 달 동안의 비디오, 몇 달 간의 비디오 오래된 비디오에 대한 분석에 관심이 있다면 아마 기다릴 수있을 것입니다

이런 종류의 [들리지 않음] >> 네, 응용 프로그램에 따라 다릅니다 동의한다 네 일부 응용 프로그램의 경우, 그것은 분명히 더 많은 대기 시간을 견딜 수 있습니다 네

그래서 제가 시스템을 소개하기 전에, 나는 빨리 끝날거야 길쌈 신경 네트워크의 주요 배경 그래서 두 가지 핵심 측면이 있습니다 길쌈 신경 네트워크 (convolutional neural networks)를 소개하겠다 그래서 이러한 분류 자 ​​신경 네트워크에 대한 첫 번째 것은 우리가 실제로 할 수있는 것입니다

최종 출력물이 실제로 출력되는지 확인하십시오 가능한 모든 객체의 확률 예를 들어,이 입력 이미지는 트럭입니다 우리는 실제로 버스, 자동차 등으로 움직이는 트럭 다른 측면은이 최종 출력 이전의 레이어가 우리는 feature layer를 호출한다

따라서이 피쳐 레이어는 다음과 같이 볼 수 있습니다 입력 이미지의 하이 레벨 표현 이제는 우리가 구축 한 시스템을 소개하겠습니다 우리는 Focus라고 불렀습니다 Focus의 핵심 아이디어는 저비용의 인제 스트를 사용하는 대기 시간이 적은 쿼리 그것에는 세 가지 주요 구성 요소가 있습니다

오늘 처음 두 가지 주요 구성 요소를 다룰 예정입니다 따라서 첫 번째 핵심 구성 요소는 값싼 섭취로 대략적인 색인 생성 그래서 여기에있는 아이디어는 비싼 CNN을 사용하여 해당 비디오를 분석하고, 우리는 값싼 CNN을 대신 사용할 수 있습니다 예를 들어, 적은 수의 레이어로 CNN을 사용할 수 있습니다 가중치가 적거나, 각 비디오 스트림에 특화된 CNN이 있습니다

특히, 비디오가 들어올 때, 우리는 프레임과 객체를 보장 할 수 있습니다 비싼 CNN을 통해 반올림하여 지수를 생성하는 대신, 우리는 그것들을 전문화되고 압축 된 CNN이 색인을 생성합니다 그러나이 방법에는 문제가 있습니다 즉, 그 싸구려 CNN들이 싸구려라는 이유가 있습니다 왜냐하면 그들은 일반적으로 덜 정확하기 때문입니다

더 정확하게 말하면, 입력 이미지가 트럭 인 경우, 값싼 CNN과 값 비싼 CNN 간의 결과를 비교해 보면, 우리는 값 비싼 CNN이 정확하다는 것을 알 수 있습니다 그것은 트럭이지만 싼 CNN은 잘못되었습니다 움직이는 밴이라고 해 그래서이 문제를 해결하기 위해, 우리는 경험적 관찰을한다 우리는 가장 좋은 결과가 그 값 비싼 CNN은 실제로 이 값이 싼 CNN의 톱 K 결과에서, K는 대개 작습니다

예를 들어, 저렴한 CNN의 세 번째 출력을 살펴보면, 우리는 트럭 출력이 보일 것을 볼 수 있습니다 다른 말로, 우리는 실제로 최고 K 결과를 다음과 같이 사용할 수 있습니다 저렴한 CNN의 정확성 손실을 보상합니다 더 정확하게 말하자면 두 개의 측정 항목을 사용하여 정확도 목표를 정의하십시오 하나는 리콜입니다

리콜은 인구 과잉에서 찾을 수있는 객체의 일부이며, 반면에 정밀도는 올바른 객체의 비율 Google이 사용자에게 제공 한 결과에 따라 사용자에게 반환됩니다 먼저 리콜을 어떻게 높게 유지할 수 있는지 살펴 보겠습니다 여기에서 우리는 특정 비디오를 연구하고 y 축은 리콜 및 x 축은 숫자입니다 우리는 값싼 CNN에서 선택한 출력을 우리는 그 값싼 CNN 출력을 비교합니다 최근 18 년을 기준으로 4 개의 레이어와 6 개의 레이어를 제거합니다

80 클래스를 인식 할 수있는 YOLOv2와 같이 값 비싼 CNN에 연결합니다 따라서 값싼 CNN의 최고 출력을 보면, 리콜은 실제로 끔찍합니다 실제로 50 % 또는 50 % 미만입니다 그래서 실제로는별로 유용하지 않습니다 또한, 더 싸게 CNN 우리가 가서, 우리가 얻을 낮은 회수

그러나 흥미로운 것은 여기서 나옵니다 그래서 실제로 K가 2와 같음을 선택하면, 갑자기 리콜이 합리적이됩니다 여기에 우리는 90 %의 리콜은 싼 CNN들로부터 두 가지 결과만을 골랐다 K가 3이나 4로 같으면, 우리는 실제로 리콜의 99 % 이상을 얻을 수 있습니다 정확도는 많은 응용 분야에 충분합니다

다른 말로하면, 저렴한 CNN은 작은 top-K 결과로 높은 리콜 달성 그러나이 방법의 문제점이 있습니다 그 값싼 CNN에서 하나 이상의 결과를 선택할 때, 우리는 사용자에게 필요한 것보다 많은 결과를 반환 할 것이며, 그래서 정밀도는 낮아질 것이다 그렇다면 정밀도를 어떻게 높게 유지할 것인가? 따라서 해결책은 분할 아키텍처를 개발하는 것입니다 섭취시, 우리는 저렴한 CNN을 사용하여 해당 비디오를 분석하여 생성 할 수 있습니다

에 대한 상위 K 지수 객체 클래스와 객체 프레임 그래서 쿼리 시간에, 우리가 어떤 대상에 관심이 있는지를 알 때, 우리는 그 물체들을 찾아 색인에서 일치시킵니다 그런 다음 비싼 CNN을 통해 그것들이 참으로 그러한 대상인지 확인하십시오 그런 다음 우리는 사용자에게 돌아갈 것입니다 따라서이 아키텍처에서, 우리는 여전히 싸구려 CNN을 사용하여 높은 리콜을 유지하고 있으며, 쿼리 시간에 일부 작업을 수행하여 높은 정밀도를 얻습니다

더 중요한 것은 쿼리 시간 작업은 우리가 실제로 관심을 가지고있는 비디오로 끝났습니다 따라서 낭비가 훨씬 적습니다 다른 구성 요소는 우리는 중복 제거 기능을 갖춘 신속한 쿼리를 가능하게합니다 우리가 보는 것처럼, 우리는 이 방법은 값싼 섭취를위한 근사 색인 생성 방법입니다 그러나 쿼리 시간에 단순한 작업을 소개합니다

사실, 우리가 선택한 K가 클수록, 더 많은 쿼리 시간 작업이 필요합니다 이 문제를 해결하기 위해 우리는 또 다른 관찰을한다 우리는 이미 값싼 CNN으로 이러한 모든 객체를 처리하지만, 그래서 우리는 실제로 추출 할 수 있습니다 해당 CNN의 기능 계층의 기능 >> [차이점] 비용 차이는 얼마입니까? 전체 CNN과 4, 6 층 이상을 말하십시오 그것은 80 퍼센트인가? 99 퍼센트, 12 퍼센트? 얼마나 싸게? >> 전반적으로 최대 50 배의 차이가있을 수 있습니다

>> 50 번? >> 그래, 50 >> 알았어 >> 맞아 그래서 우리는 실제로 그 특징들을 추출하면 많은 것들이있다 학문은 유사한 특징을 가진 심상을 설치했다, 그들은 시각적으로 유사 할 것이다

그래서 우리는 실제로 그것을 실행할 수 있습니다 일부 클러스터링 알고리즘을 적용한 다음 비슷한 오브젝트를 클러스터링합니다 예를 들어 여기에는 동일한 객체가 있습니다 다른 시각적 인 방향으로, 그러나 우리는이 접근법을 함께 클러스터링 할 수 있습니다 쿼리 시간에 실행하면됩니다

이 값 비싼 CNN은 모든 개체 대신 클러스터 당 한 번 사용됩니다 따라서 우리는 쿼리 대기 시간을 더 짧게 만들 수 있습니다 따라서이 클러스터링을 아키텍처에 통합하려면, 값싼 CNN에서 직접 상위 K 지수를 직접 생성하는 대신, 우리는 먼저 특징들을 추출하고 클러스터링 알고리즘을 통해 실행하십시오 그런 다음 상위 K 결과도 얻습니다 각 클러스터의 중심으로부터

그런 다음 쿼리 시간에 클러스터를 선택합니다 질의하는 객체와 일치하는 객체 값 비싼 CNN을 통해 중심 객체를 반올림하고, 그런 다음 프레임을 유지합니다 다른 클러스터와 일치합니다 그래서이 방법을 사용하면, 우리는 쿼리 시간에 중복 작업을 줄일 수 있습니다 11 개의 실시간 트래픽 엔터프라이즈 비디오를 사용하여 Google 시스템에 추가했습니다

각 비디오는 12 시간, 우리가하는 정확도 목표는 99 % 정확도로 리콜 비싼 CNN YOLOv2와 관련하여, 두 개의 기준선과 비교합니다 하나는 기본적으로 제가 처음에 토론 한 두 가지입니다 무거운 것을 섭취하면 모든 것을 섭취합니다 값 비싼 CNN 및 섭취 시간과 역 색인을 저장합니다 범위 없음

한편, 이는 쿼리를 위해 최적화 된 쿼리 전용 시스템입니다 >> 우리는 99 %의 리콜 정확도 사이에서 말하려고합니다 YOLO와 관련하여 YOLOv2 란 무엇입니까? >> YOLOv2는 CNN이 탐지 한 상대적인 이유 개체입니다 나는 그들이 내가 경쟁 할 수 있다고 생각한다 이 이미지 객체 수용 경쟁이라고 생각해

>> 알았어 CNN이 자르고있는 것입니까? 당신은 레이어를 사용하고 커팅하고 있습니까? >> 그래 이것이 기본입니다 >> 본질적으로, 전에 번호를 보여주기 때문에 정가에 대한 회상 CNN은 55 % 정도 같았습니다 그렇지 않습니다

그래서 이것은 55 퍼센트의 99 퍼센트입니까? CNN을 고치는 것은 당신의 직업이 아닙니다 맞습니다, 당신은 연구를하지 않습니다 >> 내가 보여준 결과의 시작 부분에 실제로 싸구려 CNN 리콜의 비교 기준선 >>하지만 거기에 기준선을 보여 줬어 너무 좋았습니다

앞에있는 녹색 선을 읽을 수 있습니다 [들리지 않음] >> 네가 어디 있었어야하지만 너도 마찬가지야 완전한 CNN 인 3 가지를 보여 주었고, 하나는 4 개의 레이어가 있습니다 이 하나? >> 아니 오케이

>> 그래서 어쩌면 내가 오해했을거야 네 그래서 녹색 하나는 ResNet18입니다 이것은 ResNet이 아니며, 이것은 이미 저렴한 CNN입니다 다음 이것은 4 개의 레이어를 제거 6 레이어입니다

그래서 그들은 저렴하고 저렴합니다 따라서 3 개의 저렴한 CNN이 있습니다 값 비싼 YOLOv2와 비교하십시오 따라서 우리는 YOLOv2가 이것을 근거로 할 수 있다고 가정합니다 >>이 사실을 이해할 수 있도록 그렇게 설명 할 수 있습니까? 그래서 심지어 초록색의 것, 더 싸거나 훨씬 더 많습니다

>> 훨씬 저렴 >> 그럼 당신은 더 싸게 만들었습니다 >> 더 싼 데, 그래 >> 그래서 당신이 6 개의 레이어를 잘라서 50 배를 절약한다면? 로 이동하여 50 배를 절약 할 수 있습니다 처음에는 값싼 신경 네트워크

>> 네, 맞습니다 >> 좋아 이제는 더 의미가 있습니다 고맙습니다 >> 고맙습니다

네 >> 당신이 나중에 일할 때, 지불하지 않습니다 당신은 당신이 뭘하는지 모를 것 같았습니다 당신이하려는 일 >> [들리지 않음] >>이게 얼마나 일반적인거야? 나는 말하기 힘든 시간을 보내고있다

귀하의 모범이 슬라이드가 있었다면 그래서 모든 triode와 Saundra 's 또는에 대한 질문을하고 싶다고합시다 용의자가 로욜라 운동복을 입고 있었습니까? >> 그래서 지금 우리는 그들이 사용하는 물체 감지기 CNN을 기반으로합니다 보다 일반적인 수업 사람이나 자동차, 트럭이나 그런 물건들 그러나 당신은 당신이 훈련 할 수 있다고 상상할 수 있습니다 인식 할 수있는 신경망 보다 상세한 수업 또는 당신은 그것의 위에 몇몇 서비스를 건설 할조차 수있다

예를 들어, 먼저 비용을 치르고 나서 회색 차를 찾기 위해 히스토그램을 찍고, 파란색 차가 그런 것 그래서이 특별한 평가에서 우리는 did는 일반 수업을 인식하는 YOLOv2를 기반으로합니다 그러나 당신은 신경 네트워크를 훈련시킬 수 있다고 상상할 수 있습니다 >> 결과의 양을 상상할 수 있습니다 또는 당신이 선택할 수있는 것들이 제한되어 있다는 사실, 사용자가 얼마나 일반화 할 것인가 네가 할 수있는 훨씬 더 광범위한 것들 심지어 우리가 더 심하게 질식하게 될 것이라고 예상하지도 않았습니다

>> 좋은 질문입니다 그래서 우리의 진화에서, 우리는 주로 YOLOv2를 기반으로합니다 그러나 우리는 또한에 근거한 또 다른 평가를했습니다 실제로 1,000 개의 클래스를 인식 할 수있는 152로 작성되었습니다 그러나 분명히 그것은 당신이 말하는 정확한 예가 아닙니다

그러나 우리는 그것이 아니라는 것을 보여 주려고 노력합니다 단지 80 개의 클래스 만 인식 할 수 있기 때문에 더 쉽습니다 우리는 또한 1,000 클래스를하고 우리가 볼 실제로 그 상황에도 적용 가능합니다 >> 좋아 그럼 내가 시켜줘

엔드 투 엔드 성능을 신속하게 처리 할 수 ​​있습니다 여기에서 y 축 검색어 지연 시간이며 x 축은 입력 비용입니다 그래서 분명히 더 작은 것이 더 좋을 것입니다 여기서 우리가 섭취량이 많은 것을 계획한다면, 매우 높은 섭취 비용, 쿼리 대기 시간은 거의 없습니다 반면에 NoScope는 쿼리 대기 시간은 매우 길지만 인제 스트 비용은 없습니다

이 그림에 NoScope을 그려 보면 여기에 있습니다 우리는 또한 확대 그림을 가지고있다 다른 트레이드 오프 옵션이 있습니다 그래서 NoScope가 실제로 섭취량이 무거운 것에 비해 평균보다 57 배나 저렴합니다 >> 초점, 맞습니까? >> 집중

죄송합니다 쿼리 대기 시간, NoScope와 비교하면, 평균 162 배 빠릅니다 이제 쿼리가 오히려 비디오로 한 달에 2 분 5 시간 이상 예 >> 다시 말하지만, 내가 필요한 경우처럼 보인다

몇 분 안에 답변을 얻으십시오 아마 한 달 동안 비디오를 검색 할 필요가 없을 것입니다 더 많은 경우가있는 것처럼 보입니다 언젠가 그런 일이 일어 났고 나는 무엇이 일어 났는지 보려고합니다 지난 24 시간 또는 지난 12 시간, 우리에게는 6 시간이 있습니다

우리가 고려한다면 시스템은 어떻게합니까? 이 짧은 동영상 또는 내가 분석하고 싶은 짧은 기간? >> 그래서 실제로, 이것은 내가 은폐 할 시간이 없었습니다 실제로, 실제로 여기에서 볼 수 있습니다 포커스는 다른 종류의 설정에 대해 최적화 할 수 있습니다 그래서 우리가하지 않으면 쿼리 대기 시간에 대해 모든 것을 신경을 써야합니다 실제로 인제 스트 비용을 최적화하는 옵션을 선택할 수 있습니다

따라서 우리는 실제로 더 작은 섭취 비용을 지불 할 수 있습니다 달성하고자하는 대기 시간 요구 사항을 달성하십시오 예를 들어, 일반적으로 약 1 일 또는 몇 시간의 비디오, 그래서 우리는 우리가 할 수 있음을 안다 기본적으로 백 – 오브 – 엔벨로프 계산, 어떤 대기 시간, 우리가 달성 할 목표, 그 다음 우리는 실제로 더 싼 CNN을 잡아 먹을 수 있습니다 대기 시간 요구 사항을 달성하기 위해, 하지만 우리가 NoScope를 사용한다면, 고정 된 대기 시간이 있기 때문에 그러한 유연성이 없습니다

어쩌면 특정 응용 프로그램에는 괜찮을 수도 있습니다 하지만 다른 응용 프로그램에는 적합하지 않습니다 >> 알았어 NoScope, 그게 당신이 모든 것을하고 그만두는 곳입니다 >> 네

>> 그래서 초당 몇 프레임이이 비디오입니까? >> 그래서 그들은 초당 30 프레임으로 기록됩니다 그러나 모든 평가는 초당 1 프레임을 기준으로 수행됩니다 >> 알았어 네 >> 그래서이 특정 그래프에서 방정식의 한 단계가되는 것만으로도, 얼마나 많은 데이터를 실제로 처리하고 있습니까? >> 12 시간

>> 12 시간? 네 >> 99 %의 정밀 리콜 대상을 치고 있습니까? >> 예, 99 %는 비즈니스를 회상합니다 >> 알았어 그래서 그것은 다른 질문에 대한 답입니다 그것을하기 위하여 아무것도를 요하지 않기 때문에, 너도 마찬가지야

[들리지 않는] 당신이 아주 많이 사용할 수 있다는 사실, 그래서 수도 있습니다 1 %의 정확도 정확도는 아무런 차이를 만들지 않습니다 >> 맞아 괜찮아 그래서이 시스템을 증명하기 위해, 우리는 실제로 데모 시스템을 구축합니다

그래서 이것은 Focus입니다 산호라고 불리는 비디오 예를 보여 드리겠습니다 그래서 기본적으로 쿼리입니다 때때로 우리는 사람들이 나타나서 물건을 볼 수 있습니다 일부 고객 그게 내 핸드백을 잃어버린 것입니다

이 비디오에서 핸드백을 찾으십시오 NoScope을 사용하면 관심 시간에 사전 처리가 필요 없습니다 이 쿼리를 실행할 수 있습니다 분명히 NoScope는 이러한 모든 프레임을 분석해야합니다 따라서 분석 할 프레임은 각각 약 10,000 프레임입니다

실제로 실행하는 데는 시간이 걸릴 것입니다 그래서 분명히 우리는하고 싶지 않습니다 아니면 나중에 다시 돌아올 수 있지만 시간이 좀 걸릴 것입니다 >> 서버에서 실행 중입니다 >> 그래서 서버에서 데모로 실행 중입니다

여기는 웹 페이지 일뿐입니다 반면에 우리는 Focus를 할 수도 있습니다 몇 가지 전처리가 있는데, 같은 쿼리를 할 수 있습니다 하지만 지금 당장은 분석은 200 개 이상의 각 프레임을 실행할 필요가 있습니다 우리는 이미 처음부터 대부분의 프레임을 걸러 내기 때문에, 그런 다음 해당 비디오를 즉시 다시 가져올 수 있습니다

그리고 당신은 그것을 볼 수 있습니다, 예를 들어 여기에 핸드백이 있음을 알 수 있습니다 조금 작게 당신은 이것을 볼 수 있습니다, 그것은 여기에 숨겨져 있습니다 실제로 여기 있습니다 이것은 핸드백이 나타나는 곳입니다

그래서 물체 감지기는 이것을 매우 정확하게 포착합니다 다른 예가 있습니다 당신은 핸드백을보고, 우리가 이것에 돌아 오면, 그것은 아직도 일어나지 않고있다 그래서 그것은 정말로 오래 걸릴 것입니다 이 이야기 전에 실제로, 실제로 NoScope Baseline으로 동일한 쿼리를 실행합니다

우리는 그것이 끝난 후에, 거의 8 분이 걸릴 것입니다 실행 및 동일한 결과, NoScope로 정확히 같은 결과 네 예 >> 한 슬라이드를 왼쪽으로 이동하십시오

>> 하나의 슬라이드가 왼쪽에 있습니까? 네 섭취 비용의 비율은 얼마입니까? 죄송 해요 너 거기있어 그래, 여기 나는 힘든 시간을 x 축을 만들고있다

Focus와 NoScope 사이의 비용 비율은 얼마입니까? >> NoScope에는 섭취 비용이 없습니다 >> 총 비용 >> 총 비용, 머리 꼭대기에 번호가 없습니다 20 배 정도의 차이가 있다고 생각합니다 >> 도망가는 것은 사실입니까? [알아들을 수 없는] >> 당신이 질문에 대해 지불하는 사람, 당신이 섭취하는 돈

>> 그러면 뭔가 다른 것이 중요 할 수 있습니다 >> 알았어 권리 그래서 이것들을위한 다른 어플리케이션들도 있습니다 CNN을 사용하여 커지고 커지는 데이터는이 방법을 사용할 수 있습니다

예를 들어, 다른 많은 비디오 응용 프로그램이 있습니다 얼굴 인식과 유사하게, 감정 탐지, 장면 탐지, 그들은 또한 비슷한 기술을 사용할 수 있으며, 오디오, 그래서 몇 가지 키워드를 찾을 수 있습니다 오디오 또는 생물 정보학, 특정 특성을 가진 특정 뇌 신호를 수정하고, 또는 심지어 geoinformatics, 우리는 위성 이미지, 우리는 특정 대상을 찾거나 추적하기를 원합니다 우리는 또한 다음을 사용할 수 있습니다 우리가하는 유사한 분할 아키텍처 섭취시 사전 처리, 그래서 우리는 쿼리 시간을 상당히 절약 할 수 있습니다

>> 가이아의 질문 중 하나를 따르고 싶습니다 정말 일반적입니다 저는 여러분이 이것을 보여주고있는 것을 좋아합니다 네 >> 네가 장비를 준비 중이라고 했잖아

객체 감지를위한 로우 엔드 >> 그래 >> 여기, 가설은 당신이 모든 다른 모듈로 확장 할 수 있습니다 >> 맞아, 맞아 >> 그게 가설이지만, 실제로 해봤습니까? 거기에 예제가 없습니다

당신의 기술은 실제로 이러한 다른 시나리오에 도움이됩니다 >> 아니, 나는하지 않았다 >> 알았어 자 이제 트레이닝 측면으로 넘어 갑시다 가이아를 소개하겠습니다

그래서 제가 처음에 말했듯이, 우리가 훈련하기를 원하는 시간이 있었다 레버리지를 통한 글로벌 모델 다른 데이터 센터에서 생성 된 데이터 그래서 이렇게함으로써 전형적인 접근법, 쿠니 쉬는 우리가 데이터를 하나의 데이터 센터에 통합 한 다음 해당 교육을 수행하십시오 그러나, 많은 이전의 연구가 오늘날 논쟁 한 것처럼, 분산화 접근법은 대개 다음 두 가지 이유로 보이지 않습니다 하나는 이러한 데이터를 이동하는 것입니다 광역 네트워크는 매우 느리고 비용이 많이 들며, 그리고 다른 문제는 낮은 제약 조건의 일부 데이터 서버, 당신이 EU에서 데이터를 옮길 수 없을 수도 있습니다

그래서 대체 접근법은 우리가이 훈련을 할 수 있다는 것입니다 서로 다른 데이터 센터 및 지리적으로 분산 된 기계 학습 시스템 그러나 이러한 모든 의사 소통은 광역 네트워크를 통해 발생하고 우리의 연구를 기반으로, 시스템을 53 번 이상 느리게 할 수 있습니다 단일 데이터 센터 내에서의 교육에 비해 이 일의 목표는 지리적으로 분산 된 시스템을 개발하고 싶습니다 광역 통신망의 통신을 최소화 할 수 있으며, 정확성과 정확성을 기계 학습 알고리즘의 정확성, 변화가 없다

알고리즘 및 기계 학습 프로그램 그래서 솔루션을 살펴보기 전에, 나는 빠른 배경을주고 싶다 분산 기계 학습 아키텍처, 특히 매개 변수 서버 아키텍처 많은 기계 학습 시스템에서 채택되었습니다 그래서 매우 높은 수준에서, Machine Learning 모델을 교육하고 싶습니다 교육 데이터를 기반으로합니다

이 Parameter Server Architecture를 사용하면, 데이터를 여러 개의 파티션으로 분할합니다 서로 다른 작업자 시스템을 사용하여 각 파티션을 처리합니다 그런 다음 여러 매개 변수 서버를 사용하여 기계 학습 모델 가중치를 공동으로 유지 관리합니다 각 반복 또는 minibatch의 끝에서, 작업자 기계는에 대한 업데이트를 생성합니다 매개 변수 서버에 대한 매개 변수의 가중치, 그리고 나서 우리는 다시 돌아올거야

우리가 생성 할 수있는 가장 최신의 매개 변수 다음 반복 업데이트 이 동기화는 정확도와 대부분의 기계 학습 알고리즘의 정확성 따라서이 아키텍처를 광역 네트워크에 배치 할 때, 가장 직접적인 접근 방식은 우리가 가질 수있는 것입니다 작업자는 다른 데이터 센터에서 데이터를 처리하고, 그런 다음 배포합니다 다른 데이터 센터에있는 매개 변수 서버

그러나이 방법으로, 현지 작업자 기계에서 모든 통신 원격 데이터 센터는 광역 네트워크를 통과해야하며, 그리고 내가 처음 말했듯이, 매우 높은 속도 저하를 초래할 수 있습니다 그래서이 문제를 해결하기 위해, 우리는 Gaia라고 부르는 시스템을 도입했습니다 가이아의 핵심 아이디어는 우리는 동기화 모델을 그 데이터 센터는 서로 다른 데이터 센터 간의 동기화 모델 특히, 우리는 작업자는 다른 데이터 센터에서 데이터를 처리하고, 다른 데이터 센터에도 매개 변수 서버가 있습니다 그러나 여기서 중요한 차이점은 각 데이터 센터에서, 우리는 전체 및 대략 전체 복사본이므로 모델 복사본을 수정하십시오 그래서 작업자 기계와 매개 변수 서버는 모두 진행을 위해 로컬로 실행해야합니다

다른 데이터 센터에서, 우리는 대략 또 다른 정확한 사본을 가질 것입니다 여기서 다른 동기화 모델을 사용할 것입니다 그들이 허용할만한 차이가 있는지 확인하십시오 이 방법을 사용하면 가중치로 변경되는 중요한 업데이트를 전달하고, 우리는 중요하지 않은 것들을 제거 할 수 있습니다 이 아키텍처가 왜 우리를 도울 수 있는지 보려면, 우리는 업데이트의 중요성을 연구합니다

여기서 우리는 3 가지 Machine Learning 어플리케이션을 연구했습니다 매트릭스 분해, 토픽 모델링 및 이미지 분류 그래서 그들은 전통적인 기계 학습, 감독 학습, 그리고 더 최근의 신경망 학습 여기 Y 축은 중요하지 않은 업데이트의 비율이며, X 축은 우리가 선택한 것입니다 중요성에 대한 다른 임계 값

예를 들어, 1 퍼센트는 업데이트가 체중을 1 % 이상 변화 시키거나, 우리는 그것이 중요하다고 말합니다 그렇지 않으면 중요하지 않습니다 우리가 보는 것처럼, 우리는 상대적으로 작은 1 % 임계 값을 선택하고, 업데이트의 95 % 이상이 중요하지 않으며, 왜냐하면 대다수는 하찮다 Gaia 아키텍처를 사용하여 대부분 제거 할 수 있습니다 이러한 모든 매개 변수 서버 여전히 적절하게 동기화됩니다

우리는 새로운 동기화 모델을 도입했습니다 Approximate Synchronous Parallel이라고 부릅니다 여기에는 세 가지 구성 요소가 있습니다 처음 두 가지를 다룰 것입니다 첫 번째 부분은 중요도 필터입니다

작업자 기계가 생성하는 곳 매개 변수 서버 및 서버의 업데이트, 우리는 가치를 유지하고 또한 그 파라미터의 집계 된 갱신 업데이트가 집계됩니다 이러한 집합 업데이트 필드에 각 minibatch 또는 iteration의 끝에서, 우리는 값을 보내고 업데이트를 집계합니다 생성하는 중요성 함수 이 집합 업데이트의 중요성, 그런 다음 유의미 임계 값과 비교해 보겠습니다 따라서이 임계 값보다 큰 경우, 우리는 그것이 중요하다고 말한다

그런 다음 다른 데이터 센터와 공유합니다 그렇지 않으면 우리는 그들을 지역적으로 유지할 것입니다 의미 함수는 다음과 같이 간단 할 수 있습니다 값에 대한 집계 업데이트 간의 비율 우리는있을 수 있다고 상상할 수 있습니다

좀 더 복잡한 의미 함수 유의 수준은 초기화 된 가치를 가지고 있다고 가정 해 보겠습니다 우리는 몇 가지 기능을 적용하여 시간이 지남에 따라이 임계 값이 점점 작아지고, 결국 모든 데이터 센터에서 모든 업데이트를 볼 수 있습니다 두 번째 구성 요소 인 ASP 선택 차단을 호출합니다 그래서 우리는이 기술이 필요합니다

유의성 업데이트 만 보내더라도, 그들은 아직 너무 늦게 도착할 수 있습니다 >> 유의 수준을 어떻게 설정합니까? 나는 작은 가치처럼 보이는 한 사람을 안다 [들리지 않음] 그 의미는 무엇입니까? >> 그래서 분명히, 만약 당신이 초기 중요도 임계 값이 너무 높습니다 그 훈련은 처음에는 갈라 지거나, 그래서 상대적으로 작아야합니다 일부 지역 재판을 통해 이러한 기준을 찾을 수 있습니다

데이터를 로컬에서 사용하여 오류를 일으킨 다음 실행하십시오 Gaia 시스템을 로컬로 내가 쓰려고하는 문지방을 찾아 내고, 그런 다음이를 지리적으로 분산 적용 할 수 있습니다 >> 그럼 우리는 다른 종류의 훈련 준비가 되었습니까? >> 네, 다릅니다 >> 임계 값이 있습니다 시간이 지남에 따라 어떻게 변화합니까? 예를 들어 학습 데이터의 값을 어떻게 든 변경하면, 당신은 일정 조정 학습을해야합니까? >> 네

>> 그럼 거기에 시간 계획이 있습니까? >> 그래서 우리의 기본 일정은 실제로 우리는 실제 변화의 수에 따라 임계 값을 변경합니다 >> 이전에 말 했잖아 거의 모든 업데이트가 중요한 것으로 간주됩니다 시간이 지남에 따라 대부분의 업데이트는 중요하지 않으며, 앞으로 많은 커뮤니케이션이 시간이 지남에 따라 줄어 듭니다 >> 사실입니다

따라서 중요한 업데이트를 보내는 대신, 우리는 실제로 처음에 이 모든 매개 변수가있는 다른 데이터 센터 중요한 업데이트가있을 예정입니다 그래서 현지 노동자들은 그들을 읽지 않습니다 중요한 업데이트가 도착할 때까지 그래서이 방법을 사용하면, 우리는 실제로에 의존하지 않는 노동자들에게 중요한 업데이트가있는 매개 변수를 계속 사용하고, 다른 근로자들은 기다려야합니다 따라서이 시스템을 평가하려면, 우리는 세 가지 애플리케이션을 평가합니다 : 매트릭스 분해 (Matrix Factorization) 토픽 모델링, 이미지 분류 Amazon EC2에 시스템을 배치합니다

우리는 또한 로컬 클러스터를 사용하여 광역 네트워크 대역폭을 에뮬레이션합니다 우리는 또한 우리의 시스템은 실제 EC2 배치를 사용합니다 우리는 두 가지 매개 변수 서버 시스템, 광역 네트워크를 통해 배포됩니다 내가 여기서 보여준 모든 결과들, 그들은 PSP로 할 수있는 것과 동일한 정확도를 달성합니다 로컬 데이터 센터 내에서

>> PSP를 설명하십시오 >> 네, PSP는 내가 처음에 설명한 통신 모델, 그것은 항상 모든 것을 전달할 것입니다 >> PSP [들리지 않는] bandwith 그 시간이 지남에 따라 유사 콘텐츠를 모방? >> 아니하지만 우리는 우리가 한 에뮬레이션 실제 배포에 비해 성능 차이는 5 % 이내입니다 >> 좋아요

매개 변수 작업자 그 매개 변수에 대해 신경 쓰지 않는다 그래서 노동자는 균형을 이룰 수 없다 나는 분명히 아무 것도 모른다 [들리지 않는다] 나는 단지 궁금하다 네 그래서 올가미와 같은 알고리즘이 있습니다

그 본질적으로 데이터에 기반한 특정 가중치에주의하십시오 따라서 일부 데이터의 경우에만 가중치의 일부만 관리하므로, 그들은 항상 모든 무게를 신경 쓰지 않습니다 하지만 몇 가지 학습 알고리즘이 있습니다 예를 들어, 그때 당신은 항상 모든 무게를 돌보고, [들리지 않음]을 생성하기 위해 가중치를 살펴야하기 때문입니다 그래서 신경망의 경우, 이러한 접근 방식은 선택적 장벽은 그리 효과적이지 못하다

어쨌든 모든 가중치가 필요하기 때문에, 이 라운드에서 중요한 업데이트가없는 한 >> 좋아요,이 수업 1에서는, 근로자가 해당 배치의 데이터가이 매개 변수 네트워크에 닿습니다 >> 맞다면 위로 올라갈 수 있습니다 >> 업데이트 당 중요성을 고려하고 있습니다 >> 네 >> 그러나 시간이 흐르면서 누적 된 의미를 상상할 수 있습니다

우리는이 장치를 마지막으로 동기화했습니다 그다음 사소한 업데이트가 있지만 그게 나를 이끌어 준다 내가 중요한 발전을 이룬 곳으로 >> 그래 >> 그 지점에서 강제로 동기화 할 수 있습니다 >> 맞습니다

그래서 우리는 그것을 집합 업데이트라고 부릅니다 따라서 집계 된 업데이트는 재설정 할 수 있습니다 그래서 그것이 작더라도 축적 될 것입니다, 도달 할 때까지 누적되어 축적 될 것이다 의미있는 것이고 그것은 지금 의사 소통을 할 것입니다 >> 그래서 극단적 인 경우

여기있는 사람들은 친숙 할 수도 있습니다 이 1 비트 문제로 바로 여기 뭔가를 만들었습니다 그래서이 임계 값을 가진 극단적 인 경우입니다 당신은 또한 축적과 같은 일을하고 있습니다 그러나 그 접근법에서, 나는 그것이 하나에 매우 제한적이었다고 생각한다

>> 바이너리 결정입니다 먼저 교육 시간을 살펴 보겠습니다 그래서 먼저 우리는 그물망을 버지니아, 캘리포니아에서 평가합니다 같은 대륙에있어 왜 일하지 않는거야? y 축은 교육 시간입니다 우리가 볼 수 있듯이, Baseline과 비교하면, 가이아는 훨씬 빠르고 LAN에 매우 가까운 성능도 있습니다

우리는 같은 알고리즘을 훈련시킨다 단일 데이터 센터 내에 미리로드 된 데이터로 우리는 또한 그것이있는 곳의 설정을 시험합니다 그러나 싱가포르와 상파울루에서는, 이것은 최악의 유선 네트워크 쌍입니다 우리는 쉬운 두 데이터 센터 사이에서 찾을 수 있습니다 우리는이 도전적인 접근법에서, 우리는 아직도 가이아가 꽤 많이 볼 수 있다는 것을 알 수 있습니다

LAN과 기준선 사이의 간격을 좁히십시오 가장 어려운 경우에도 우리가 이미지 분류를 실행하면, 우리는 가이아가 달성 할 수있는 것을 볼 수있다 50 배 이상의 속도 향상 베이스 라인 및 LAN과 매우 유사한 성능입니다 LAN 속도의 123 배에 불과합니다

우리는 또한 이것을 EC2에서 실행하는 비용을 평가합니다 여기에서 우리는 여전히 비용을 세 부분으로 나눕니다 하나는 넓은 네트워크의 통신 비용이며, 또한 네트워크를 기다리는 기계 비용, 계산을 수행하는 기계 비용도 포함됩니다 우선 행렬 인수 분해를 SS가 비용 인 반면 다른 광역 네트워크 설정 모든 설정에서, 가이아 (Gaia)는 훨씬 저렴합니다

대부분 우리가 통신 비용은 네트워크를 기다리는 시간 다른 애플리케이션에서도 마찬가지입니다 가이아는 베이스 라인에 비해 59 배 저렴합니다 그래서 제가 제 3의 연구에 가기 전에, 몇 가지 핵심 테이크 아웃을 빨리 요약하겠습니다 >> 당신은 이것에 대한 중요한 결과를 놓쳤습니다

모델이 얼마나 많은 정확도를 잃었는지 말하지 않았습니까? 지역 일을하는 것과는 대조적으로 >> 손실이 없습니다 나는 처음부터 말한다 따라서 모든 결과는 단일 데이터 센터 내에서 달성 할 수있는 정확성에 대해 >> 그래,이 훈련을 어디서하고, 네가 아주 말하면, 통신 임계치 번호, 그러면 길을 잃기 시작할 것입니까? >> 어떤 시점에서, 그렇지만 우리는 그렇지 않은 임계 값을보고합니다 따라서 임계 값을 매우 높게 설정하면, 50 퍼센트라고하면 분명히 약간의 손실이있을 것입니다 따라서 왜 그렇지 않은지에 대한 두 가지 핵심 통찰력이 있습니다

그래서 첫 번째는 기계 학습 교육을 시작할 때, 업데이트가 많이 발생했습니다 그때 문지름조차도 높습니다 우리가 아니기 때문에 여전히 괜찮아요 최적의 지점까지 정밀하게 조정 한 다음 맨 끝에서 분명히 우리는 최적의 지점을 찾는 것이 매우 중요합니다 그 당시, 학습 속도는 대개 훨씬 더 작습니다

이는 업데이트 자체가 훨씬 작다는 것을 의미합니다 훨씬 작은 업데이트로 이동하면, 우리는 임계 값을 조정하여 작게 만듭니다 그래서 결국 그들은 수렴 할 것입니다 동일한 지점 또는 유사한 지점으로 우리는 실제로 그것을 이론적으로 정당화했습니다

볼록 설정의 경우 비 볼록 설정은 분명히 분석하기가 훨씬 어렵습니다 그러나 볼록 설정의 경우, 우리는 실제로 이론적 증거를 가지고있다 이것은 실제로 작동합니다 예 >> 죄송합니다

비 볼록 설정의 경우, 이 모든 예비가 기본 정확도와 일치합니까? >> 그래 그래서이 세 가지는 실제로는 볼록하지 않습니다 그래서 이것에 대해 이야기하는 것은 아닙니다 비록 그것이 감독되지 않기 때문에 어떤 볼록도 행렬 인수 분해 및 이미지 분류를 위해, 그들은 전혀 볼록하지 않습니다

그러나 우리는 여전히 정확도가 여전히 동일하다는 것을 안다 단일 데이터 세트 내에서 달성 할 수있는 것입니다 >> 그래서 어떻게 비교합니까? 이 대체 기준선과 대체 기준선 너는 어떤 조정도하지 않는다 두 데이터는 두 개의 완전히 다른 모델 사이에 있습니다 모델은 먼저 어떤 데이터 센터에 있는지 알려줍니다

이 데이터는 클러스터에서 생성되었습니다 그 모델을 적용하십시오 >> 아주 좋은 질문입니다 그래서 우선, 그건 실제로 뭔가에 달려 있습니다 저는 매우 빨리 논의 할 것입니다

그러나 데이터 왜곡이 없다고 가정 해 봅시다 우리는 실제로 얼굴 인식 실험을했습니다 그래서 우리가 전체 데이터 세트 또는 데이터 세트의 데이터 세트 또는 4 분의 1, 성능이 실제로 상당히 떨어지는 것을 볼 수 있습니다 따라서 전체 데이터 세트를 보는 것이 중요합니다 그러나 다른 한편으로, 중요한 데이터 왜곡이있는 경우, 나는 아주 빨리 다룰 다른 이야기가있다

예 >> 당신의 시간은 이미 대답에 매우 가깝습니다 어쩌면이 질문은 부적절 할 수 있습니다 왜 내가 비동기 적으로이 모든 것을 할 수 있을까? 업데이트를 적용 할 수 있습니까? 내 서버를 누른 다음 백그라운드에서 또한 다른 매개 변수 서버와 업데이트를 교환하고 그들은 모든 종류의 뒤죽박죽이되어 그것을 적용합니까? 그래서 나는 실제로 내가 만든 후에 차단해라 다른 컴퓨터와 동기화 대기중인 업데이트입니다

그것은 모든 종류의 비동기 적으로 이루어졌으며 항상 혼란 스럽습니다 >> 그래서 이것은 전체 비동기 병렬이라고 불리는 모델입니다 그것은 실제로 내가 정확히 Hogwild라고 생각하는 것입니다 하지만 실제로 입증 된 알고리즘은 특정 알고리즘에서만 작동합니다 예를 들어 신경망의 경우, 그것은 전혀 작동하지 않습니다

>> 왜냐하면 의사 결정에 고통을 당하기 때문입니다 >> 그래, 너는 아주 빨리 갈라 >> 따라서 로컬 데이터 센터 클러스터에서도, 통신을 잠그지 않는 속도로이 모델을 실행하면, 보여준 다른 사람들의 작품이있다 [들리지 않음] 실제로는 훨씬 낫습니다 당신은이 발산을 보았 기 때문에

네 >> 질문이 하나 더 있습니다 그래서 처음에는, 당신이 이것을 정당화 할 때, 당신은 두 가지 타당성을 얻을 수 있습니다 하나는 데이터를 중앙 집중화하기를 원하지 않는다는 것입니다 두 번째 것은 합법적 인 것입니다

나는 두 번째 것을 완전히 사다 그것들은 항상 GDPR 하에서의 소프트웨어입니다 그러나 첫 번째 경우, 어떻게 데이터 코드를합니까? 중앙 집중화 된 시스템에 비해 귀하의 시스템을 위해 이전 되었습니까? >> 아주 좋은 질문입니다 나는 그것을위한 슬라이드가있다 그래서 우리는 실제로 그 비교를합니다

따라서 중앙 집중식 접근 방식과 비교됩니다 그래서 이것은 실제로 속도입니다 따라서 그것이 그 이상인 경우, 그것의 중앙 집중식입니다 그래서 그것은 하나 이상입니다 이는 가이아가 더 빠르며 비용 비율도 있다는 것을 의미합니다

따라서 비용 부분 만 살펴보면, 중앙화 된 것은 사실입니다 오, 죄송합니다 >> 가끔 더 빠르게 실행되지만 더 많은 데이터를 읽습니다 >> 그래, 맞아 네

>> 그래서이 GDPR 시나리오를 수행 할 유일한 이유는, 이는 단지 GDPR이 제공하는 것입니다 >> 그게 더 의미가있을거야, 그러나 그것은 또한 사실에 달려 있습니다 그 데이터 세트의 크기와 모델, 얼마나 많은 반복이 실행되어야하는지 그래서 그것은 그것의 기능이지만 우리는 단지 세 가지만 평가합니다 그래서 당신이 상상할 수있는 경우 모델은 데이터에 비해 상대적으로 작지만, 그러면 비용에 대해서도 더 이해할 수있을 것입니다

>> [들리지 않음] >> 맞아 그래서 요약하면, 우리는 이것이 매우 분산되어 있다는 것을 알 수 있습니다 빠르게 성장하는 데이터는 매우 기계 학습 서비스와 교육 모두에 도전하십시오 우리의 접근 방식은 설계 기계 학습 시스템입니다 그걸 활용하는 기계 학습의 몇 가지 특성 알고리즘으로, 예를 들어, 가이아, 우리는 업데이트가 시간 또는 기계 학습 모델 구조 top-k 결과 또는 이러한 저렴한 CNN 또는 교육 데이터 기능을 제공합니다

예를 들어 동영상에 몇 가지 유사점이 있습니다 그래서 우리는이 접근법을 사용함으로써, 우리는 기계 학습의 대기 시간과 비용을 줄일 수 있습니다 봉사 및 훈련은 1 ~ 2 등급으로 진행됩니다 기계 및 시스템 이외에, 컴퓨터 아키텍처 문제에도 관심이 있습니다 그래서 나는 또한 내가 이끄는 두 프로젝트와 또한 크로스 레이어 추상화 두 CPU와 GPU 그리고 DNN 시스템도 포함합니다

나는 기꺼이 이야기 할 것이다 관심이 있다면이 프로젝트들을 함께 할 수 있습니다 이제부터 나는 빨리 갈 것입니다 함께 일한 우리의 지속적인 노력 비뚤어진 데이터 세트의 경우 Amar입니다 그래서 기계의 대부분의 문헌 학습 분산 학습 가정 그 데이터는 임의로 분배됩니다

그러나 실제 데이터 집합에 대해서는 사실이 아닙니다 예를 들어, 얼굴 인식 얼굴은 실제로 다른 국가의 인구 통계에 의해 결정됩니다 따라서 공간을 비틀 수 있습니다 또한 시간이 지남에 따라 왜곡 될 수 있습니다

다른 시간에, 우리는 다른 인구 통계 및 데이터의 다른 구성 그래서 우리가 묻고 싶은 질문은, 기계 학습에 어떤 일이 일어날 지 시간이나 공간에 따라 데이터가 왜곡됩니까? 먼저 공간을 살펴보고 포괄적 인 카테고리 분류 다른 기계 학습 애플 리케이션, 서로 다른 분산 학습 접근법, 다양한 종류의 데이터 왜곡이 있습니다 그래서 여기에 결과를 보여 드리겠습니다 이미지 분류 및 얼굴 인식, 우리는 더 많은 것을하고 있습니다 3 가지 분산 학습 방법을 연구합니다

가이아와 다른 두 사람 포함 매우 대중적인 분산 학습 통신 오버 헤드를 줄이는 접근 방식 우리가 기울이기 데이터를 만드는 방법은 본질적으로, 간단한 이미지 분류, 다른 이미지 클래스를 다른 장소에 배치합니다 얼굴 인식은 동일합니다 우리는 다른 사람들의 그림을 다른 장소에 두었습니다 이러한 왜곡 데이터가 모델 품질에 어떤 영향을 주는지 보려면, 우리는 CIFAR-10 이상의 특정 예제 GoogleNet을 살펴 봅니다 따라서 y 축은 Top-1 검증 정확도이며, 모델 품질로 볼 수 있습니다

셔플 데이터의 경우, 우리는 세 가지 분산 된 접근법 BSP와의 정확도가 매우 잘 일치합니다 그것은 정확히 동일합니다 그러나 데이터가 왜곡 된 경우, 이야기는 완전히 다릅니다 세 가지 접근법 모두에 대해, 그 (것)들을 가진 중요한 정확도 일이있다 다른 말로하면, 이들 모두 기존의 분산 학습 방법 이 설정을 실제로 고려하지 마십시오

상당한 정확성을 나타낼 수 있습니다 이러한 종류의 데이터를 처리합니다 한편, BSP는 우리는 모든 것을 항상 의사 소통하며, 그것은 정확하지 않을 수도 있지만 너무 될 것입니다 의사 소통이 병목이면 느려집니다 칠판에 걸쳐 동일한 결과를 관찰합니다

예를 들어, 동일한 데이터 세트를 갖는 상이한 신경 네트워크, 우리는 왜곡 된 데이터로 동일한 결과를 볼 수 있습니다 또한 다른 데이터 세트로 시도해 보았습니다 ImageNet과 거의 같은 결과입니다 우리는 또한 다른 응용 프로그램, 얼굴 인식으로 시도합니다 그들은 다른 종류의 검증 계획을 사용하고 있습니다

결과는 거의 동일합니다 그래서 본질적으로이 문제는 실제로 널리 퍼져 있으며 매우 기계 학습 교육의 기본 특히 분권화 된 학습 접근법의 경우 그것이 더 나빠지는 것은 실제로 특정 신경망에 대한 것이고, BSP를 사용해도이 문제를 해결할 수 없습니다 예를 들어 Resnet BSP조차도 상당한 정확성을 잃어 버리는 것을 볼 수 있습니다 우리의 연구는 실제로 그것이 신경망 이 문제가있는 번호 매기기 계층이 빠릅니다

그래서 우리가하는 즉각적인 방향입니다 보고있는 것은이 문제를 어떻게 해결할 수 있는가하는 것입니다 그래서 우리가 가진 생각은 그러한 분산 학습 접근법 다른 장소에서 다른 모델을 유지했다 우리는 실제로 주기적 모델을 여행 할 수 있습니다, 모델을 한 곳에서 다른 곳으로 옮깁니다 새로운 데이터 센터에서 교육 데이터를 사용하여 모델의 품질을 테스트하고, 정확도 차이가 있는지를 알 수 있습니다

서로 다른 장소에서 서로 다른 모델간에 프록시를 사용하여 얼마나 많은 데이터가 비뚤어져 있는지 확인할 수 있습니다 또한, 우리는 또 다른 것을 배울 수 있습니다 어떤 데이터 기호가이 정확도를 떨어 뜨립니다 그러면 우리는 두 가지 일을 할 수 있습니다 제약 조건이 낮아서 데이터를 제거 할 수 있습니다

우리는 통신 기반을 강화할 수 있습니다 우리가 배울 수있는 왜곡이나 정확도 저하 우리가 할 수있는 또 다른 일은, 말하자면, 데이터 이동이 가능하면, 선택적인 데이터 셔플을 할 수 있습니다 능동적 인 학습과 같아서 선택할 수 있습니다 우리가 생각하고 생각하는 데이터 샘플 내 데이터 센터에서 우리는보다 효율적인 의사 소통을 할 수 있습니다

그런 다음 비뚤어진 데이터로이 교육을 수행하십시오 우리는 또한 정규화 된 신경망도 포함됩니다 분명히 이것은 가장 간단한 경우입니다 그래서 다른 경우가 있습니다 또한 공간과 시간에 동시에 비뚤어졌습니다

그래서 우리는 방향에 관심이 있습니다 우리가 지속적으로 배우는 것을 계속 배우는 것입니다 그 데이터는 시간이 지남에 따라 왜곡 될 수 있습니다 따라서 우리는 데이터가 언제 변경되는지를 탐지 할 수 있어야합니다 그런 다음 점진적으로 효율적으로 모델을 업데이트합니다

우리는 재교육하고 싶지 않기 때문에 데이터가 변경되었을 때의 모델 그러나 동시에, 우리는 무엇을 잃고 싶지 않습니다 우리는이 오래된 모델로 배웠습니다 또한 응용 프로그램 요구 사항에 맞게 조정하고 싶습니다 일부 응용 프로그램은 최신 데이터에 관심이 있습니다 일부 응용 프로그램에 관심이있을 것입니다

우리가 본 모든 데이터에 대한 세계적인 지식 실제로 다른 것이 있습니다 제이가 물었던 질문 지역 모델과 글로벌 모델 간의 상충 관계 때로는 실제로 더 이해하기 쉽습니다 당신은 단지 지역 모델을 훈련시킨다 왜냐하면 그는 왜곡 데이터에 대해 훨씬 더 좋았 기 때문입니다

그래서 우리가 묻는 질문은, 훈련이 가능한가? 글로벌 모델과 로컬 모델은 동시에? 우리가 할 수있는 하나의 아이디어 보라는 아이디어는 멀티 태스킹 학습이라고 불린다 본질적으로, 예를 들어, 이더넷, 당신은 밑바닥 층을 세계적으로 훈련 할 수 있고, 그래서 모든 곳에서 데이터를 허용합니다 그러나 우리는 다른 장소를 전문으로 할 수있는 최상위 계층입니다 그래서 우리는이 훈련을에서 할 수 있습니다 같은 시간에 우리는 사용할 수 있습니다

동일한 아이디어 또는 잠재적으로 다른 아이디어, 시간이 지남에 따라 변화해야합니다 그래서 우리가 살펴야 할 다른 차원이 있습니다 길을 내려다 보면서, 나는 또한 다른 기계에 관심이 있어요 강화 학습과 같은 학습 패러다임, 사회 신경망 아키텍처 인 AutoML 일련의 학습 데이터에 대해 자동으로 급속한 성장과 함께 그들이 어떻게 노는 지보고, 분산 및 비뚤어 진 데이터 예를 들어, 강화 학습은 우리가 어떻게 구축 할 수 있는지 명확하지 않습니다 통신 효율적인 보강 학습 시스템 공간과 시간에 따라 데이터를 왜곡하는 데 적합합니다

강화 학습은 당신이 할 수 있다고 가정해야하기 때문에 가서 모델을 시뮬레이션하고, 보상을 받고 사용하십시오 다시 돌아와서 훈련을 할 수 있습니다 그러나 데이터가 다른 장소에 퍼져 있다면, 그래서 당신은 다른 시간에 다른 보상을받을 것입니다 그러면 우리가 어떻게 대처할 수 있을까요? 시간이 지남에 따라 분명히 변화하는 또 다른 문제가 있습니다 반면에 AutoML, 우리는 보통 탐험 할 필요가있다

많은 모델은 최적의 모델을 달성하기 위해, 우리가 달리야한다는 뜻이야 똑같은 훈련이 아니라 동일한 훈련, 5 월을 위해 훈련을 실행하십시오 수백 또는 수천 번있을 수 있습니다 그렇다면 우리를 구성하는 질문은보다 의미가 있어야합니다 왜 데이터를 중앙 집중화하지 않는 것이 좋을까요? 그러나 우리가 그렇게 할 수 없다면, 우리는보다 비용 효율적인 방법이 필요합니다

한 가지 아이디어는 우리가 지역 모델을 서로 다른 곳을 찾은 다음 길을 찾으려고 노력하십시오 이 모델을 관리하고이를 수행 할 수있는 방법을 찾으십시오 다른 방향은, 이러한 분산 학습 방식은 어떻게 접근합니까? Auto ML과 상호 작용합니까? Auto ML을 사용하기 때문에 우리는 알지 못합니다 특정 모델이 수렴 할 것인지 여부 그러나 우리는 또한이 효율적인 의사 소통 방식을 사용합니다

정확성을 위해 다른 문제가 발생할 수도 있습니다 그래서 우리가 알아야 할 다른 차원이 있습니다 그러나 우리가 그러한 접근법을 사용하지 않는다면, 대기 시간은 참기 어려울 것입니다 따라서 비용, 대기 시간 및 정확도 간에는 절충점이 있습니다 그래서 흥미로운 또 다른 방향이 있습니다

그래서 이걸로, 나는하고 싶다 수년에 걸쳐 저의 공동 저자를 인정하십시오 고맙습니다 더 이상의 질문을하게되어 기쁩니다 >> 몇 가지 질문이있었습니다

그래서 당신은 몇 가지 방법을 제안합니다 공간과 시간에 대한 지식을 활용하십시오 왜 기계를 사용하지 않는가? 그림을 그리는 기계 학습 훈련 모델 자동으로 당시 우리에게 한 가지 기능을 제공함으로써 해당 데이터가 수집되었거나 데이터가 수집 된 데이터 센터 >> 그 질문에 대해 잘 모르겠습니다 너 말이야? >> 내 마음 기계가 알고리즘 판타지를 배우는 것을 의미합니다 그게 아무것도 배울 수 없으며 아마도 모델이해야하는 방식을 배우십시오

데이터가 수집 된 데이터 센터에 따라 변경 세계의 어떤 지역과 그것이 수집 된 시간인지를 알려줍니다 그렇다면 왜 기계 학습 모델은 각 데이터에 하나의 추가 기능을 제공하고, 각 데이터에 하나 이상의 추가 기능이 추가됩니다 이것은 수집 된 세계의 일부입니다 또 다른 특징은 이것이 수집 된 시간이었고, 그리고 ML 알고리즘 수치를 이 공간적 및 시간적 의존성을 제거한다 >> 알았어

그래서 좋은 질문이 있습니다 그래서 공간 부분을 위해, 그래서 우리가 훈련에 관심이 있다면 다른 장소를위한 전문 모델, 그 접근법이 효과가있을 수 있습니다 하지만 우리가 원하는 것은 다른 장소에서 데이터를 활용하십시오 따라서이 데이터가 어디에서 왔는지 중요하지 않습니다 그러나 그것은 무엇에 관한 것이 더 중요합니다

데이터의 내용과 그 데이터를 활용하는 방법 따라서 특징 지점을 추가하는 것조차 신경 네트워크에 실제로 도움이되지 않을 수 있습니다 그 당시에는 실제로 시간이 매우 어려웠습니다 기계 학습 교육은 우리가 어떤 임의의 모델과 우리는 이미 어떤 시점에서 특정 모델로 수렴합니다 그래서 그 시점에서, 모델을 움직이는 것만 큼 단순한 것은 아닙니다 몇 가지 더 많은 데이터를 입력 한 다음 다시 시작할 수 있습니다

우리가 최적의 지점에서 벗어나면 고려해야하기 때문에, 그렇다면 이전 데이터는 어떻습니까? 실제로 템플릿이 있습니다 우리가 새로운 것을 배우지 만 오래된 것들은 잊어 버립니다 그래서 그것은 매우 흥미로운 문제입니다 어떤 사람들은 메모리를 만드는 것과 같은 방법으로 작업하고 있습니다 신경 네트워크와 일을 다른 종류의 일을

그러나 그것은 여전히 ​​매우 새로운 영역입니다 죄송합니다 새로운 지역이 아닙니다 그것은 1980 년대와 마찬가지로 제안되었습니다, 하지만 최근에 많은 연구가 진행 중입니다 격변적인 간섭을 가진 신경망

그것은 단지 하나의 문제 일뿐입니다 다른 문제는 어떻게 우리가 우리가 효과적으로 도달 할 수있는 모델 업데이트 새로운 최적의 점 모든 데이터를 고려하지 않고 모든 것을 반환하지 않고? >> 다른 질문이 있습니까? 그렇지 않다면 다시는 우리 스피커에 감사 드립시다 >> 고맙습니다

Data sets for Data Science and Machine Learning | Data Science Tutorial | ZaranTech

헤이 안녕 얘들 아 안녕하세요, 당신이 내 말을들을 수 있기를 바랍니다 화면 이 끝내는 알았어

이 세션에서 우리는 이야기 할거야 기계 학습 및 데이터 과학에 대한 데이터 세트에 대해 모두 괜찮은 vinod 네가 할 수없는 모든 사람들에게 똑같은 말을들을 수 없다고한다 내 말을 들으면 내가 뭘 알 겠어? 감사합니다 음 데이터 세트를 보시라

데이터 과학 및 기계에 관해서 정말 정말로 중요합니다 실제로 특정 데이터 과학을 찾기 란 매우 어렵습니다 실험이나 실험을 할 수있는 다양한 기계 학습 문제에 사용 하나의 데이터 세트를 가져올 수 없으며 모든 분류 플러스 스트링과 회귀는 매우 어렵 기 때문에 일부 데이터 세트를 제공하지 않았습니다 실험을위한 데이터 세트 만 포함되었을뿐 아니라 종류의 설명 사용 예를 알고 있고 코드를 사용하지 않았습니다 여기에 우리는이 데이터 세트가 할 수없는 것에 대한 설명을주었습니다

기계 학습에서 연습하는 동안 데이터 세트를 선택하는 것은 실제로 중요한 사람들은 네가 어떤 데이터 세트라도 가질 수 있다는 것을 알지 못한다 너 자신을 위해 너를 위해 할 일이 무엇인지에 대한 지식을 너는 알지 좋아, 온라인에서 사용할 수있는 많은 공개 데이터 세트를 얻을 수 있으며 데이터의 아이디어를 형성하는 동안 실제로 무엇을하는지에 달려 있습니다 과학 프로젝트 아마도 알고리즘의 변형을 꿈꿔 왔을 것입니다 예측을 논의하는 모델 수행 훈련 데이터를 추정 동료들과 더 많은 결과를 얻을 수 있지만 모든 일을 시작하기 전에 당신은 올바른 데이터를 가져야 할뿐만 아니라 그것이 맞는지 확인해야합니다

귀하의 작업에 따라 분류되었거나 사용하지 않은 데이터에 키스 특정 데이터를 수집 할 필요가 없더라도 프로젝트에 가장 적합한 데이터 세트를 찾는 시간대 프로젝트를 선택하기 전에 프로젝트를 선택해야합니다 귀하의 비즈니스 유스 케이스에 적합한 데이터 세트가 있으므로 확인하지 않으셔도됩니다 항상 가능하지 않은 실시간 데이터를 수집하십시오 특정 데이터를 수집 할 필요가 없습니다 좋은 덩어리를 보낼 수 있습니다

시간은 온라인에서 약간의 시간을 할애 할 수 있습니다 당신은 당신이 가지고있는 블록이나 사람들을 읽어야 만합니다 스택 오버플로에서 특정 질문에 대한 답변이 많았습니다 질문과 답변이 Quora에서 발생하므로 소셜 네트워킹 적절한 데이터 과학자가 사용해야 만하는 것들 아주 좋은 Python이있는 모든 온라인 소스에서 도움을 받으십시오

서로 도움이 될 수있는 커뮤니티 데이터 과학 커뮤니티 다양한 주제에 대해 수천 개의 공개 데이터 세트를 보유하고있는 것처럼 다른 휘트니스 긴장 및 당신은 조리법의 모든 종류에서에조차 알고있다 살충제 중독 비율은 모든 것이 온라인으로 사용 가능합니다 올바른 데이터 세트를 검색 할 때 시간이 필요합니다 원하는 데이터 세트를 찾아야합니다 귀하의 검색은 매우 오래 당신이 데이터 세트를 찾을 수 없다는 것을 알고 있기 때문에 너는 github Kaggle Stack을 가지고 있다고 확신한다 오버플로 펜타 무어에는 당신이 구독해야하는 모든 것들을 계정을 유지하면 정기적으로 업데이트를받을 수있을뿐만 아니라 그것은 당신이 항상 모든 시간을 업데이트하도록 유지할 것이므로 우리는 연구원은 리서치 게이트 (Research Gate)라고 불리는 것을 가지고 있습니다

버몬트에서 매일 업데이트되었지만 매번 조금씩 날짜가 변경되었습니다 데이터 세트가 업데이트되어 계속 유지해야하는 업계입니다 네가 이해할 때까지 너는 적어도 약간의 시간 동안 너는 알았다 조금이라도 암캐가있어서 우리는 이 주제를 생각해 내고 모든 초보자가 쉽게 찾을 수 있도록하십시오 기계 학습 프로젝트 및 데이터에 대해 공개적으로 사용 가능한 최상의 데이터 세트 과학 이니만큼이 바다의 바다로 깊이 들어가 보자

탐색 데이터 분석을위한 우리의 유스 케이스 일반적인 기계 학습 목적 깊은 학습 자연어 처리 클라우드 기반 기계 학습 시계열 추천 장치 숙박 엔진 특정 산업 스트리밍 데이터 현재의 인간을 폐기하는 것으로 알았습니다 이것들이 데이터의 주된 소스임을 알았습니다 과학 저널에 이미 UCI라고 부르는 것을 가지고 있습니다 캘리포니아 대학에 대해 우리의 승리에 대해 그들이 당신과 함께 올라오고 있습니다 4 백 30 삼 가지 다른 도메인에 대해 내가 말하는거야 데이터가 다른 opine 의료 세트는 오 doine mine okay입니다

은행 업무는 나의 것과 금융 분야가 나의 것이기 때문에 궁금합니다 거의 네 가지와 세 가지의 서로 다른 세 가지 영역을 좋아합니다 다른 부분을 kaggle 그것은 당신이 뭔가를 가지고 재정적으로 가면 볼 수있어 quand elle comm이라고 불리는이 프로그램은 그것이 Google에 의해하게되는 이래로 흐름 tangles는 유일한 경쟁이 아니다 최대 도달 범위 다른 데이터 감지 분석 저장소 우리는 다른 평행선을 달리는 경연 대회는 괜찮아요 그렇게 말할 수 있어요

당신은 자신의 데이터를 만들고 기부 할 수 있습니다 여기서 가장 좋은 점은 코드를 가지고있는 커널을 가지고 있다는 것입니다 당신과 이야기 할 수있는 토론 포럼, 의심스러운 점이 있으면 클라우드에있는 AWS Amazon Web Services 당신은 아마존 현자 메이커라고 불리는 것을 제품의 종류 또는 아마존의 서비스는 당신이 그냥 가서 기계를 만들 수 있다는 것을 알 수 있습니다 모델 학습 열차 테스트 클라우드 자체에서 모델을 배포 할 수 있습니다 당신은 당신이 그것을 할 수있는 휴대 전화에서 할 수있는 URL에서 할 수있는 배치 웹 응용 프로그램 그게 괜찮은 옵션을 많이하고 그들은 가지 마세요

단지 당신이 도넛 고 고트 (donot Godot) 인도 나는 인도 정부조차도 그것을 제공합니다 Excel 추격 및 XML PDF 데이터 과학자가 필요로하는 대부분의 유형 특정 GPS 및 jeebies 걸릴하지 마십시오 시작하려고하면 데이터 세트를 알고 KB와 함께 그리고 데이터의 일종이되고 다음에서에서 데이터를 뭉크하려고합니다 시작 단계로 진행되므로 이러한 데이터가 어떻게 세트는 문제의 다양한 다양한 사용되었습니다 그래서 당신이나 당신 중 얼마나 많은 사람들이 당신의 종류를 배우고있는 전문가인지 알고 있습니다 자체 시동기 방식으로 프로젝트를 진행하는 것은 그 일을하는 사람입니다

이 그룹의 우리는 적어도 당신의 손을 들어 올릴 수 있습니까? 그냥 뒤집어 씌우고있어 네가 아는 것처럼 내가 말하는 이름에 말하는게 아니야 참가자 또는 화재 참가자는 채팅 상자에 넣을 수 있습니다 나는 그걸 잘 이해할 것이다 World Bank data set you have 538 github repo의 데이터 세트 여기에 얼마나 많은 github 계정이 있는지 당신을 깊이 탐구해라

github을 알아야한다 github repo를 만드는 방법을 알아야한다 저장소 및 다른 사람들에게 보여줄 수있는 방법을 묻는 것입니다 github repo를 사용하는 사람은 기본적으로 제출 방법 작성 방법을 알고 있습니다 그것을 마스터하는 방법을 강요하는 방법을 DevOps의 기본 형태입니다

ok github 당신이 DevOps를 배우기를 원한다면 DevOps의 기본 양식입니다 개발과 운영에 들어가야합니다 당신이해야 할 첫 번째 일은 github과 함께하는 것입니다 우리가 당신에 대해 이야기하고있는 Emnes 데이터 세트가 이번이 현대적이라는 것을 알았습니다 국립 기술원과 내가 할 수있는 말은 60,000에 가깝다

이 훈련 데이터 세트의 6 만 건과 필자가이 손을 쓸 때 쓰는 숫자를 테스트해라 다른 인간이 당신에게 편지를 썼음을 의미합니다 내가 다른 방식으로 글을 쓰는 다른 방법 그래서 여기서 일어나는 일은 인스턴스를 말할 때 데이터 포인트이거나 하나의 관찰입니다 x 축에서 y 축의 일련 번호를 아는 것에 관해서는 이름이 있습니다

나이 성별 소득 모든 것 그래서 내가 말할 때 일련 번호를 하나의 존 전체 열은 하나의 데이터 포인트 또는 하나의 인스턴스 또는 하나의 관찰입니다 Joran과 같이 하나의 열만 따로 가져 가야합니다 우리가 사용하는 변수는 항상 인스턴스와 데이터 포인트를 확인합니다 하나의 완전한 관찰이 똑같습니다 예리한 74,000 문자 인식을위한 데이터 집합 Google bigquery public 데이터 세트가 많은 YouTube 데이터 세트가있는 데이터 세트 공개적으로 온라인으로 사용 가능하므로 알 수있는 특정 사항이 없습니다

당신이 갈 수있는 특별한 방법이 없습니다 알고리즘의 유스 케이스와 같은 도메인이 기계의 여부 배움이나 동물 배움에 대한 깊은 지식은 한 가지 더 있습니다 UCI가있는 경우 대부분의 데이터가 초기 단계에 있다는 것을 이해해야합니다 그리고 초보자를위한 충분한 양초는이 두 사람이 정말로 있습니다 데이터와 논쟁하기에 충분하다

예, 그것은 당신이 우리가 모든 것을 온라인에서 사용할 수있는 데이터 세트 및 사용 방법 다양한 주제에 관한 데이터를 수집하는 별도의 사진을 찾을 수 있습니다 대용량 데이터는 보통 당신이 알고있는 척탄병과 카탈로그를 설정합니다 그들은 두 가지 일을 할 것입니다 하나는 다른 특정 데이터 포털에 대한 링크를 제공한다는 것입니다 일부 서비스는 직접 데이터에 대한 액세스를 제공하지 않고 사용자가지도의 데이터 세트에있는 기존 포털을 탐색 한 다음 해당 포털을 사용합니다

포털을 열고 원하는 데이터 세트를 드릴 다운하여 마치 다양한 제공자의 데이터 세트를 집계하는 것과 같습니다 예를 들면 보건 인구 에너지 교육 및 더 많은 데이터 세트에 대한 데이터 세트 제공 한 곳에서 오픈 소스 제공 업체가 편리합니다 UCI는 약 400 명을 제공한다고 말할 때 당신은하지 않습니다 33 개의 도메인으로 구성된 왜 당신은 왜 다른 것을 위해 가고 싶습니까? 특정 데이터 세트가있는 경우 검색하려면 해당 데이터 세트 또는 그렇지 않으면 괜찮을 필요가 없으므로 데이터 포털이라고도하는 항목이 있습니다 524 개의 데이터 포털이있는 메타 데이터 기반이지만 큰 것은 아닙니다

발견하기가 어렵지만 데이터를 가져 오는 것이 확실해야합니다 귀하의 사용 사례는 귀하의 이해와 모든 것을 알고 당 datagov 미국에 2 천 3 천 7 천 세트가있다 정부 데이터만으로도 괜찮아요 너무 방대하고 Google은 최근에 도구 상자를 실행하면 Google 도구 상자 데이터에서 Google을 얻을 수 있습니다

전 세계 모든 곳에서 사용할 수 있으며 모든 형식으로 다운로드 할 수 있습니다 너는 이전에 이것들을 좋아했으면 좋았어 우리가 할 수있는 이유는 공개적으로 주어지지 않았다 기계 학습 및 데이터 감각은 데이터 가용성 및 데이터 접근성은 첫 번째 요점은 계산력입니다 충분한 계산 능력을 가지며 사용 가능한 데이터가 더 많으며 우리는 우리가 기계 학습을 할 수있는 데이터에 액세스 할 수 있거나 데이터 과학이나 인공 지능은 여전히 ​​연구 개발 연구소에 속할 것입니다

20 30 년 전에 어떻게 돌아 왔는지 바로 전에 EDA를 배우기를 원한다면 알고 계세요? 당신은 완전한 기계 학습을 이해하기를 원합니다이 모든 것이 모든 데이터입니다 우리가 도메인을 물어 보지 않고 데이터의 사용 사례를 묻도록 설정했습니다 과학 및 기계 괜찮아요 그래, 누구든지 데이터를 시작하는 사람 과학은 탐색 데이터의 전체 절차를 알고 있다는 것을 이해해야합니다 탐색 적 데이터 분석없이 분석하면 프로세스 탐색 데이터 분석은 데이터 과학자 괜찮아요

그래서 한 가지 더 있습니다 데이터 탐색기에 대한 바로 가기 okay 데이터 탐색 분석 탐색 분석은 바로 가기가없는 것과 마음의 상태가있는 것과 같은 것입니다 그 기계 학습은 모든 폭풍우에서 너를 멀리 항해 할 수있어 괜찮지 않을거야 라이브러리 프레임 워크가 여러분에게 매우 도움이 될 수 있음을 이해하십시오

지도에 대한 귀하의 이해를 알고리즘에 대한 최소한의 지식 당신이 깨닫게되는 어떤 시점을 지나서도 괜찮아 질 것입니다 모델 정확성을 향상시키기 위해 고심하고있는 이유는 수학에없는 프레임 워크의 라이브러리에 완전히 의존합니다 모든 상황에서 데이터를 이해하시기 바랍니다 탐사 기술이 당신의 구조에 올 것입니다 당신은 아주 훌륭하게 살아야합니다

데이터 탐색은 무엇에 관한 것인지 완전히 이해하고 있습니다 네가 가치 치료를 놓치고있는 세 가지로 분리 할 수 ​​있다고 말하십시오 또 다른 하나는 특이 치를 탐지 할 수있는 몇 가지 기술이 있다는 것입니다 치료 및 미래 엔지니어링 예술은 모든 미래를 변화시키는 방법을 가지고있는 모든 변수들 변수는 어떻게 특징 변수 생성을 할 것인가? 당신이해야 할 많은 일들이 좋아지기 때문에 우선 우리는 항상 시작합니다 우리가 데이터를 준비하는 데이터 탐색 단계 입력 품질이 출력 품질을 결정한다는 것을 기억하십시오

좋아,이 기계를 배우는 것은 선교사가 그 자체가 명시 적으로 프로그래밍되지 않고 이해합니다 귀하의 의견은 매우 명확해야하므로 출력을 얻으십시오 귀하의 비즈니스 사례 또는 도메인 또는 귀하의 비즈니스 가설 준비 지식 당신이 그것을 오케이라고 부르는 것은 무엇이든간에 그것은 많은 시간을 보내는 것이 합리적입니다 많은 시간을 할애하면 EB에서 많은 시간과 노력이 필요합니다 좋아, 그건 내 개인적인 경험이고 심지어 업계도 느낀다

같은 데이터 탐색 청소 및 데이터 준비가 걸립니다 귀하의 프로젝트 총 시간의 70-80 % 이상을 차지하는 것이 아니라 귀하의 하이 엔드 텐서 루션 PI Taj 또는 귀하의 도서관에서 행해지는 것이 없습니다 당신에 의해 당신은 좋은 수학과 통계학을 가지고 있어야합니다 설명 통계에 대한 지식 또는 그것이 무엇이든지간에 데이터 사용법을 이해하라 지출하는 시간의 80 %는 스스로 해결할 수 있습니다 UI 및 UX 사용자 인터페이스 및 사용자 경험은 가지고있는 내용이지만 모든 것이 당신에게 달려 있습니다

나머지 20 ~ 30 % 그렇습니다 이게 80과 같은 경우 20 20에서 무엇을 하든지 80이 20에 해당합니다 당신이 제대로하지 않으면 20 명이 당신이있는 단계에서 떨어지지 않습니다 여기서 데이터 세트를 테스트하고 데이터 세트를 그 치료법은 80 %가 좋지 않다면 효과가 없을 것입니다 당신은 건물을 짓기위한 데이터를 청소하고 준비하는 것을 이해해야합니다

모델링 될 수있는 예측 일 수있는 모델 좋아요, 이것들은 우리가 이변 양을 적절하게하는 데 아주 조금만 있습니다 단 변량 분석 범주 별 선택 사각형 테스트 누락 된 값은 모든 중복 된 값과 누락 된 값을 어떻게 처리합니까? 데이터가 중복되는 경우 어떻게 추출합니까? 5 개 이상이 될 수없는 경우에는 어떻게 삭제합니까? 전체 데이터 중 일부는 평균 중간 모드를 찾아야한다고 말했습니다 누락 된 값을 채우는 대체 방법을 호출합니다 추정 된 사람들은 괜찮아요 그래서이 대체 방법은 당신이 할 일이 많아서요

혼자서해야만하고 특이점에 대해 이야기해야합니다 특이점은 일반적으로 사용됩니다 필요한 모든 데이터 과학자 또는 데이터 분석 전문가의 용어 주의 다른 경우 예를 들어 데이터 세트가 잘못 추정 될 수 있습니다 4 센트 소득 범위 90 % 90 ~ 95 % 또는 2 명 사이 3 명의 lakhs에 5 명의 사람들은 25 명의 lakhs에 있고 나의 사람들은 나의 이상 치이다 당신은 외계인처럼 말하면서 간단히 대우합니까? 멀리 떨어져서 샘플의 전반적인 패턴과 완전히 다르게됩니다

매우 멀리있는 어딘가에 누워있을 수있는 단 변성 일 수 있습니다 다 변수가되어 인공물이나 자연 또는 물건 때문에 데이터 입력 오류가 될 수 있습니다 실험 오류가 될 측정 오류가 될 수 있습니다 그것은 모든 유형이 될 수 있습니다 좋아요, 그렇게되면 모델에 충격을 줄 수 있습니다 감지하고 제거해야합니다

관찰을 삭제해야합니다 당신에 대한 보상은 별도로 처리해야하며 모든 일을해야합니다 그러면 미래의 공학 미래 엔지니어링에 와서 나는 그것이 기존 데이터에서 더 많은 정보를 추출하는 기술 자체 기본 원칙 및 개념 그리고 기존 데이터의 일부 정보를 추가하지 않은 경우 새로운 데이터를 만들었지 만 실제로 이미 가지고있는 데이터를 만들고 있습니다 유용한 데이터가 있는데 더 이상 아무것도 추가하지 않을 것이지만 그곳에있는 모든 것들이 무엇인지 알아라 데이터를 이해하려고하면 예를 들어 보겠습니다

음식을 예측하거나 당신은 mmm을 알 수 있습니다 당신은 당신이 예측할 것이라고 예측합니다 날짜를 기반으로하는 쇼핑몰의 어떤 것에서 만료 날짜가 나옵니다 직접 시도하고 사용하면 아무런 문제가 없습니다 의미있는 통찰력을 데이터에서 추출 할 수 있습니다

이는 데이터가 낮과 밤의 영향을 덜받는 곳이 요일까지입니다 요일에 대한 정보는 데이터에 약간 암시 적이므로 그것을 가져와 새로운 모델을 더 잘 만들어야한다 좋아요 알려진 데이터에서 정보를 가져 오는이 운동은 미래의 공학이라고 불리는 사람은 누가 미래 공학 이해하기 네가 어떤 복용량인지 알 수있는 의심이 있다면 괜찮아 미래 공학 모든면에서 괜찮다고 느끼면 기본적인 강점을 지닌다

나는 단지 연습해야만한다 나는 단지 우리가 계획하고있는 정보가 아니다 방갈로르에서 ML bootcamp를 수행 할 것입니다 아마 여러분 모두가 그 사실에 관심이 있다면 그 이메일을 받으십시오 너는 그저 걸어 들어가서 그 bootcamp를 할 수 있다는 것을 알고있다

그래서 여기서 일어나는 일은 인기있는 TV 시리즈 인 왕좌의이 게임입니다 요금 시대에 맞춰 정치적 풍경 문자로 설정된 데이터입니다 전투가 열리기 때문에 여기에서 많은 것을 만들 필요가 있습니다 미래 공학의 가치 처리를 기각하는 에다 (eda)의 가정 모든 것이 정돈되어 있으므로 솔직히 많이 배울 수 있습니다 당신이 누락 된 값을 알고있는 것처럼 특이 치 검출 기능은 실제로 엔지니어링입니다

중요한 데이터를 위해서 중요합니다 그렇다면 우리는 수집기로 올 것입니다 당신이 아는 어떤 것입니다 당신이 아는 어떤 것입니다 나는 그것이 전부라고 말할 것입니다

이 데이터 세트에 포함 된 도시 랭킹의 공급자 종류 3 개의 글로벌 대학 순위 IMDB International Movie Database 5000 영화 데이터가 도착하기 전에 좋아하는 영화 인기를 설정 할리우드가 많은 AI를 사용하여 그들의 영화는 맨 위에 그들은 특히 많은 돈을 투자하고 있습니다 어떤 볼리우드 나 다른 것에 대해서 이야기하지만 할리우드는 주로 AI 알아 내거나 아무도이 영화가 어떻게 있어야 하는지를 알지 못한다 이 영화를 좋아하는 사람들의 구체적인 패턴과 어떻게 시장에 내놓는 지 그것들에 대응하기 위해 사용자는 추천 엔진 사용자를 사용합니다 콘텐츠 협업 필터링을 이해하기 위해 계속 진행되는 많은 작업이 있습니다 사용자가 많은 이익을 창출 할 수 있는지 확인하려고합니다

데이터 세트와 우리의 데이터 세트는 reddit 커뮤니티는 항상 아주 좋은 reddit입니다 커뮤니티와 코라는 당신이 croire를 많이 읽었다는 것을 알고 싶다면 아주 좋습니다 질문 및 답변 및 또한 스택 오버플로 metamour 또는 당신은 기계 학습 커뮤니티가 어떻게 도움이되는지 이해할 것입니다 데이터 세트 발행 또는 파일 업로드 또는 다운로드의 경우에는 서로 모든 것은 항상 그들과 함께 계정을 가지고 더 나은 다음 또한 당신이 가지고 그 후에 만 ​​구독하면 무슨 일이 일어나고 있는지 이해할 수 있습니다 백 엔드에 좋아, 선교 학습을위한 괜찮은 데이터 세트 선교 학습이 의미하는 바는 소프트웨어의 초기 시대를 본다

엔지니어링을 코딩하면 출력물을 얻을 수 있지만 기계에 입력됩니다 당신이 어떤 코드도주지 않는다는 것을 배우면, 이전 산출물을 입력으로 준다 우리의 모델로 우리의 시스템에 넣고 모델을 사용할 수있는 모델을 만들 수 있습니다 예측 또는 분류 또는 클러스터링을 위해 너는 뭔가를 건축하고 있을지도 모른다 새로운 건축물에서 고귀한 전에 선교 사업을하지 않았으므로 그 자체가 명시 적으로 프로그래밍되지 않으면 당신은 각자를 프로그램하지 않을 것입니다

선이 좋다면 레이는 이것입니다 당신이하는 일은 당신이하는 일이 아닙니다 당신 스스로 그것을 배우기 위해 시스템에 묻는다 기계 학습 알고리즘이란 무엇인가? 수학 당신은 따옴표로 쓰여진 수학 논리를 알고 있습니다 당신이 좋은 제품을 가지고 있다면 어떤 데이터 세트에서 어떤 활동이나 작업을 처리 할 수 ​​있습니다 지식 또는 데이터 과학에 대한 지식과 모든 것을 알고 항상 알아볼 수 있습니다

회귀 분류와 같은 기계 학습 개념으로 누구나 할 수있다 회귀의 의미가 무엇인지 말해주십시오 회귀 평원에 대한 어떤 생각이든 간단한 영어 기술 전문 용어는 누구나 영어로 간단하게 말할 수 있습니다 두 변수 사이의 관계는 입력 변수가 독립 변수이다 변수 하나는 종속 변수입니다

두 개의 변수가 있습니다 매개 변수가 무엇인지를 변수가 의미하는 바를 이해하는 것 어떤 것이 무엇을 독립적으로 출력합니까? 기본에서만 다음 당신은 이해할 수있을 것입니다 정상에있는 모든 것, 그렇지 않으면 혼란스러워 질 것입니다 당신이 원한다면 당신이 아무것도 얻지 못한다는 걸 알듯이 처음으로 아는 비트 야 그것에서 무언가를 얻는 것은 아주 기본적인 것에서 시작할 수 있습니다 그래, 할 수 있어요

또는 우리는 회귀 신용 카드 불이행을 위해 와인 품질을 선택했습니다 그 사람이 지불할지 여부를 결정할 수 있습니다 그가 지불 할 확률은 얼마입니까? 아니면 지불하지 않을 것입니까? 0 & 1 당신은 클러스터링을위한 분산 또는 센서스 데이터 이후이고 협회는 당신을 각각 세분화하고 있습니다 인구 통계학 아하 북쪽 해안이나 일종의 해안 서해안 북동쪽을 알고있다 각 차례와 당신이 단지 세그먼트를 기반으로 일종의 물건을 여기있는 인구 통계를 통해 학습 한 기계를 볼 수 있습니다

저장소 대부분의 데이터 세트에는 사용할 수있는 학술 논문이 링크되어 있습니다 벤치마킹은 프로세스와 하나 이상의 정보를 알고 싶다면 것은 기계 학습과 깊은 학습에서 많은 것을 읽어야한다는 것입니다 연구 논문은 좋은 모델을 만들고 싶다면 당신은 학문을 말할 때 연구 논문을 이해하고 싶습니다 논문은 기본적으로 모든 연구 논문이므로 이해해야합니다 아키텍처가 어떻게 진행되는지 알기 위해 여러 가지 방법이 있습니다

연구 논문도 마찬가지입니다 그건 완전히 다른 개념입니다 당신이 아는 사람들은 다음 달 또는 미래에 그것을 깊이 탐구 할 것입니다 괜찮 았으면 몇 달 후에 어떻게 읽어야하는지 이해해야합니다 아직 시작하지 않은 문제에 접근한다

나는 깊이 들어가기를 권하지 않는다 만약 당신이 있다면 그들은 데이터 과학 기계에 대해 매우 많이 생각하고 있습니다 학습 개념 네 언제든지 자유롭게 깊은 학습을 할 수 있습니다 그래서 멀리 보이는 한 가지 일은 캐나다 인스티튜트를위한 safar의 약자입니다 고급 연구 M은 현대 기술 연구소의 safar를 의미합니다

그것은 인간의 개를 스캔 한 이미지를 포함하고 있습니다 모든 것이 safar 100 데이터 세트를 사용하려는 경우 또는 방귀 기능을 사용하는 경우 25 55 60이라면 여기에 많은 데이터가 있으므로 괜찮습니다 고화질 이미지가 제공되며 교육을 원한다면 GPU가 있어야합니다 Linux를 사용해야하는 이유는 최고급 루트 시스템입니다 알고리즘의 최적화에 대한 매우 강력한 지식을 가지고있다

적분 미적분과 미적분학이 올바른 것이 아닙니다 그래, 그렇긴하지만 M NIST는 다른 한편으로 CPU에서 돌아갈 수있다 오, 우리는 또한 자습서를 가지고 있습니다 만약 당신이 우리에게 핑을 걸 수있는 깊은 학습에 대한 사면을하기위한 튜토리얼을 줄 것입니다 괜찮아 네, 수백만 YouTube를 제공합니다

비디오 ID와 모든 것 그리고 당신은 완전 차용 이미지를 사용할 수 있습니다 길쌈 신경망 CNN을 알고 있지만 테라 바이트 급의 저장 장치를 사용할 수 있음 그것은 사실입니다 그래서 얼마나 많은 사람들이 신경망을 훈련했고 당신은 각각의 모든 코드 행을 이해할 수있는 사람이 있습니다 전에 신경 네트워크를 훈련하거나 적어도 당신은 괜찮아요 그것을 시도 괜찮 았어 신경망이 다시 바다 인 것을 본다 나는 깊숙이 들어갈 누군가를 제안하지 않는다

이 시점에서 학습하면 사람들은 당신이 알고있는 것처럼 생각합니다 신경망을 훈련하는 것은 쉬운 일임을 알고 있습니다 아니 다시는 생각하기가 쉽지 않아 괜찮아 구글 두뇌 연구 또는 구글의 팀은 구글 두뇌는 많은 제안 과제를 수행 할 수있는 신경망 구조의 방법 어떤 명백한 체중 훈련도없이 우리에게는 당신이 가진 편견이있다 활성화 기능을 사용하면 뉴런 노드가 전파 되감거나 전파 그라디언트 디자인 당신은 깊은 학습에서 배울 많은 것들이 있습니다

당신이 직접 손에 가지고 있다면, 그것은 실제로 모든 사람의 차 안에 있지 않습니다 기계 학습 및 데이터 과학 예, 당신은 깊은 학습에 들어갈 수 있습니다 모든 방법은 괜찮아요, 이것에 대해서는 자신의 찬반 양론이 괜찮습니다 깊은 학습은 두 번째이기 때문에 많이 배우게됩니다 시간 그래, 당신은 깊이 배울 수있는 모든 것을 여기에서 찾을 수 있습니다

J dot org에서 고품질 데이터의 최신 목록 깊은 학습에 도움이 될 때 당신은 항상 당신을 의미합니다 R 및 D에 있습니다 연구 및 개발 모드입니다 간단합니다 우리가 그녀의 엔론 데이터 세트를 주거나 엔론이 그것을하는 것처럼 생각합니다

더 공정한 방법으로 축소 된 모든 사기성 전자 메일을 알 수 있습니다 이 시점에서 온라인으로 이용할 수있는 5 백만 건의 이메일 거래 당신은 긍정적 인 부정 여부 또는 모든 아마존 리뷰를 사용할 수 있습니다 중립적 인 것, 모든것 괜찮아 그래, NLP는 좋았어 또한 당신은 annotated corpora core bra의 답변 목록을 가지고 있습니다 샘플 데이터는 당신이 코퍼스를 가지고 있다고 말한 샘플입니다 클라우드 머신 학습은 내 지식에 익숙해 질 수있는 날짜를 참조하십시오

그것은 이것이 클라우드를위한 것이 아니라 내 서버를 통해 사용할 수 있습니다 클라우드 기반의 모든 기능을 제공합니다 모든 데이터를 전송한다는 사실을 알고 있습니다 온 프레미스 또는 데스크톱을 통해 클라우드에 연결 한 경우 그냥 업로드하려고하지만 당신은 뭔가있는 것을 알고 있습니다 당신에게는 많은 클라우드 서비스가 있지만, 상위 3 개는 AWS Amazon Web Services입니다

구글 클라우드 마이크로 소프트 Azure도 IBM은 클라우드 서비스를 많이 가지고있다 클라우드 서비스 플랫폼과 매우 드물게 일부 데이터 세트는 호환되지 않습니다 하지만 네가 항상 극단적 인 학대를한다고 믿을 수있는 이유는 약 15 년 동안 시장에 내놓을 수 있으며 가동 중단 시간은 적습니다 ec2 Elastic Compute에서 s3 bucket EMR elastic까지 다양한 제품을 보유하고 있습니다 MapReduce 그리고 세이지 메이커가 있습니다

특히 데이터 용입니다 저장 데이터 조작 데이터 처리 및 기계 가동 학습 모델과 모든 것을 좋아할 수 있습니다 항상 거기에 갈 수 있습니다 AWS 또는 클라우드에있는 사용자이므로 클라우드에서 작동하는 모든 사람은 여기 기술자가 아니어야합니다 당신은 주식 가격 Zillow 부동산 연구 결국 괜찮아요 글로벌 교육 통계는 모두 데이터 세트입니다

이 모든 것들은 데이터입니다 여기에 모든 하이퍼 링크가 있지만 공유 할 수는 없습니다 여기에 그 하이퍼 링크가 있지만 프로젝트를 시작할 경우 강한 이해력을 가지고 있고, 당신이 알고 싶다면 당신의 독립적 인 프로젝트를 다운로드하고 데이터 세트를 다운로드하는 데 문제가 있거나 첫 번째 공간에서 데이터 세트를 가져 오면 언제든지 연락하여 연락하십시오 우리는 도망 검사를 통해 우리를 도와 줄 것입니다 Quan DeLand volban이 재무 기록의 대부분을 포함하기 전에 내가 말했던 것처럼 당신이 가진 것들 이 질문에 대한 의문이 생기면 실제로 어떤 기분이 드십니까? 도움이 필요한 것 또는 도움이 필요할 것 같은 도움 예 또는 아니오라고 말하면 안됩니다

하지만 언제든지 확인할 수 있습니다 당신의 비디오 것들이 가능할지 여부에 관계없이 시도해 보겠습니다 당신이 어떤 종류의지지를 필요로하거나 당신이 느끼는 것과 같은 다른 질문은 뭔가해야 할 일이있다 당신 예를 들면 나는 당신이 만약에 느끼지 못한다면 파이썬으로 철저히 철저히 조사해야합니다 당신은 항상 우리가 우리가 당신을 도와 줄 수있는 곳에 있음을 알 수 있습니다

항상 사람들이 한 달 만에 너무 흥분해지고, 프로젝트에 몰려 들었지만 믿을 수 없다 모든 데이터 과학 인터뷰 전환율은 7 점이 아닙니다 인터뷰 기준에 대한 퍼센트는 괜찮습니다 우리는 많은 인터뷰를했습니다 TS 신청자가 시스템을 추적하고 있다는 것을 알고 있습니다

그러면 우리는 가지 않습니다 와 함께 또는 그들은 LinkedIn과 함께 가지 않는 크림 괴물과 함께 가지 않습니다 github repo 프로젝트를보고 나서 게이트 키퍼 첫 번째 레벨 기술적 인 역할을 처음부터 수행하게 될 것입니다 깊이있는 2 개의 수학 깊이있는 매트와 나는 그 중 90 %가 그 말을 듣지 않을 것이라고 말할 것입니다 10 %는 그것을 지우고 코딩에 들어가고 코딩은 아마도 약 5 % 해당 코딩 수준을 지우고 할당이 주어진 것입니다

백 또는 그들은 거의 하나도 내 지식에 하나조차하지 않습니다 47 명은 50 명 중 1 명, 1 명 또는 2 명은 기본 사항을 향상시키는 유일한 방법입니다 데이터 감각은 수학은 확률 통계 선형 대수학 미적분을 배우다 기계 학습 알고리즘을 사용하면 Python으로 건너 뜁니다 당신이 지출 할 수있는 독자의 정기적 인 세척은 최소 3 ~ 4 개월 2 ~ 3 시간 만에 정기적으로 3 ~ 4 시간 정도 몇 개월 후에 프로젝트와 모든 것을 시작합니다 그렇게 할 수 있다면 6 개월을 완료하십시오 나는 그것이 근면 한 일다는 것을 알고있다 그렇습니다 그 때 당신은 할 수있다 일자리를 찾거나 인턴쉽이나 산업계에 아무도 귀찮지 않다는 것을 아십시오 인증에 관해서 우리는 당신이받는 사람에게 어떤 종류의 인증도 요청하지 않습니다

하루 종일 문제가되지 않는 Google이나 Microsoft의 당신이 중요하다고 생각하는 지식은 어떤 종류의 프로젝트입니까? 어떤 종류의 데이터입니까? 왜이 알고리즘을 어떻게 매개 변수와 모든 선택합니까 말했다 데이터에 대한 심층적 인 이해 또는 이해는 사용자가 수학과 알고리즘 논리에 대한 이해가 강해서 항상 말합니다 사람들은 좋은 데이터 과학자가되기를 원한다면 수학과 사랑에 빠지게됩니다 네가 할 수있는 유일한 방법은 그 모든 도서관이 도울 수있는 다른 방법이 없다는 것이다 너는 어느 정도는 그렇지만 너를 향상 시키는데 너를 도울 수는 없다 정확한 모델을 찾는 매개 변수의 정확성 또는 최적화 또는 그것을 할 수없는 모델 선택 예

그게 프레임 워크 또는 라이브러리 괜찮아 할 수있는 능력이 아닙니다 예 추천 시스템 그렇습니다 모두가 아마존을 사용하기 전에 말했죠 그런 다음 제품을 선택하면 구입 한 사람들에게 얼마나 많은 사람들이 저것을 샀을 까? 추천 엔진 우리는 두 개 또는 두 개의 알고리즘을 만들었습니다 두드러지게 사용되는 것은 공동 작업입니다 다른 필터링은 컨텐츠 기반입니다

하나는 사용자의 의도이고 다른 하나는 제품의 의도와 제품의 의도입니다 이 알고리즘이 권장 사항 엔진인지 확인하는 알고리즘은 다음과 같습니다 적절한 방법으로 Pixar 동영상 렌즈로 백만 곡 데이터를 얻을 수 있습니다 당신은 단어를 많이 입력하고 당신은 넷플 릭스가 많은 것들을 가지고 설정 특정 산업 또는 공개 데이터를 선호합니다 공개 또는 공개를 선호합니다

멋진 공개 데이터가 데이터를 전송할뿐만 아니라 Google 도구 상자에도 표시됩니다 약물 관련 산업에 종사하기를 원하거나 원하는 경우 일부 별의 또는 화성과 목성의 기록을 여기에서 볼 수 있습니다 Twitter 스트리밍을 스트리밍 할 수있는 Twitter API가 있습니다 주식 트위스트 응용 프로그램 프로그래밍 인터페이스는 당신이 알고있는 것과 같습니다 방금 전하는 통신중인 응용 프로그램에 연결하고 데이터는 양방향 AP에 초점을 맞 춥니 다

낮은 대기 시간으로 스트리밍 라이브 데이터를 연결하여 무료로 낮은 대기 시간 및 if 높은 품질의 데이터를 원할 경우 비용을 지불해야합니다 저것을 폐지하는 웹 이것은 조금 중요하다 너는 웹 사이트가있는 어디에서부터 정보를 가져 가야하는지 알았지 만 반드시해야합니다 조심 웹 사이트를 위반하는 모든 웹 사이트의 용어는 자신의 조건을 가지고 서비스를 복사하여 붙여 넣기 만하면 안되며 모든 작업을 완료해야합니다 괜찮은 웹 스크러빙은 NLP에서 정말로 중요합니다 이 기사는 당신이 지불해야하는 사람마다 데모 웹 쓰레기 폐기입니다 이 허구의 서점은 예 5:38의 BuzzFeed 뉴스를 제공합니다

현재 이벤트 Times에서 모든 데이터를 스크랩하고 싶습니다 인도의 어린이들을위한 마사 (masa) 국가가 인도 타임즈 (Times of India) 약 30 년 동안 웹 스크랩을 원할 때 기록을 보유하고있을 수 있습니다 내가 말하는 모든 차 왜 인도의 시간은 차분하거나 웹 페이지에 점으로 찍힌다 그래서 토아 닷컴 닷컴 (Toa dot-com hog)은 이전 버전이 많은 아카이브를 확보했습니다 그래서 거기에서 나는 소아마비와 관련된 모든 정보를 추출해야한다

인도에서 예방 접종을 실시하여 소아마비 백신 접종을 위해 출판 된 곳 저 서류는 나의 분석 목적을 위해 저 기사가 추출되어야한다 그래서 내가 무엇을 할 것인가 내가 웹 스크랩을 할 때 나는 웹 스크랩을 할 것이다 거기에 아름다운 도서관처럼 많은 도서관이있다 URL 라이브러리 요청에 의해 스크랩합니다 사용 된 라이브러리가 많이 있습니다 괜찮아

살아있는 데이터 야 네가 살아 있다면 괜찮아 질문이 있으시면 알려주세요 이 시점에서 의심의 여지가 없다면 당신 그래, 네, 미안해 너에게 알려주는 걸 잊어 버렸어

잠깐만 시간을내어 주시겠습니까? 누군가가 실수로 입력 한 것처럼 생각합니다 잠시 시간을 내 시어이 세션에 대한 의견을 제출해주십시오 데이터 세트와 내일 세션에서 나는 다음 세션처럼 우리가 될 것이라고 생각한다 데이터 과학 분야에서 경력을 시작할 때 실수를 피하십시오 사람들과 몇 가지 실수가 있습니다

우리는 이것을 공유하고 있습니다 우리가이 단계를 겪었 기 때문에 우리가 정보를 다른 사람들은 모든 사람에게 이런 일이 발생하지 않도록 확실히하기 위해 질문이 없으면 리뷰를 제출하십시오 우리는 하루 만 부를 수 있고 다음 세션에서 만날거야 알았어 너의 리뷰를 줘라

오케이 고마워요 많은 분들, 다음 세션에서 만나 뵙겠습니다 감사합니다 모두 가입

Writing the Playbook for Fair & Ethical Artificial Intelligence & Machine Learning (Google I/O'19)

[음악 재생] JEN GENNAI : 전 운영 관리자입니다 그래서 내 역할은 우리가 우리의 고려 사항을 만들고 있는지 확인하는 것이다

윤리적 인 AI 주변 심의, 행동, Google의 전체 조직에서 확장 할 수 있습니다 생각할 첫 번째 사항 중 하나 비즈니스 리더 또는 개발자 인 경우 사람들이 당신의 뜻을 이해하도록 보장합니다 윤리가 당신에게 무엇을 의미합니까? 우리에게는 가치 중심 원칙을 설정해야한다는 것이 었습니다 회사로서 이러한 가치 중심 원칙은 우리에게있어, 우리의 인공 지능 원리라고합니다

작년에는 6 월에 발표했습니다 따라서 이들은 AI 개발에 관한 7 가지 지침입니다 우리에게 할당 된 배포 방법 우리는 인공 지능을 개발하고 싶습니다 우리는 편견을 만들거나 강화하지 않기를 원합니다 우리는 기술을 구축하고 있는지 확인하고자합니다

그것은 사람들에게 책임이 있습니다 그리고 우리는 당신이 읽을 수있는 다섯 가지 다른 것들을 가지고 있습니다 우리 웹 사이트에서 구할 수 있습니다 그러나 동시에 우리는 회사에 대한 이러한 포용 원칙, 우리는 또한 우리가 우리의 빨간 선을 고려했습니다 따라서 이러한 기술은 우리가 추구하지 않을 기술입니다

무기 기술과 같은 것들을 커버합니다 우리는 무기를 만들거나 배치하지 않을 것입니다 우리는 또한 기술을 구축하거나 배치하지 않을 것입니다 우리는 국제 인권을 침해한다고 생각합니다 따라서 비즈니스 리더 또는 개발자 인 경우, 우리는 또한 당신이 무엇을 이해하는지 격려 할 것입니다

귀하의 포부의 목표입니다 그러나 동시에, 당신의 가드 레일은 무엇입니까? 무슨 요점을 교차시키지 않을거야? 가장 중요한 일은 무엇인지 알고있는 것입니다 윤리적 인 AI 개발에 대한 정의 AI 원리를 설정 한 후, 그 다음 것은, 어떻게 그들을 진짜로 만들 수 있느냐입니다 당신이 그 원칙들과 일치하는지 어떻게 확신합니까? 여기에는 세 가지 주요한 것들이 있습니다

나는 명심하고 싶다 첫 번째 것은 책임감 있고 권위가 필요합니다 신체 따라서 Google의 경우 이는 고위 간부가 있음을 의미합니다 권한이있는 회사 전체에서 발사를 승인하거나 거절합니다

그래서 그들은 어떤 사람들과 씨름해야한다 이 매우 복잡한 윤리적 질문들 우리가 일을 시작할 수 있도록 우리가 믿는 것은 공정하고 윤리적 인 결과로 이어질 것입니다 그래서 그들은 권위와 책임을 제공합니다 정말 힘든 결정을 내릴 수 있습니다 둘째, 의사 결정자가 올바른 정보

여기에는 회사 내의 다양한 사람들과 이야기하는 것이 포함되며, 외부 사용자의 말을 듣고, 외부 이해 관계자, 그리고 귀하의 의사 결정 기준에 따르십시오 Jamila는 참여에 대해 더 많이 이야기합니다 잠시 후 외부 공동체들과 그런 다음 거버넌스 구축의 세 번째 핵심 부분 책임감이 작동하고 있습니다 누가 그 일을 할 것인가? 구조와 프레임 워크는 무엇입니까? 반복적이고 투명하며, 그리고 그 사람들에 의해 이해되는 이 결정을 내리고 있습니까? 그래서 Google에서는 중앙 팀을 설립했습니다 엔지니어링 팀과 제품 팀에 기반하지 않습니다

여기에 객관성의 수준이 있음을 보장해야합니다 그래서 제품을 만들고있는 사람들과 찾고있는 유일한 사람들은 아니다 해당 제품이 공평하고 윤리적인지 확인해야합니다 이제 당신은 당신의 원칙이 있습니다 사람들이 이해할 수 있도록 노력 윤리가 당신에게 무엇을 의미합니까? 우리는 거버넌스 구조를 수립하는 것에 대해 이야기하고 있습니다

당신이 그 목표를 달성하고 있는지 확인하기 위해, 다음으로 할 일은 당신이 장려하고 있는지 확인하는 것입니다 회사 내부의 모든 사람 또는 함께 일하는 사람 그리고 그 목표에 부합됩니다 따라서 전체 목표를 정렬하여 설정했는지 확인하십시오 윤리적 AI와 – 어떻게 윤리적 인 발전을 이루려고합니까? 그리고 기술의 배치? 다음으로, 당신은 사람들을 훈련시키고 싶습니다 처음부터 이러한 문제에 대해 생각해보십시오

당신은 윤리적 고려를 포기하고 싶지 않습니다 제품 개발 라이프 사이클 후반부 너는 네가 최대한 빨리 시작하십시오 사람들은 이러한 유형의 문제에 대해 생각하도록 훈련 받았습니다 그런 다음 보상을받습니다

당신은 사람들을 붙잡고 있는지 확인해야합니다 윤리적 개발 및 배치에 대한 책임 속도가 느려질 수도 있다는 것을 받아 들여야 할 수도 있습니다 올바른 결과를 얻으려면 몇 가지 개발이 필요합니다 사람들이 사고에 대한 보상을 느끼는지 확인 윤리적 인 발전과 배치에 관한 것 그리고 나서 마침내 사람들을 고용하고 있는지 확인하십시오

너를 돕는 사람들을 개발하고 목표를 달성하십시오 다음으로 프레임 워크를 설정했습니다 당신이 옳은 사람을 고용했다면, 당신은 그들에게 보람을 느낍니다 자신의 목표를 어떻게 달성하고 있는지 어떻게 알 수 있습니까? 따라서 우리는 이것을 검증 및 테스트라고 생각합니다 여기에 예가 있습니다

사용자의 경험 사용자는 누구입니까? 당신이 어떻게 생각하는지 어떻게 확신합니까? 사용자의 대표적인 견본에 대해? 그래서 당신은 다른 경험을 테스트하려고 생각합니다 대부분 핵심 하위 그룹에서 왔습니다 그러나 당신은 또한 생각하고 싶어합니다 소외된 사람들은 누구입니까? 귀하의 노동 인구에서 누가 과소 대표 할 수 있습니까? 따라서 추가주의를 기울여야 할 수도 있습니다

그것을 올바르게하기 우리는 또한 실패 모드가 무엇인지 생각하고 있습니다 우리가 의미하는 바는 사람들이 과거의 제품에 의해 영향을 받았으며, 우리는 그들이 부정적인 영향을받지 않을 것임을 확신하고 싶다 미래에 그렇다면 우리는 그것을 어떻게 배우고 확실하게 앞으로 우리는 그것을 의도적으로 테스트하고있는 중입니까? 그런 다음 테스트 및 유효성 검사의 마지막 비트 이러한 실패 중 일부를 소개하고 있습니다

제품에 스트레스 테스트를 확실히하기 위해 그리고 다시 약간의 객관성을 지닌다 제품이 스트레스 테스트를 통과하는지 확인 공정하고 윤리적 인 목표 그리고 나서 우리는 단지 당신 뿐만이 아니라고 생각합니다 당신은 혼자가 아닙니다 우리가 어떻게 모든 정보를 공유하는지 확인합니다 우리를 더욱 공평하고 윤리적으로 만들고 확실하게하기 우리가 제공하는 제품이 공정하고 윤리적인가? 따라서 모범 사례와 지침을 공유하는 것이 좋습니다

Google에서 제공하는 우리의 연구 및 Google AI 사이트에 대한 모범 사례 따라서이 모범 사례는 모든 것을 포괄합니다 ML 공정성 도구 및 연구에서 Margaret Mitchell이 ​​잠깐 얘기 할 것입니다 뿐만 아니라 모범 사례 및 지침 모든 개발자 또는 비즈니스 리더 따를 수 있습니다 그래서 우리는 스스로를 제공하려고 노력합니다

다른 사람들이 자신의 연구를 공유하도록 격려하기 그리고 또한 학습 그래서 우리가 외부와 공유하는 것에 대해 이야기 할 때, 그것은 또한 목소리를 가져 오는 것에 관한 것입니다 그래서 나는 Jamila Smith-Loud에게 넘겨 줄 것이다 인간의 영향을 이해하는 것에 대해 이야기합니다 JAMILA SMITH-LOUD : 감사합니다

[박수 갈채] 안녕, 모두들 내가 너에게 조금 이야기 할거야 오늘 이해, 개념화 및 평가에 대해 실제 사람들과 공동체에 미치는 인간의 결과와 영향 사회적 형평성과 같은 도구의 사용을 통해 평가 사회 및 자본 영향 평가 주로 사회 과학 분야에서 온다 연구에 기반한 방법을 우리에게 제공하십시오

이러한 질문을 충분히 광범위하게 평가하는 것 제품에 적용 할 수 있도록 우리가 무엇에 대해 생각할만큼 충분히 구체적인지 우리가 할 수있는 유형의 제품 변화와 중재입니다 그래서 저는 질문들 중 하나를 가지고 시작할 것입니다 우리는 종종 이러한 질문에 대해 생각할 때 시작합니다 나는 항상 우리가 윤리에 대해 생각할 때, 공정성에 대해 생각할 때, 편견의 문제에 대해 생각조차하고, 이들은 정말로 사회적 문제입니다 사회 문제를 이해하는 데 중요한 진입 점이 있습니다

실제로 지리학 적 상황이 무엇인지 생각하고 있습니다 사용자가 거주하며 참여가 어떻게 영향을 미치는지 제품과 함께? 그래서 정말 묻고, 어떤 경험 전적으로 사람들이 살고있는 곳을 기반으로합니다 다른 민족들과 크게 다를 수 있습니다 서로 다른 지역에 살고있다 자원이 풍부하고 인터넷에 더 많이 연결되어 있습니다

지역적 차이를 그렇게 만드는 여러 측면의 중대한? 두 번째로, 우리는 사람들이 어떤 일을 저질렀는지 궁금합니다 가족과 함께 제품 사용 그리고 그들의 지역 사회에서 우리는 경제적 변화가 무엇인지 생각하고 싶습니다 이 새로운 기술과의 계약의 일환으로 올 수 있습니까? 실제로 영향을 미치는 사회적, 문화적 변화 란 무엇인가? 사람들이 기술을보고 참여도를 보는 방법 진행중? 그래서 저는 우리의 접근 방식에 관해 이야기 할 것입니다 종류 활용에 대한 좋은 점 사회적 영향 평가 및 공평 영향 평가의 기존 프레임 워크 그게 – 우리가 새로운 토지 개발을 할 때를 생각한다면 프로젝트 또는 심지어 환경 평가, 이미 사회적 영향을 고려하는 기준이 있습니다

그 과정의 일부로 그래서 우리는 새로운 기술을 채택하는 것을 정말로 생각합니다 같은 방법으로 우리는 지역 사회가 어떻게 영향을 받았는지, 그들의 인식은 무엇인가, 그리고이 교전은 어떻게 구성되어 있습니까? 그래서 우리가 생각하는 것들 중 하나 묻는 것에 대한 원칙적 접근 방식은 무엇입니까? 이 질문들? 그리고 첫 번째 것은 실제로 주위에 있습니다 어려운 질문에 참여하십시오 우리가 공정성에 대해 말할 때, 우리가 윤리에 관해 말할 때, 우리는 그들에 대해 별도로 이야기하지 않는다

인종주의, 사회 계급, 동성애 혐오증, 모든 형태의 문화적 편견이 있습니다 우리는 문제가 무엇인지에 대해 이야기하고 있습니다 그 시스템에 오버레이를 그래서 우리가되기 위해서 정말로 필요합니다 그 어려운 질문에 잘 대답하고 그들과 함께, 우리의 기술과 제품이 그 세계와 별도로 존재하지 않는다

다음 접근법은 실제로 예상하는 사고를 향한 것입니다 나는 사고에 대한 다른 생각을한다 사회적 및 형평성 영향 평가 다른 사회 과학 연구 방법에서 인과 관계 간의 관계 상관 관계는 약간 달라질 것입니다 우리는 실제로 예상하고 있습니다 해악과 결과

그리고 그것은 당신이 퍼지 대화로 괜찮을 것을 요구합니다, 충분한 연구가 있음을 깨닫고, 우리에게 충분한 데이터가 있습니다 역사와 상황이 결과에 어떻게 영향을 미치는지에 대한 이해 그리고 당신의 과정에서 예기중인 정말, 정말 중요한 부분입니다 마지막으로, 원칙적인 접근 방식에 대한 사고 측면에서 정말 목소리와 경험을 중심으로 부담을 자주지는 지역 사회의 부정적인 영향의 그리고 그 방법을 이해할 필요가 있습니다

그러한 공동체는 이러한 문제를 개념화하기까지했습니다 나는 때때로 우리가 기술적 인 관점에서 왔다고 생각한다 우리는 지역 사회에 대해 생각합니다 문제와 별개로 그러나 우리가 그 목소리를 중심에두고 약혼 할 준비가되면 전체 과정에서 나는 생각한다 더 나은 결과를 가져옵니다

약혼을 좀 더 깊게하려면 어려운 질문에서 우리가 실제로하려고하는 것 제품이 어떻게 영향을 미칠지 평가할 수 있습니다 커뮤니티, 특히 커뮤니티 역사적으로 그리고 전통적으로 소외당한 사람들 그래서 우리가 정말로 생각할 것을 요구합니다 역사와 문맥에 관해서 어떻게이 문제를 형성하고 있으며 우리는 무엇을 할 수 있습니까? 그 평가에서 배울 것인가? 또한 교차 접근법이 필요합니다

성 평등에 대해 생각하고 있다면, 우리가 인종 평등에 대해 생각하고 있다면, 이들은 개별적으로 살아가는 문제가 아닙니다 그들은 정말로 교차하고 OK입니다 그 교차 접근법에 대한 이해와 함께 훨씬 더 완전한 평가가 가능합니다 그리고 마지막으로 새로운 기술에 대해 생각할 때 새로운 제품에 대해 생각해보십시오 어떻게해야합니까? 권력 영향 결과와 중재의 타당성? 나는 권력과 사회적 영향에 대한 질문이 손을 잡고 가면 우리에게 요구된다

[? 응답 ?] 응답하지 않을 수도 있습니다 가장 좋은 대답을 얻지 만, 적어도 그 어려운 질문을합니다 따라서 우리의 예상 프로세스는 전체 프로세스의 일부입니다 맞습니까? 사회와 형평성을 생각하는 것만이 아닙니다

영향을 미치지 만, 실제로 그것에 대해 생각하고 있습니다 제품 맥락에서 – 그래서 이러한 질문에 대한 도메인 별 응용 프로그램을 가지고 있기 때문에, 가능성을 평가하는 것 위험의 중대성 마지막으로, 의미있는 것을 생각합니다 우리가 개발해야하는 모든 영향에 대한 완화 그리고 그것은 완전한 과정입니다

우리 팀의 관점에서 작업해야합니다 평가에서의 이해, 또한 제품 팀과의 파트너십이 필요합니다 도메인 특정 분석을 실제로 수행 할 수 있습니다 평가 중심 나는 이것에 대해 조금 전에 이야기했다

그러나 우리가이 평가를 중심으로 할 때, 정말로, 우리가 물어 보려고하는 것은 누가 가장 영향을 미쳤습니까? 그래서 우리가 문제를 생각한다면 약간의 경제적 영향을 미칠 수 있습니다 데이터를 기반으로 데이터를 분류해야합니다 어떤 지역 사회, 어떤 인구, 가장 영향을 많이받습니다 특정 인구 데이터 및 이해 가장 큰 영향을받는 사람 또 다른 중요한 부분은 검증입니다

그리고 나는 Jen이 그것을 많이 언급했다고 생각하지만 실제로 지역 사회 기반의 연구 활동에 대해 생각하고, 이것이 참여 적 접근인지 여부, 초점 집단 이건간에 하지만 실제로, 우리는 어떻게 우리의 평가를 검증합니까? 커뮤니티에 직접 참여하고 실제로 중심에두기 우리 프로젝트의 일부로 문제의 골조를 만들었습니까? 그리고 반복과 실현을 통해 처음에는 완벽하지 않을 것입니다 양측에서 잡아 당기기를 요구한다 정말 대화를 제대로하기 위해서 그렇다면 우리는 어떤 유형의 사회 문제를 생각하고 있습니까? 우리는 소득 불평등, 주택에 대해 생각하고 있습니다 변위, 건강 불균형, 디지털 격차 및 식량 접근

우리는 이것들과 모든 다른 유형의 방법들을 생각하고 있습니다 하지만 도움이 될 거라 생각 했어 우리가 구체적인 예를 생각한다면 그럼 하나의 예를 살펴 보겠습니다 사회 문제의 유형에 대해 우리 제품과 사용자와 관련하여 이해하고 싶습니다

식량 접근과 관련된 불공평 주제 이지도는 당신에게 – 그리고 그것은 분명히 미국의 맥락입니다 지금이 질문에 대해 생각해보십시오 항상 글로벌 방식으로 생각하고 있습니다 하지만이지도는 우리에게 좋은 방법이라고 생각했습니다 그것을 보아라

보시다시피 어두운 음영이있는 부분 해당 사용자가 크게 영향을 줄 수있는 영역입니다 우리가 제품에 대해 생각할 때 다른 경험 어쩌면 개인화와 추천을 줄 수도있다 레스토랑 같은 것 그래서 우리는 질문에 대해 생각하고 있습니다 해당 사용자가 포함 또는 제외되는 방법에 대해 제품 경험을 통해 더 나아가서 생각하는 방법에 대해 생각해보십시오

중소기업 및 저 자원 비즈니스 또한 제품 유형에 영향을 미칩니다 그래서 우리가 깨달을 필요가 있습니다 우리가 여기에 갈 수있는 풍부한 데이터 센서스 트랩 레벨만큼 깊은 곳으로 어떤 커뮤니티는 다른 지역 사회와 다른 경험 그래서, 내가 말했듯이이지도는 찾고 있습니다 인구 조사 지역 사회에서 차가없고 슈퍼마켓이없는 곳 1 마일 이내에 저장하십시오

우리가 더 깊게 보이기를 원한다면, 우리는 소득에이 정보를 오버레이 할 수 있습니다 식량 접근과 소득 불균형에 대해 생각해 보면, 종종 연결되는 서로 다른 그룹이 어떻게 다른지에 대한 더 나은 이해 제품에 참여하십시오 그래서 이런 어려운 사회 문제를 생각할 때, 우리가 정말로 생각할 필요가 있습니다 우리가 얻을 수있는 논리적 인 과정 큰 사회적 문제를 향해 나아가고 매우 구체적인 결과를 가져다 준다 의미 있고 변화를 가져 오는 효과는 무엇입니까? 그리고 우리가 정말로 인정해야합니다

오버레이가되는 문맥이있다 우리가 가지고있는 정보로부터이 과정의 모든 부분을, 우리가하는 활동에서 – 내 경우에는, 매우 연구 중심의 활동이되어야합니다 의미있는 결과물에 대해 생각해보십시오 그리고 조금 더 깊숙이 들어가야합니다 이 논리 모델에 대한 생각의 종류로, 우리는 음식 접근에 대해 생각하면서 지금 목적을 가지고 있습니다

예 : 부정적인 의도하지 않은 결과를 줄이기 위해 양질의 음식에 대한 접근이 문제가되는 분야 우리는 또한 상황을 잘 알고 있습니다 그래서 우리는 식량 접근의 맥락을 생각하고 있습니다 하지만 우리는 또한 고급화에 대한 질문을 생각하고 있습니다 우리는 변위에 대해 생각하고 있습니다

우리는 지역 사회의 불신에 대해 생각하고 있습니다 그래서 우리는이 질문이 문맥을 알리는 많은 다른 이슈들, 단지 음식에 대한 접근성 그러나 과정의 일부로, 우리는 자원을 확인하고 있습니다 우리는 다 분야 연구가있는 곳을 생각하고 있습니다 우리가 생각할 수있는 팀? 우리의 외부 이해 관계자는 무엇입니까? 문제의 골격을 도울 수 있습니까? 그리고 나서, 기능 간 관계는 무엇입니까? 우리가 실제로 만들어야 할 이런 종류의 문제를 해결할 수 있고, 우리의 제약이 무엇인지 인정하는 동안? 때로는 시간이 엄청난 제약으로, 지식과 위안이 부족하다

이 어려운 문제들에 관해 이야기 할 수있게되었습니다 일부 활동 및 입력 우리가 생각하고있는 것이 도움이 될 수 있습니다 우리는 몇 가지 대답을 얻는다 사례 연구에 대해 생각하고, 설문 조사를 생각하며, 우리가 사용자에게 묻는 사용자 연구에 대해 생각해보십시오 이 문제에 대한 인식

지리 정보에 기초한 참여 방법 그 분석을 할 수 있다는 점에서 차이가 있습니까? 그리고 실질적인 결과를 창출하고, 일부는 제품 중재 및 실제로 우리가 제품을 어떻게 바꿀 수 있는지, 또한 실제로 생각한 커뮤니티 기반 완화 조치 우리가 참여하는 방법이 있나? 커뮤니티와 함께 ​​데이터를 가져 오는 방법 완전한 솔루션 세트를 만드는 데 정말로 사용할 수 있습니다 그리고 정말로, 항상 긍정적 인 효과를 얻으려는 경향이 있습니다 원칙과 실천 따라서이 영역 중 하나입니다 당신은 매우 원칙적인 접근 방식을 취하는 것처럼 느낄 수 있습니다

그러나 실제로 그것을 실천에 옮길 수있는 것에 관한 것입니다 그래서 내가 너를 떠날 것이고 오늘 이해를 생각하면서 이러한 인간의 영향은 실제로 그들을 적용 할 수 있습니다 특정 기술에 적용 할 생각 응용 프로그램, 신뢰 구축 공평한 협력 – 정말 생각하고, 당신이 외부 이해 관계자들과 함께 할 때, 평등하게 느끼게하는 방법 우리 둘 다 지식을 공유하고 있다는 의미있는 방식으로 경험하고 그런 다음 지식 생성을 검증합니다 우리가 다른 지역 사회에 참여할 때, 우리는 정보, 데이터 및 방법에 대해 진정으로 확인해야합니다 우리가 이것을 틀 짓는 것은 여러 다른 출처에서 나올 수 있습니다

그리고 그것은 정말로 중요합니다 그런 다음 조직 내에서 실제로 생각해보십시오 팀 내에서 변경 에이전트 란 무엇입니까? 실제로 변화하는 도구는 무엇입니까? 그것을 의미있는 과정으로 만드시겠습니까? 고맙습니다 이제 Margaret은 기계 학습에 대해 더 자세히 이야기 할 것입니다 관로

[박수 갈채] MARGARET MITCHELL : 좋습니다 고마워, Jamila 그래서 공정성과 투명성에 대해 조금 이야기 할 것입니다 개발을위한 몇 가지 틀과 접근법 윤리적 인 인공 지능 따라서 일반적인 기계 학습 개발 파이프 라인에서, 개발자를위한 출발점은 종종 데이터입니다

교육 자료가 먼저 수집되고 주석이 달립니다 거기에서 모델을 훈련 할 수 있습니다 그런 다음 모델을 사용하여 콘텐츠를 출력 할 수 있습니다 예를 들어 예측이나 순위, 그리고 하위 사용자 출력을 볼 수 있습니다 그리고 우리는 종종이 접근법을 비교적 깨끗한 파이프 라인이라면 우리가 행동 할 수있는 객관적인 정보를 제공합니다

그러나,이 파이프 라인의 시작부터, 인간 편견은 이미 수집 된 데이터를 형성했습니다 인간의 편견은 우리가 수집하는 것을 더욱 형상화합니다 그리고 어떻게 주석을 달았 는가 다음은 일반적으로 기여하는 인간 편견의 일부입니다 문제가있는 편견과 데이터, 그리고 해석 모델 출력의

보고 편견과 같은 것 – 우리가 발언하는 경향이있는 곳 우리에게 눈에 띄는 것들, 전형적인 것들과 반대되는 것들 – 아웃 그룹 균질 편견 같은 것들 – 우리가 사회 집단 밖에있는 사람들을 보는 경향이있는 곳 어떻게 든 뉘앙스가 적거나 적다 우리가 함께 일하는 그룹 내의 사람들보다 복잡합니다 자동화 바이어스와 같은 것들 – 우리는 시스템의 출력을 선호하는 경향이있다 인간이 실제로 어떤 결과물을 출력하는지 자동화 모순되는 정보가있는 경우에도 말하십시오 따라서 이처럼 간단하고 깨끗한, 엔드 투 엔드 파이프 라인, 인간 편견 사이클의 시작에서 오는, 나머지 부분에 퍼짐 시스템의 그리고 이것은 피드백 루프를 만듭니다

사용자는 편향된 시스템의 출력을보고 시작합니다 클릭하거나 해당 출력물과 상호 작용하기 시작하려면, 이 다음에 훈련 된 데이터를 공급합니다 이미 이런 식으로 편향되어 있습니다 문제가되는 피드백 루프 생성 편견이 악화 될 수 있습니다 이것을 바이어스 네트워크 효과라고 부릅니다

또는 바이어스 "세탁" 많은 일들이이주기를 방해하려고합니다 가능한 최상의 출력을 이끌어 낼 수 있습니다 그래서 우리가 고려해야 할 몇 가지 질문 누가 탁자에 있니? 우리가 작업하고있는 우선 순위는 무엇입니까? 우리가 다른 측면에 대해 생각해야 하는가? 우리가 발전 할 때의 문제와 관점의 차이점은 무엇입니까? 우리가 작업하고있는 데이터는 어떻게 수집됩니까? 그것이 어떤 종류의 것들을 나타 냅니까? 데이터에 문제가있는 상관 관계가 있습니까? 또는 어떤 종류의 소그룹이 어떤 방식 으로든 과소 표현되어 있습니다 불균형 한 오류로 이어질 것입니다

하류? 예측 가능한 위험에는 어떤 것들이 있습니까? 그래서 선견지명으로 실제로 생각해보십시오 가능한 부정적인 결과를 예상하고 우리가 더 잘 이해하기 위해 노력하는 모든 것의 어떻게 우리가 우선 순위를 정해야하는지 어떤 제약과 보충제가 제자리에 있어야합니까? 기본적인 기계 학습 시스템 너머, 우리가 할 수있는 것을 보장하기 위해 우리가 할 수있는 일은 무엇인가? 우리가 예기 한 종류의 위험 예상 할 수 있습니까? 그리고 나서 우리가 당신, 대중들, 이 과정에 대해? 우리는 이것에 관해서 할 수있는 것처럼 투명하게하는 것을 목표로합니다 우리가 어떻게 지내는지에 대한 정보를 얻기 위해 이것에 초점을 맞추고 이것이 부분적이라는 것을 분명히하십시오 개발 라이프 사이클의 몇 가지 기술적 접근 방식에 대해 간단히 이야기하겠습니다

이것은 연구의 세계에 있습니다 당신은 이것에 관한 논문을 볼 수 있습니다 관심이 있다면, 자세한 사항은 ML에는 두 종류가 있습니다 기계 학습 – 우리가 가진 기술 상대적으로 유용하다고 판명되었다

하나는 바이어스 완화이며, 다른 하나는 우리가 가진 것입니다 포괄적으로 포함을 요구했다 바이어스 완화는 신호 제거에 중점을 둡니다 문제가있는 변수들 예를 들어, 일하고 있다고 말하십시오

다음과 같은 상황을 예측하는 시스템에서 누군가 승진해야합니다 그 시스템이 아닌지 확인하고 싶습니다 우리가 알고있는 성 (gender)과 같은 것을 키잉하는 것 승진 결정 특히 여성은 승진 가능성이 적습니다 또는 많은 장소에서 남성보다 덜 빨리 승진했습니다

기술 분야를 포함 해 우리는 적대적인 다중 작업 학습을 사용하여이를 수행 할 수 있습니다 우리가 뭔가를 예측하는 동안 프레임 워크 승진하는 것처럼 우리도 시도하고 예측합니다 우리가 확신하고 싶은 하위 그룹은 영향을 미치지 않습니다 결정과 모델 낙담 그것을 볼 수 없기 때문에 표현을 제거한다

기본적으로 그래디언트를 역전시키고 백 프레 그 펙팅합니다 포함 할 때 우리는 일하고 있습니다 뭔가를 위해 신호를 추가하는 것 – 확실하게하려고 설명되어있는 하위 그룹이 있다는 것, 데이터에 잘 표현되지 않더라도 그리고 이것에 대해 실제로 잘 작동하는 접근법 중 하나 이전 학습입니다 그래서 사전 훈련 된 네트워크를 이용할 수 있습니다 성에 대한 이해를 가지고 예를 들어, 또는 피부 톤의 일부 이해, 영향을 미치기 위해 그것을 사용하십시오

다른 네트워크의 결정 이러한 표현을 순서대로 키 조작 할 수있다 보고있는 세계의 미묘한 차이를 더 잘 이해할 수 있습니다 이것은 하나의 예제입니다 우리가 작업 할 수 있었던 프로젝트 중 누군가가 웃고 있는지를 얼마나 잘 탐지 할 수 있었는지 일부 동의 된 성별로 일하는 것에 기반 함 개인과 무엇에 대한 표현 이러한 젠더 프레젠테이션은 그 모델 내에서 누군가 웃고 있었다 일부 투명성 접근법 우리가 더 잘 설명 할 수 있도록 우리가 일을 책임 져야하는 데 도움이됩니다

잘 했어 그래서 그들 중 하나는 모델 카드입니다 모델 카드에서 우리는보고에 중점을 둡니다 어떤 모델 성능이, 분해 다양한 하위 그룹에 걸쳐, 그리고 우리가 취해진 윤리적 고려 사항, 의도 한 것이 무엇인지 명확하게 해준다 모델 또는 API의 애플리케이션은, 일반적으로 다른 종류의 공유 개발자가 염두에 두어야 할 고려 사항 모델과 함께 작동합니다

또 하나는 데이터 카드입니다 그리고 이것에 대한 평가 데이터를 제공합니다 우리가 숫자를보고 할 때, 이것은 무엇에 기초를두고 있나? 모델을 사용할 수 있다고 결정할 때 누가 대표 하는가? 그것을 사용하는 것이 안전 한가? 이러한 종류의 것들은 학습자에게 유용합니다 일반적으로 더 잘 이해하고 싶다 모델이 작동하는 방식과 일종의 것들 타사의 모델 성능에 영향을 미치는 사용자

그래서 원하는 ML 전문가가 아닙니다 데이터에 대한 더 나은 이해 그들이 작업하고 있거나 표현한 것 기계 학습 모델이 다른 데이터 세트에 있습니다 기계에 기초하거나 평가되는 기계 연구자를 학습 그래서 저와 같은 사람들은 모델 성과를 비교하고자합니다 개선해야 할 점을 이해하고 싶습니다

이미 잘하고있는 무엇이, 그리고 도움 벤치 마크를 정렬하고 진행할 수 있어야한다 미묘한 차이에 민감한 방식으로 다른 종류의 인구에서 우리의 헌신적 인 노력 공정하고 윤리적 인 인공 지능과 기계 학습은 지속적으로 측정하고, 개선하고, 윤리적 인 인공 지능과 관련된 현실 세계의 영향을 공유 할 수 있습니다 개발 감사

[박수 갈채]

AI Capital: What can machine learning Do? Implications for the work and the economy

감사합니다 여기에있는 가장 위대한 도시에서 세계와 그 이유의 일부는 내가 역사를보고 있었기 때문입니다

250 년 전에 제임스 와트 (James Watt) 실제로 스코틀랜드에서 증기 엔진을 개발했고 그것은 산업에 불을 붙였다 혁명과 그로 인해 우리 모두는 약 50 ~ 75 배 더 부유하다 우리 조상들이 몇백 년 전에 우리는 초기 단계에있다 Andrew McAfee와 같은 두 번째 기계 시대에 대해 우리의 근육을 단순히 보강하는 것이 아니라 우리의 마음을 증대시키는 것뿐만 아니라 산업 혁명은 부를위한 것뿐만 아니라 중대한 영향을 미쳤다 생산성과 번영에도 영향을 미쳤지 만 사실이 새로운 사람들에 대해 그렇게 행복하지 않은 러 다이 트 사람들이있었습니다

기술은 그들이 많은 일자리를 제거하고 있다고 느꼈기 때문에 그것이 숙련 된 장인에게는 많은 일자리를 없애 버렸습니다 붕괴를 많이 낳았습니다 부의 가치는 더 컸지 만 경제 법이 없습니다 그 혜택은 균등하게 배분되며 모두가 오늘날 기계의 일부로 사람들이 더욱 걱정하고 있습니다 우리의 근육을 논쟁 할뿐만 아니라 보수 주의자들에게 점점 더 적은 것을 상기시킨다

우리가 인간에게 할 수있는 일은 내가 너와 이야기하고 싶은 것 다음 20 분 정도 그리고 나는 정말로 내가했던 질문을 고대하고있다 너희들이 질문 할 기회를 얻는다 고 주장한다 나는이 새로운 것에 대해 이야기 할 것이다 혁명은 기계 학습의 혁명이며 기계 학습은 일부 직업에 영향을 미치고 여기에서 몇 가지 포인트를 만들어서 원하는 첫 번째 기계 학습의 많은 응용 프로그램이 인간 수준의 성능 또는 심지어 초인적 수준의 성능에 도달하고 있습니다

그러나 우리는 인공 지능과는 거리가 멀기 때문에 좁은 AI와 일반 AI의 구별 인공 일반 정보는 당신이 알고있는 할리우드 영화에서 보는 것입니다 사람들의 모든 일을 처리 할 수있는 터미네이터 머신 언젠가 우리는 패널에서 그날이 얼마나 빨리 논의 될지를 성취 할 것입니다 나는 그것이 수십 년이나 어쩌면 몇 세기가 지난 것 같지만 우리가 가지고있는 것 같아요 이미 분명히 더 나은 특정 좁은 응용 프로그램입니다 사람들보다 더 커다란 혼란을 겪고 있습니다 노동 시장에서 기계가 어떤 것들을 잘하고 인간이 다른 사람들보다 나을수록 그것은 적어도 나를위한 질문을 제기한다

기계가 배울 수있는 것과 우리가하는 것들은 무엇입니까? 배울 수 있고 우리는 각각 비교 우위를 가지고 있습니다 그래서이 질문에 답하기 위해 나는 기계 학습에 대해 많은 시간을 보냈다 전문가는 Google에서 demis hassabis 같이 Kings Cross에서 여기 몇 개를 포함하여 deepmind 및 Schoen 다리 무스타파 Suleiman 세계의 많은 다른 사람들과 나는 물었다 그들은 자신들의 기계를 놓을 작업의 유형을 어떻게 결정할 것인가? 학습 전문가와 어떤 사람들이 당신이 알고 있다고 말하면서 준비가되어 있고 우리가 한 것은 21 가지 질문 루 브릭을 개발 한 것입니다 Carnegie Mellon University에서 기계 학습의 책임자 인 Tom Mitchell과 함께 우리는이 저널 과학에 저것을 썼습니다

그리고 저는 여러분과 조금 이야기 할 것입니다 그 질문을 구별하는 데 도움이되는 조금은 우리가 한 다음 일은 미국 경제의 모든 활동에 대한 루 브릭을 적용 또는 미국 경제에서 사람들이하는 모든 일의 목록이 없습니다 그것이 완전히 포괄적이라는 것을 알아라 그러나 그들이 한 것은 그들이 나누어 줬다는 것이다 미국 경제 노동 통계국은 950으로 나뉘어져있다

직업과 각 직종에는 약 20 ~ 30 명이 있습니다 별개의 과제 버스 운전사 학교 선생님 경제학자 방사선 학자 1 분간의 방사선과 의사에게 부속 된 방사선 전문의 중 일부는 27 가지 업무를 수행하고 있습니다 스물 하나 질문 루 브릭을 가지고 우리는 각각의 작업에 그것을 적용 이제 당신과 공유 할 일은 어떤 작업이 기계에 적합한 지입니다 배우는 것과 그렇지 않은 것, 우리가 어떻게 기업이 산업에 미치는 영향을 이해한다 다른 지리 여기에 세계의 다른 나라의 다른 부분은 메인 테이크 어웨이 나는 잠시 후에 더 자세한 내용을 보여 주겠다

헤드 라인 첫 번째 테이크 아웃은 새로운 일자리가 기계 학습에 의해 우리가 절대로 결코 영향을받지 않을 것입니다 이전 기술의 파도가 전에 반면 감동 불균형 적으로 영향을받은 저임금 저 숙련 새로운 기술이 많은 숙련 된 일자리에 영향을 미치고 있지만 전반적인 추세는 여전히 임금 노동보다 낮은 임금 노동에 영향을 미치고 있습니다 이것은 소득 불평등을 계속 증가시킬 가능성이 매우 높습니다 경제학자들은 숙련 편향된 기술 변화를 요구하지만 다른 핵심 요점은 우리가 모든 직업을 볼 때 우리는 하나의 직업을 찾지 못했습니다 기계 학습이 테이블을 실행하고 20 또는 인간이 현재 기계 학습의 거의 모든 경우에 수행하는 30 가지 작업은 사람들이하는 일을 할 수는 있지만 다른 부분은 할 수없고 그 교훈은 많은 리엔지니어링과 완료해야 할 재 설계 기업가 관리자 노동자들이 기계가 어떻게 작업을 재구성하는지 생각해야한다

직업과 인간은 일하기 위해 다른 부분을합니다 그리고 그것이 제가 생각하는 것입니다 앞으로 10 년 또는 2 년 동안 우리가 보게 될 것은 큰 변화입니다 재구성은 사람들이 대규모로 일자리를 잃는 것뿐만 아니라 너무 자주 누르지 만이 재 작업은 제가 취한 네 번째 교훈입니다 이 연구에서 멀리 떨어져있는 이유 중 하나는 기술만으로는 생산성에 영향을 미치지 않습니다 또는 정책 입안자 또는 개인은 기술을 구입하고 설치할 수 없습니다

이전 기술과 마찬가지로 즉시 생산성을 얻으실 수 있습니다 우리는 증기 엔진이 작업을 상당히 재발견해야합니다 새로운 산업의 전체 발명은 어떻게 재발견되었다 공장들이 조직되었다 그런 종류의 재림은 수십 년이 걸린다

새로운 기술과 같은 많은 의도 자산 비즈니스 프로세스 새로운 비즈니스 모델 돈을 버는 방법 새로운 조직 우리는 아직 사람들의 기업가들 대부분을 이해하지 못합니다 끊임없이 새로운 것을 시험하고있다 억만 장자가되지만 어떤 사람들이 갈지 알기가 어렵습니다 어떤 무형 자산이 없어도이 기술이없는 기술 일반적으로 거의 생산성이 거의 없다 내가 말하는 생산성 J 곡선은 J처럼 보입니다

나는 이렇게 할 것입니다 처음에는 이런 새로운 기술이 측정 된 생산성 수준을 낮추고 나중에 하강 부분은 사람들이 일을 재발 명하는 데 시간을 소비하기 때문에 부분은 무형 자산으로부터 이익을 얻을 때입니다 데이터에서 이미 우리가 약간의 J 곡선을 통과하고 있음을 보여줄 것입니다 이러한 데이터 중 일부는 내가 이야기 할 내용에 대한 개요입니다 세부 사항에 조금 들어가면 첫 번째 테이크 아웃이됩니다

기술은 지난 10 년간 숨이 막힐 정도로 놀랍습니다 사람들은 인공 지능을 50 년 동안 연구하고 있었다 그다지 앞장설 수는 없지만 10 년 전에 연구원들의 집합은 제프리 힌튼 (Geoffrey Hinton)과 같은 사람들을 뽑아 냈습니다 Yann laocoön Joshua Ben Geo는 깊이 학습이라는 기술을 개척했습니다 놀라운 성공을 거둔 기계 학습을 보여 드리겠습니다

당신은 몇 가지 예를 들었습니다 비전과 관련해서는 큰 데이터가 있습니다 스탠포드 (Stanford)의 페 이피 리 (Feifei Lee)가 1400 만개의 이미지 여기 넷은 그들 중 넷이고 기계가 시도하는이 이미지들 각각입니다 10 년이 넘지 않은 것을 알기는 정말 끔찍했습니다 어쩌면 70 % 정확합니다

여기이 곡선의 가파른 부분을 봅니다 Geoffrey Hinton과 그의 동료들이 이러한 깊은 학습을 도입했을 때 신경 네트워크를 사용하는 기술은 갑자기 많은 것을 할 수있었습니다 지금 그들이 인간보다 더 잘하고있는 시점에 같은 데이터 세트에서 나는 그 것들이 오렌지인지 레몬인지는 모르지만 기계 학습 시스템은 많은 사람들에게보다 나은 업무를 수행 할 수 있습니다 이제는 이런 일들을 자기 운전을 위해 야생에서 뛰쳐 나오기를 원합니다 자동차가 기계보다 인간보다 낫다는 것은 확실하지 않지만 우리는 커브의 가장 가파른 부분 인 비전의 가장 중요한 부분 우리 기계에 감각을주는 것은 매우 중요한 이정표입니다

연설에서와 같이 다른 중요한 이정표가 있습니다 Siri 또는 Google 또는 Alexa가 완벽하지는 않지만 10 년 동안 우리는 인간과 이야기 할 수 없으며 일상적으로 기계와 이야기하는 인간과 기계는 매우 간단합니다 오늘 밤에 어떤 영화가 나왔는지 아는 대화는 일주일 내내 비가 내리고 기계가 답할 것입니다 때로는 때로는 때로는 정확하지 않지만 실제로는 인류 역사에 대해 이야기 할 수 있다고 생각하면 변화한다 자연 언어로 된 기계는 매우 근본적이며 또 다시 가까워지고 있습니다

내가 공동 설립 한 조직의 AI 지수에 가면 인간 수준까지 우리는 이것과 같은 수백 개의 차트를 가지고 있습니다 인공 지능의 측면과 그 각각은이 중요한 깊은 학습 기술이 실제로 시작된 2010 년 이후 개선 매우 효과적이되어 현재 일부는 중요한 문제를 해결하는 데 사용되고 있습니다 암을 진단하는 것과 같은 문제는 일 주일에 거의 기사가 보이지 않는다 과학이나 자연에서 누군가가 이러한 기술을 사용하여 진단하는 경우 암 폐렴 뇌 동맥류 또는 이번 주에 뇌가있는 곳 동맥류와 그들은 진단에 사용 된 시스템과 동일한 것을 사용하고 있습니다 얼굴 책에서 얼굴을 인식하려면 여러 종류의 셀을 인식 할 수 있습니다

어떤 것들은 암을 가지고 어떤 것들은 암을 가지지 않으며 어떤 경우에는 이러한 생산을하지 않습니다 시스템은 생산성을 매우 빠르게 이끌고 있습니다 eBay에서 기계 번역기를 소개 한 직후 당신은 수출 사이에 즉각적인 약 10 ~ 12 %의 개선을 보았습니다 그들이 그것을 소개 한 국가의 쌍 스페인어 French Russian 다른 언어에서는 이러한 기술 대부분이 깊은 학습이라는 범주를 사용합니다 감독 학습 및 회사를 가진 사람은 누구나보고 있어야합니다 이 목록 및 생각 나는 어디에서지도 같은이 응용 프로그램을 가지고 있습니까 그런 종류의 매핑이 있으면 X를 출력 Y에 입력합니다

깊은 학습 시스템을 통해 더 잘할 수있는 기회 너의 조직 안에있는 사람들이 그 때문에 금 사기가 일어나고있는거야 현재 전 세계의 기업들이 깊은 학습 연구원을 고용하고 있으며 컨설턴트가 인간과 같은 문제를 해결할 수 있는지 알아보기 위해 초인적 인 수준이 훨씬 낮은 비용으로 지금 어떻게 임금에 영향을 미칠 것인가 우리는 러 다이 트처럼 처음으로 오는 일을 걱정해야합니다 경제학자로서 생각한 첫 번째 일은 값 비싼 노동력 대신 저렴한 기술을 사용하십시오 임금을 낮추는 것은 매우 중요합니다 조금 더 힘들어서 최소한 5 개의 다른 효과가 있습니다

효과는 중요하며 우리 기사에서 우리는 더 큰 어떤 경우에는 세부 사항 기술은 칭찬이 아니라 대용품이다 너는 그것의 사진을 찍고있다 나는 나의 웹 사이트에이 슬라이드를 올릴 것이다 그래서 당신은 그들의 사본을 얻을 수 있지만 사진을 찍을 자유롭게 느낍니다 상호 보완 적 성향을 원한다면 트윗을 쓰면됩니다 기술은 역설적으로 보일지도 모르는 인간 노동의 가치를 증가시킨다

그것에 대해 생각해보십시오 지난 200 년간 임금을 위해 일어난 일입니다 산업 혁명기부터 증기 기관으로 내려 가지 않았다 다른 기술들이 전기를 굴려서 인간의 가치를 높였습니다 지난 10 년에서 20 년 동안의 노동이 그렇게 정체되어 있지 않았기 때문에 힘은 다른 중요한 경제적 효과가있는 어느 방향으로 갈 수 있습니다

지금은 다시 엔지니어링이 마지막 하나를 제외하고는 들어 가지 않습니다 작업 재창조 나는 그것이 가장 중요하고 우리가 생각하는 일이라고 생각한다 가장 많이 생각해야 할 것 같아 어떻게 내가 너에게 우리는 21 개의 질문을 취한이 루 브릭을 적용하고 다른 작업과 여기에서 사용할 수있는 몇 가지 질문이 있습니다 기사 과학 그러나 예를 들면 업무 정보가 디지털 방식으로 인 경우에 디지털 데이터를 학습하는 기계에 큰 도움이되는 컴퓨터로 기록한 것은 기계가 학습 할 수있는 빠른 피드백을 얻으면 기계 학습의 피 훨씬 더 빨라서 21 가지 질문을 모두 통과하지는 않지만 더 나은 긍정적 인 방법으로 대답 할 수있는 이러한 질문이 더 많을수록 작업은 기계 학습 기술을 사용하여 특히 감독하에 수행 할 수 있습니다 학습 기술과 여기에 우리가 보았던 직업의 종류가 있습니다 오 그물 큰 데이터는 950 직업 각각 직업으로 설정 각 사람이해야 할 일을 아주 자세하게 묘사하십시오

방사선과 의사의 경우에는 내가 모르는 27 가지 과제가있다 이것은 내가 그들 중 하나에 대해 알았습니다 나는 그들이 이미지를 해석 할 수 있다는 것을 알았습니다 내가 생각한 것 그러나 분명히 그들은이 모든 다른 것들도 잘합니다 우리가 한 것은 각 과제에 루 브릭의 각 질문을 적용한 것입니다 그리고 이제 우리는 기계가 인간보다 이보다 더 낫다는 점수를 얻었습니다

많은 경우에있어 신체 검사를 실시하는 것이 아니라 기계가 아닌 것입니다 학습 시스템은 매우 잘할 수 있으므로 일자리의 일부가 적합합니다 다른 부분을 배우는 기계는 그렇지 않으며 이것이 우리가 대부분의 작업에서 찾은 것입니다 여기에있는 점들 각각은 내가 한 일의 예다 미안하다

미국 경제에서의 직업과 x 축에서 볼 수있는 것은 임금입니다 오른쪽에있는 것은 가장 높은 임금 직종입니다 왼쪽에있는 것은 가장 높은 임금 직종입니다 최저 임금 직종 및 수직 차원은 기계의 가능성 학습 시스템은 그러한 작업을 수행 할 수 있습니다 예를 들어 보통 지불하지 않은 계산원 잘 그들은 임금 스펙트럼의 바닥 근처에있을거야 어쩌면 두 번째 또는 세 번째 백분위 수 그러나 그들의 작업은 기계 학습에 매우 적합합니다

이미 자동화 될 가능성이 높은 항목은 자동화되어 있습니다 많은 표제어에서 보이는 시험관은 중간 항공사 조종사는 탑승자 중 가장 가까운 곳에서 돈을 많이받는 사람들입니다 배포하지만 그들의 작업은 기계 학습에 상당히 적합합니다 몇 가지 매우 높은 임금 임무는 다소 내리 쬐는 것을 보았습니다 이 분석을 할 때 나는 매우 걱정했다

경제학자 나는 데이터를 너무 많이 사용하지 않아도 기쁘다 학생들이 기계 학습을 통해 상대적으로 낮은 점수를 받도록하십시오 약간의 추세가 여기 저임금 일자리가 더 영향을받을 가능성이 있지만 명확하게 면역이 안되는 많은 고임금 직업이 있습니다 우리는 큰 것을 볼 것입니다 혼란을 겪으면이 차트에서 몇 가지가 있음을 알 수 있습니다

기계 학습에 적합한 모든 직업의 일 적합하지 않은 작업은 실제 질문이 전체 작업이 사라지면 다른 방법으로 리엔지니어링이 될 것입니다 구조 그것은 지리학에 의해 이루어지고있는 일의 종류를 밝혀냅니다 맨하탄 또는 다운 타운 로스 앤젤레스에서 수행되는 작업과 다릅니다 와이오밍이나 벤톤 빌 아칸소에는 보통 사람들이 있습니다 두 곳에 학교 선생님 경찰관이 있지만 더 많은 월스트리트가 있습니다 분석가가있는 곳보다 한 곳에서, 다른 곳에서 우리가 발견 한 것은 청색 영역은 기계 학습에서 상대적으로 덜 영향을 미칠 것입니다

빨간색 영역이 더 심하게 영향을받을 것입니다 세계의 많은 다른 나라들에 대해서도 비슷한 분석을하고 있지만 우리는 매우 큰 것처럼 보일 것입니다 지형적 인 차이는 영향을 미치지 않을 것입니다 모든 주 지역의 도시는 골고루 산업 건강을 볼 수 있습니다 보육 및 교육 서비스는 소매 무역에 다소 영향을 미치지 않습니다

교통이 훨씬 더 많이 영향을받을 수 있으며 회사에서이를 수행 할 수 있습니다 미국의 모든 500 대 기업을 조사한 결과, 그들 중 일부는 자사의 핵심 비즈니스 프로세스가 우리가 불스 아이에있어 그 회사를 배우는 기계 나는 그들에게 투자하는 것에 조심해야한다 기계 학습이 많은 사람들을 끌어들일 것이기 때문에 그들이 현재하고있는 기능들과 다른 회사들이 있습니다 상대적으로 많은 다른 방법이 있습니다 이 기술을 사용하여 기계 학습이 어떻게 영향을 미치는지 이해합니다

경제가 지금 당황한 한 가지 질문은 내가 정말로 놀라 웁니다 기술로 할 수있는 것은 왜 우리가 더 많은 생산성을 보지 못했는가하는 것입니다 우리가 볼 수있는 놀라운 기술로 기대했을 것입니다 커다란 이익이지만 생산성이 실제로 느려지는 것으로 나타났습니다 영국의 모든 미국과 실제로 선진국의 모든 경제는 선진국들도 생산성이 10보다 낮았습니다

또는 20 년 전에는 약 절반 정도 성장하여 이전처럼 성장했습니다 2018 년에 데이터를 확인했는데 정확히 지난 13 %였습니다 19 % 상승한 미국의 4 분의 1에 그쳤다

우리는 그것이 어디에 있는지를 정말로 알지 못합니다 어떻게이 놀라운 일이 될 수 있습니까? 여러 가지 일을 할 수있는 생산성과 생산성이 떨어지는 기술 올라가는 것보다는 오히려 전 세계적으로 일어나는 현상입니다 경제학자들이 생산성 역설 (productivity paradox)이라고 부르는 것이 있습니다 그리고 제가 약간의 역사 연구를했을 때 나는 이것을 발견했습니다 증기 기관에서 사실이었습니다

엥겔스 (Engels)라고 불리는 것이 40 정도있었습니다 증기 엔진의 산업 도입 이후 몇 년 동안 생산성 매우 낮은 전력도 약 30 35 년 생산성 게임 없음 폴 데이비드 옥스퍼드와 스탠포드는 ​​전기를 통하는 공장을 보았고 그의 놀람에 전기가 통하지 않은 사람들은 내부적으로 연소 엔진은 컴퓨터와 같을 수도 있고 아마도 AI와 함께있을 수도 있습니다 네 기술을 통하게 한 그 공장에가는 것은 놀랍습니다 기술 미안한 전기는 놀라운 기술이라고 생각하지 않는다 쓰레기 나는 그것이 유행이라고 생각하지 않는다

그러나 그들이 어떻게 다시 엔지니어드하는 데 시간이 걸렸다 일이 끝나면 여기에 무슨 일이 일어나고 있는지에 대한 설명이 많이 있습니다 하나는 AI가 단지 다른 사람과 살아가는 것이 아니라는 것입니다 우리가 그리워하는 것입니다 우리가 얻지 만 보여주지 않는 몇 가지 이점이 있음을 측정 생산성 통계에서 세 번째는 이익이 존재한다는 것입니다

재분배 및 소멸되어 대부분의 사람들이 그들을 얻지 못하고 마지막으로 그러나 적어도 구조 조정 및 구현에 관한이 질문이 있습니다 lags 나는이 가설들 모두 네 가지에 대한 증거가 있다고 생각하지만, 제 생각에 가장 중요한 것은 네 번째 것입니다 이러한 재 설계 및 재 구현은 사용자가 놀라운 신기술로 단순히 구매하기에 충분하지 않습니다 비즈니스를 재창조하고 10 년에서 20 년이 걸린다면 MIT와 계약 한 부분이 바로 생산성을 보게 될 것입니다 일부 그리스 문자와 내 대화의 모든 그래서 이것은 방정식입니다 실제로 이것을 결정하는 전통적인 제품 생산성은 다음과 같이 계산됩니다

이 추가 용어는 재 구현 지연을 나타내지 만 궁극적으로는 J 곡선의 종류로 이어지면 처음에는 생산성이 떨어지고 그 다음에 나중에 다시 그리고 결국 그것은 지금 우리가이 딥에있는 인공 지능 우리가 정말로 많이 얻지 못하고있는 곡선의 한 부분으로 합계를합시다 그때 내가 여기에서 핵심 테이크 아웃을 말하면서 여기를 클릭하자 기계 학습의 많은 응용이 인간 또는 초인적 인 수준에서 우리는 이것을 사용하여 각 카테고리에 속한 작업을 평가할 수 있습니다 루 브릭 거기에 기계에 대한 21 가지 질문 적합성 루 브릭이 있습니다 우리가 18,000 건의 과제를 적용했을 때 우리가 새로운 고임금 일자리를 찾았습니다

이전에는 영향을받지 않았지만 더 큰 교훈을 얻었습니다 한 그룹이 이득을 얻는 것이 아니라 한 그룹이 그것을 잃을 것입니다 모두가하고있는 일을 재발견해야 할 것입니다 작업의 구조 조정과 마침내 우리는 reinvention의 거래 그리고 그것은 기술자들이 가진 진정한 과업입니다 그들의 일을 마쳤습니다

이제는 숨 막힐듯한 기술자들을 보냈습니다 기업가와 경영자를 위해 우리의 기술을 재창조하기 위해 우리 나머지에게 그들이 어떻게 일을 구성하는지 다시 생각해 봅시다 그리고 그 일을한다면 우리는 수확 할 것입니다 원하는 경우 생산성 향상 세트 이것에 대해 자세히 알아보기 나는 당신이 얻을 수있는 많은 기사를 썼다 그것을 내 웹 사이트에서 읽고 그것에 대해 조금 더 읽어보십시오

경제를 재창조하여 혜택을 얻을 수 있도록 저와 함께하십시오 인공 지능 덕분에 대단히 감사합니다 정말 고마워, 이제 괜찮아 우리 랑 같이있어 줘 빨리 물어 보자

질문은 전 세계의 특정 정부가 당신에게 특히 기회와 도전에 살아 있음을 발견했습니다 이 두 번째 Machine Age에서 발표 한 것은 내 큰 것 중 하나라고 생각합니다 실망은 기술자들이 단지 숨 막히게 일한 것입니다 거의 모든 정부가 무너지고있다 내 정부가 기사를 작성했다고 생각한다

미국은 백악관에서 일련의 피정에 참으로 잘못왔다 오바마와 트럼프 밑에서 나는 사람들이 시리즈의 유럽인은 충분하지 않습니다 그것을 다른 사람들보다 조금 더 이해한다 나는 중국이 끝났다고 말한다 그 곳의 지도력은 인위적인 것의 잠재력을 이해합니다

인텔리전스 및 그들은 거액 투자 할 정부 다운 프로그램을 가지고있다 AI 에서뿐만 아니라 경제의 재 탄생과 실제로 이것에 관한 것입니다 1 시간도 채 안되는 무대에서 큰 무대가 시작됩니다 유니콘 더 한 번 감사합니다 아리 우리 패널에 우리와 함께하시기 바랍니다하지만 에릭, 정말 고마워 이제 우리는이 공동 창립자와 함께이 대화를 강화할 것입니다

스텔스 AI Skype 창립 엔지니어 Seedcamp의 리더 재정적 시간보다 대화를 함께하는 것이 더 낫습니다 혁신 편집자보다 더 나은 분은 오신 것을 환영합니다 남자 가시 언덕 이 이야기에 대한 훌륭한 소개를 해주신 에릭에게 정말 감사드립니다 Olly가 나의 패널에게 일찍 암시했던 것에 따라 오늘 여기에서 있기 때문에 멋지다 도덕적 의미보다는 정치적 의미로 반발하며 이 패널의 제목을 광고의 제목으로 변경하십시오

브로셔에 실은 벤처 기업과 대주주가 혁신을 시작했으며 이제는 연설자를 환영 할 수있게 된 것을 기쁘게 생각합니다 경력을 쌓은 후 2007 년 Seedcamp 벤처 펀드를 설립 한 Reshma Suhani M & A 뱅킹과 Vodafone 및 Reshma는 그녀가 여전히 뛰고 싶어하는 일을 즐긴다 고 말합니다 그녀의 80 년대는 내 로봇이 나를 위해 뛰지 않는 한 그녀에게 매우 긴 시간을 줄 것이다 불명예스럽게 어린 독학 컴퓨터 인 Pascal Weinberger를 가지고있다 프로그램 제작자 그는 바르셀로나에서 Telefonica x '실험 총소리 실험실을 사용했습니다

그는 이제 8 월의 인텔리전스라는 자신의 신생 업체를 세우고 있습니다 규모 기계 학습 사용 및 마지막으로 Yan Talon 중 하나 인 에스토니아와 유럽에서 가장 잘 알려진 사업가는 창립자입니다 Skype와 Casa의 엔지니어이며 그는 Center for the Center의 창립자이기도합니다 캠브리지의 실존 적 위험에 대한 연구를 통해 어쨌든 시작합니다 우리가 마침내 합의한 질문을 토론 한 다음 우리는 결국 어디 론가 가고 에릭이 말했듯이 우리는 관중으로부터의 질문도 원한다고 말합니다

끝 그래서 당신은 당신이 원하는 무엇이든지 물어볼 자유가 있지만 첫 번째 질문은 우리는 섹터를 시작할 벤처 기업이나 기술 분야를 다룰 것입니다 비즈니스 혁신을 추진하기 위해 더 많은 것을 배우고 우선은 패널 아래로 빠르게 내려 가면 Eric도 포함됩니다 Reshma는 당신이 생각하기에 더 많은 혁신을 이끌 것입니다 신생 기업 또는 대형 기술이 될 것입니다 왜 내가 먼저 그 사실을 알고 있다는 것을 의미합니까? 우선 도전하고 우리는 보통 우리가 처음 체크인하는 것을보고 있습니다

신생 기업에 들어가기 전에 종자 라운드가 시작되며 도전 과제입니다 큰 녀석들과 싸우려면 실제로 그것은 단지 Gaffa가 아닙니다 작은 이야기를하기 전에 당신은 당신이 새로이 많은 것을 많이보고 있다는 것을 알고 있습니다 회사는 근육을 유연하게 움직이며, 나는 구글과 페이스 북의 제휴를 통해 우리는 많은 밀렵을 벤틀리가 그들을 밀렵하는 LinkedIn에서 발견하고 당신은 알지 못합니다 그 인수를하거나 일종의 더러운 권리를 싸우는 것입니다

도전하는 것은 당연히 우리가 신생 기업의 측면에 있으며 우리는 놀라운 기회 당신이 uipath 같은 회사를 데려 간다는 것을 나는 당신이 알고 있다고 생각한다 에릭은 저임금 일자리에 대해 많이 얘기했는데 위험에 처했습니다 나는 당신이 내가 길을 걷는 방법이 가장 빠르게 성장하는 것 중 하나라고 말했습니다 3 년 만에 일어난 일입니다 그렇기 때문에 신생 기술의 채택이 빠른 속도로 진행되고 있습니다

괜찮아요 괜찮아요 당신이 거기서 끝내서 다행이에요 파스칼은 대기업과 당신을 위해 탄생했습니다 Google 두뇌에서 근무하고 전화하기 전에 지금은 일하고 있습니다

시작 – 어떻게이 질문에 대답합니까? 협업이 지적되기 전에 지적했듯이 유연성과 혁신 속도로 인한 데이터 신생 기업이 보통 당신이 알고있는 큰 회사를 가질 여유가 있다고 고군분투하고 있지만 입양은 대기업 출신이다 대부분의 사람들이 기계 학습에 기반한 새로운 혁신을 알고 있기 때문입니다 대부분 데이터 중심의 혁신이며, 사실 대부분의 큰 회사는 흥미로운 데이터 세트를 보유하고 있으므로 이상적으로 생각합니다 그들 중 하나가 당신에게 기술을 가져다 줄 것을 알리는 협력적인 혁신은 대학에서 기업으로의 기술 이전 일 것입니다 고객과 마침내 큰 회사가 트렌드를 이해하고 그 다음에는 기술을 채택하는 것을 알고 있습니다

네, 저는 신생 기업입니다 왜냐하면 다양한 시대의 끝에 적어도 인간이 끝날 무렵에 취해진 혁신적인 아이디어를 알아야합니다 목격자들은 특히 남자들에게서 왔고 그들은 단지 인간들 일뿐입니다 시작을 밀어 내기 위해 충분히 동기가 부여 된 신생 기업 경계 나는 구글 등 회사가 시도하는 가장 큰 문제는 태클은 부활절과 같아요 당신은 어떤 종류의 사람들에게 동기를 부여합니까? Google을 떠나 자신의 시작을 시작하는 것과 같은 명확한 대안 오케이와 에릭 나는 일어날 수있는 시너지 또는 협업이 있다고 생각한다

그들 사이에는 각각 다른 강점과 약점이 있습니다 혁신은 신생 기업에서 점진적 혁신과 더 큰 회사에서 올 가능성이있는 혁신을 구현하고 종종 의약품에서 볼 수있는 것처럼 신생 기업들이 획기적인 발전을 할 때 한 그룹에서 다른 그룹으로 이전 마약을 쓴 다음 더 큰 회사가 마약을 복용 할 수 있습니다 더 효과적으로 지금 당신이 알 수있는 것들 중 하나 AI에서 학습하는 많은 기계의 기질이 또한 대량의 데이터는 Reshma가 빅 테크 기업은 똑똑한 알고리즘을 개발할 수있는 최고의 인재를 고용하고 있습니다 그래서 어느 정도까지 이것이 신생 기업에 막대한 장벽이된다는 것입니다 정말로 중요한 일을하려고한다면 규모에 맞게 행동해야합니다

기계 학습에서 당신은 여기서 많은 신생 기업을 보았습니다 저는 깊은 마음을 의미합니다 그 다음 단계로 확대하기를 원했기 때문에 분명히 Google에 매진되었습니다 신생 기업이 특정 규모에 도달했다가 매각해야 할 것인가? 다음 단계로 넘어가거나 실제로 이사회에서 경쟁 할 수 있습니다 그들이 Google에 많이 팔렸을 때 내가 많이 생각하지 않는 한 가지처럼 사람들은 AI 개발에서 나눌 수 있다는 것을 깨닫습니다

근본적으로 연구를하거나 연구를 적용 할 수 있습니다 기본적인 영역 조사와 결과의 일종을 취할 수 있습니다 그들과 깊은 마음은 처음부터 매우 명시 적으로 근본적인 지역 연구 및 밝혀진 한 단계는에서 제거 된 것 같습니다 그래서 상업적 수익은 내가 가려고하는 일종의 딜레마와 같습니다 약간의 큰 회사와 보조금을주고 찾거나 어떤 종류의 타협이 당신의 핵심 사명에 너무나 깊게 작용합니다 내 후자를 선택하기로 결정했다

우리가 신생 기업들과 함께보고있는 것들 중 하나이기 때문에 투자는 완전히 새로운 데이터를 만들어 내고 있다는 것을 의미합니다 이미 존재하는 큰 데이터 세트에 의존 당신은 예를 들어 도움이되는 예가 항상 도움이된다는 것을 압니다 당신은 매 분기마다 혈액 검사를 할 수 있습니다 개인적인 수준의 인간 존재가 결코 존재하지 않는다는 것을 알게되었습니다 인구 규모에 맞는 바로 지금 2 만명의 사람들이 있습니다

영국을 가로 질러 그것을 사용하여 당신이 알고있을 때 그것을 곱하면 100x 천 x는 극적이므로이 실시간 데이터가 모두 있음을 의미합니다 그건 새로운 것입니다 Unleashed이고, 많은 것을 알고 있습니다 우리 회사는 처음부터 시작하고 있으므로 그것에 의존해서 나는 우리가 데이터가 어디에 있는지를 알고 있다고 생각한다 우리는 회사의 다른 회사가 엄마와 팝 샵들이 디지털로 가게하는 것을 허용합니다

저는 Alibaba가하고있는 것과 같습니다 중국에서 다시 아날로그로부터 데이터가 존재하지 않는다는 것을 다시 한번 알았습니다 강력한 여러 가지 종류의 긴 꼬리가 있으므로 어떤 것이 있습니다 비전과 음성 인식과 같은 매우 큰 데이터 세트 회사는 유리할 것이고, 그렇지 않으면 경쟁하기가 어렵습니다 실제 규모를 지니고 있지만, 수십만 가지가 더 작다

그녀와 같은 신생 기업에서 다양한 크기의 기회를 발견했습니다 사실 모든 회사는 고객에 대한 독점 데이터를 가지고 있습니다 그들의 생산 과정은 그들이 일하는 방식과 기계 학습이 될 수 있습니다 그것에 적용되고 저 특정한 틈새 시장에있는 이점을 줄 것이다 그래서 서로 다른 크기의 기회와 작은 것들이 있다고 생각합니다 요셉 슘페터 (Joseph Schumpeter) 창업이 성장할 수 있고 더 큰 것을 대체 할 수 있다는이 생각 회사는 특정 문제를 해결하는 더 좋은 방법을 찾으면 무엇을 의미합니까? 너희들은 그래, 나는 실제로 차세대를 생각한다고 말할거야

우리가보고있는 기계 학습 기술은 오늘날 모든 것이 있습니다 대규모 중앙 집중식 데이터 세트는 이전에 설명 된 것과 동일합니다 누군가 특정 데이터를 수집 할 때 고유 한 액세스 또는 불공정 한 이점이 있습니다 보통 내가 생각하기에 큰 회사는 현재 틈새 시장 애플리케이션에 집중하지 않는 한 신생 기업에 대한 불공정 한 이점 기술을 배우는 기술의 다음 물결은 모두 같을 것이라고 생각합니다 가장 흥미로운 몇 가지 문제와 같은 소규모 데이터 세트 학습 우리가 죽음을 본다는 것은 엄청난 양의 데이터를 수집하는 데 정말로 비용이 많이 든다는 것입니다

세트 또는 큰 데이터 세트가 없다는 것을 특히 생각하고있다 그런 질병들과 나는 그들이 우리가 기대하고있는 것이라고 생각합니다 그래서 나는 기대하고 있습니다 당신과 더 많이 배우는 차세대 기계 기술 우리 인간이 순수하게보다는 추상적 인 것보다 더 많이 배우는 것을 알아라 작은 데이터 세트를 처리 할 수있는 상관 관계 기반 그리고 신생 회사들이 불공정 한 태도를 취할 것이라는 것을 알고 있다고 생각합니다

이점은 신생 회사에 대한 균형을 재확인 할 것입니다 일반적으로처럼 데이터 양과 데이터 사이에는 트레이드 오프가 있습니다 그것들이나 알고리즘의 영리함 나는 그것이 0이라는 것을 알았다 지금 바로 그게 바로 이전의 것보다 낫다는 제로 데이터를 나타냅니다 정확히 매우 큰 데이터 세트를 가지고있는 정확히 알파카 (Alpha)와 나는 핵심 포인트 인 des 또한 자기 감독 학습을 보거나 나를 위해 데이터 세트를 생성하지 않음 alphago가 0 인 핵심 포인트는 거기에 0 데이터가 없다는 것입니다

사람이 입력 한 데이터가 0이었습니다 재생하여 많은 양의 데이터를 생성했습니다 그 자체에 대비해서 나는 그런 종류의 접근은 정말 잘 할 수 있습니다 저는 특히 경제학자를 생각합니다 당신이 이전에 준 사례는 특히 모델링 시장을 원한다고 생각합니다

특정 투자 가능한 행동을 모델링하는 것 그것은 게임에서 모델링 될 수 있습니다 나는 그것들이 모든 종류의 어플리케이션이라고 생각합니다 우리는 똑똑한 접근 방식을 사용하는 것만으로 생각할 수 있다고 생각합니다 세 가지 카테고리 오늘날의 큰 성공의 대부분은 감독하에 있습니다 매우 큰 데이터 세트를 사용하는 학습 시스템 몇 가지 애플리케이션이 있습니다

당신이 게임의 규칙을 이해한다면 데이터는 문자 그대로 규칙을 적용 할 것입니다 더 추상적으로 그리고 당신은 당신의 자신의 데이터를 생성 할 수 있습니다 거기에 연구의 국경이 많이있는 세 번째 범주가 있습니다 인간이 당신처럼 조금 더 배우기 위해 기계를 얻으려고 노력하고 있습니다 개 또는 고양이를 인식하는 기계를 알고 있으면 수만 개를 표시합니다

그림 개 또는 고양이 만약 당신이 아이에게 3 살짜리 한 고양이를 보여 주면 아마 2 그들은 어떤 고양이가 더 이상 우리의 두뇌를 보여줄 필요가 없는지 이해합니다 하나 또는 두 개의 예제를 통해 학습 할 때 훨씬 정교하며 요즘 AI의 많은 주요 연구가 기계를 2 년 전 똑똑한 토론을하고있었습니다 오늘 일찍 다른 4 명의 저명한 경제학자와 함께 방 Mariana Merced Carter bill 제인 웨이 제프 삭스 케이트 레이어 가치 경제에서 정부의 역할에 대한 논쟁과 혁신 추진 특히 미국에서는 엄청난 혁신이 이루어 졌음을 분명히 알았습니다 DARPA와 미국 국립 보건원 등 정부가 가지고있는 것들 거대한 자원들 또한 엄청난 양의 데이터 세트를 가지고 있습니다 이 새로운 경제에서 혁신의 선구자로서 정부를 보아라

당신은 그 에릭에 대해 생각합니다 나는 큰 것 중 하나라고 생각하고 싶습니다 실망 스러웠고 아마도 이것은 이전 패널에서 나온 것입니다 미국의 R & D가 이전과 비교했을 때 반으로 줄었습니다 인터넷이 발명되었고 달 프로그램 및 기타 여러 가지 건강 혁신이 투자되어서 우리가 길을 되찾았습니다

미국뿐만 아니라 온 세상에 이익이 돌아왔다 지금은 그들이 최소한 좋은 기회가 있다고 생각합니다 30 년이나 50 년 또는 80 년 전 이었으므로 기회가 있었지만 기초 연구와 응용 연구의 차이 미국은 ARPANET이 된이 핸드 오프가 상당히 잘 해냈다 인터넷은 국방부에 의해 개발되었지만 궁극적으로 우리는 실리콘 밸리에있는 여러 회사에서 상업화 한 것을 알고 있습니다 보스턴 지역은 다른 곳에서 당신이 그 전환을 관리 할 수 ​​있다면 중요한 근본적인 돌파구가 아니라 상업적 가치를 지니고있다

그 혜택을 소비자와 우리 나머지는 mmm 다른 사람은 정부의 역할 실제로 당신이 더 넓은 의미에서 정부를 생각한다면 실제로 생각합니다 대학을 포함하여 특히 공립 대학교라고 생각합니다 그 공간에서의 혁신의 주요 동인 중 하나는 내가 창업자의 대부분을 의미한다는 것이다 누군가가 연구 논문을 어딘가에 출판 한 다음 사람들 그것의 응용을 읽고 이해하는 데 한 시간 일찍 읽어보십시오 핵심 기술을 가지고 시장에서 틈새 시장을 찾아 가서 그 사람을 때로는 상업화해라

대학은 그것을 시장에 가져 간다 나는 일반적으로 다음과 같이 말하고있다 아마도 정부는 이미 최고의 인큐베이터 중 일부입니다 우리가 저기에 있다는 것은 우리가 찾고있는 것보다 훨씬 좋은 일을 할 수 있다고 생각합니다 당신에게 중국을 알게하고 항상 모든 사람들에게 말을 건네는 것 그들이 정말로 잘 된 것이 무엇이든간에 어떤 데이터 세트를 만드는 것입니다

접근 할 수 있고 자신이 아는 사람이 자신의 감각으로 사람들을 나누는 지 확인하십시오 그것에 접근하고 그것을 혁신에 사용할 수 있고 나는 그것이 무엇인가라고 생각한다 특히 서구 세계에서 우리는 훨씬 더 잘 될 필요가 있습니다 소니아는 이미 다른 나라의 정부에서도 위대한 일을하고 있습니다 그들은 내가 당신이 알고있는 경우를 추측하고 나는 그것에 가깝지는 않지만 ODI와 열린 데이터 연구소와 나는 영국 런던이 특히 당신이 시도하는 것을 알고 있다고 생각한다

훨씬 더 많은 일을하고 그것의 기존 사례를 더 많이 찾으려고 노력하십시오 대학 연결의 종류에 관해서는 나는 당신이 확실히 말하고있는 것을 의미한다 우리가 절대적으로하는 더 많은 기술 투자를 배우는 더 많은 기계의 조건 당신이 밀접하게 졸업하거나 아직도 알고있는 대학을 졸업하는 사람들입니다 우리가 후원하는 대학이나 내가 생각하는 다른 분야에서 생각하는 대학 이미 10 년이나 몇 년 동안 밖에 있었으니 인력의 종류에 따라 재능의면에서 꽤 흥미 롭습니다 우리는 더 깊은 기술에 접근하고 있습니다

최신 기술을 아주 잘 알고 있습니다 최신 개발을 연구해라 나는 우리의 종류로 되돌아 갈 것이다 가파 주제 조금 우리도 볼 수 있습니다 구글과 페이스 북과의 경쟁에서 나는 보드 사이에서 그것을 본다 내 대학교 1 학년 때부터 2 학년 때 미안해

2 학년 때 대학에 다니지 못했던 학생들은 적절한 세계 권리와 그들은이 학생들을 뒤쫓아 가고 있습니다 이런 종류의 졸업생들도 졸업생이 될 수 있습니다 그 재능에 경쟁력이있어 좋아, 나는 관객 모두에게 퀴즈가있다 실제로 패널에있는 사람들도 회사가 가장 많은 것을 돌려주는 것입니다

2010 년과 2018 년 중반의 투자자는 Apple Google Amazon 넷플 릭스와 도미노의 피자 도미노 도미노 우리 모두가 도미노의 예에 간다 다른 누구라도 도미노의 의견에 동의하지 않으려 고합니다 어쩌면 그렇게되었을지도 모른다는 것이 요점이었습니다 매우 긍정적 인 방식으로 기술을 사용할 수있는 전통적인 회사 반환을 생성한다 그래서 사람들은 이것에 대해서 어떻게 생각 하는가? 벤처 기업이되어 큰 이익을 얻는 기술 회사가 될 것입니다 인공 지능에서 기계 학습을 사용할 수있는 기존 회사의 종류 나는 도미노와 함께 훌륭한 모범을 보였다고 생각합니다

전에 피자의 품질을보고 있었던 우리가 참여했던 프로젝트 그들은 그들을 보내고 그들은 실제로 컴퓨터를 사용하는 컴퓨터를 사용했습니다 피자를 보내기 전에 피자 사진을 찍는 비전 살라미가 모든 종류의 고르게 분포되어 있다는 것을 알고 있는지 확인하십시오 다른 것들과 나는 그게 일종의 재미 있다고 생각합니다 예를 들어 저에게는 정말 인상적인 사례였습니다

당신이 혁신적이고 사물이 될 거라는 것을 결코 알지 못했을 것입니다 그 토키 오카 현대 기술과 같은 기술을 응용하여 피자의 품질 인 정말 중요한 것 고객이 당신의 희망과 가치를 아는 것입니다 그렇게함으로써 정의 된 Nike는 비슷한 일을하는 또 다른 훌륭한 예입니다 나는 당신이 그것을 알고있는 회사들을 알고 있다고 생각합니다 그것은 가능하고 거의 항상 신생 업체와 협력하여 모두와 함께 완료된 프로젝트는 중소기업이 그것의 중요한 종류 인 그것을하기 위하여 취득되거나 일 된 만약 당신이 이미 수십 년이 걸렸다면 특정 비즈니스에서는 사실 내가 신생 기업에 투자 할 때 종종 내가 찾는 것은 창립자처럼 도메인 지식입니다

전에 알고있는 도메인에서 그렇다면 어떻게 미국에서 정확히 맞는 것인가? 기존 회사에서 가장 많이 존재한다고 생각하는 기회가 있습니다 기업이 성공하여 도미노는 예외이며 앞으로 갈 것입니다 앞에서 말했듯이 창조적 인 파괴의 물결을 보게됩니다 이러한 많은 회사에서 많은 시장 가치를 닦아 내면됩니다 왜냐하면 그들은 빨리 변할 수없는 정신력 때문입니다

충분히 그것의 부분을 생각한다 나는 그것의 고객을 생각한다 예, 당신은 내가 생각한다 그들에는 몇몇 자산 고객 관계 공급자 관계가있다 그러나 비즈니스 모델을 재고하고 이러한 변경을하는 것은 어렵습니다 또 하나의 여름 요점은 생산성 향상이 실제로 멋진 소비자는 당신이 거기에있어 워렌 버핏 (Warren Buffett)이 생산성 향상 기술이 그는 더 많은 산업을 가지고 있기 때문에 생산 능력을 초과하는 생산성으로 생산성이 낮아집니다 그것은 주주에게는 좋지 않은 경쟁을 의미합니다 약간의 갈등이 있으며 그것은 자본주의가 지향하는 방식입니다 당신이 기술의이 파도가 들어오고가는 것을 볼 수 있도록 일하십시오

어떤 승자와 패자가 되겠지만 모두가 앞으로 나올 수는 없다 알았어 나는이 방에서 우리 모두를보고 있다는 것을 알고 있다고 생각한다 우리의 기술과 모델링 및 알고리즘에 깊이 관여하지만 결국에는 하루 종일이 모든 회사가 인간에게 봉사하고 있으며 나는 그렇게 생각합니다 Domino는 재미있는 예제처럼 보이지만 성공할 것입니다

고객 중심의 예를 들어 우리는 최고의 품질을 계속 제공 할 것입니다 피자가 맞다 그리고 나는 대부분의 조직이 그 일을하지 않는다고 생각한다 나는 어제 아메리칸 항공에서 비디오를보고 있었는데, 그들의 비행은 한 번에 10 시간 씩 일종의 고객은 무슨 일이 일어나고 있는지, 그리고 당신이 할 수있는이 시대에 대한 실제 이야기를들을 수 있습니다 완전한 투명성을 확보해야합니다

그렇게하면 하루가 끝날 때까지 여전히 사용자가 있어야합니다 고객 중심의 관점에서 기술 또는 비 에릭에게 약속 한대로 이제는 첨단 기술 서비스를받을 수 있습니다 관객은 곧 있지만 패널에 마지막 질문이 하나있어서 기쁩니다 당신은 모두 질문에 답할 준비가되어 있습니다 그리고 당신은 반드시 생각할 필요가 없습니다

인공 지능을 학습하는 기계는 지난 몇 년 동안, 그리고 누군가가 갈 예정이라면 Google을 대신 할 수 있습니다 마이크로 소프트는 오 블록 체인 공간에서 오는 회사 일 수도 있습니다 그래, 내가 전에 생각했던 것처럼 내가 전에 생각했던 것처럼 신생 기업의 기본적인 장점은 비즈니스 변화와 같은 환경 변화에 적응하는 데 있습니다 기술 환경의 환경과 분명하지 않다는 것이 분명합니다 인터넷에서 주위에 온 것은 정말 크고 왜 정신적 인 변화가 있었는지 말하자면 멋진 회사와 같은 충분한 것들을위한 오프닝과 같았다

구글 등이 있지만 이제는 인터넷이 어떤면에서는 성숙한 것처럼 보입니다 얼마나 쉬운 지 또는 얼마나 많은 종류의 엿봄이 거기 물건을 혼란스럽게했는지는 분명하지 않다 그러나 블록 체인 (blockchain)은 그 점에서 희망의 광선과 같다고 생각할 수도 있습니다 누군가 테리 분야처럼 10 년이라는 말을하면 지금부터 2 년 후에 시작된 기업이며 Google 내 첫 번째 종류의 일은 간단 할 것입니다 우리는 몇 가지 질문을합니다

저는 믿습니다이 두 신사는 우리가 마이크는 자유롭게 어디에서 왔는지 말할 수 있습니다 에릭 당신은 우리가 어떻게 많은 괴롭히기를 볼 것인지를 묘사하는 위대한 일을합니다 다음 수십 년 동안 엄청난 기술적 실업이 아니 었습니다 당신이 전에 생각했던 것보다 훨씬 앞서 생각하는 것을 알기를 좋아합니다

Yan이 우리를 지키기 위해 보낸 시간은 우리가 생각하는 것입니까? 엄청난 기술적 실업을 보게 될지, 만약 그렇다면 어떻게해야 하는가? 그것에 관해서 나는 인공 지능을 언급 한 것처럼 거기에 있다고 생각한다 우리는 그것과는 거리가 멀지 만 어떤 시점에서는 일어날 것입니다 기계가 인간보다 더 잘되지 못하게 막는 물리 법칙은 없습니다 모든 일에 대해 그리고 그 일이 언제 일어날 지 인간은 말의 길로 갈 것입니다 나는 그 제목으로 if의 가치가별로 없다고 쓴 기사를 썼다

누군가 오늘 나에게 말을 줬어 그리고 너는 그들이 너에게 0을 지불 할 수 있다고 말했다 나는 실제로 말을 많이 사용하지 않는 것 같아서 우리가 그 말에 도달 할 것이라고 생각한다 무대는 이제 막대한 과학 기술 실업입니다 기계가 만들어내는 결정이 아닌 선택 사항은 우리가 현상금을 나누기로 결심 한 방법 그 세상에서 우리는 오늘날 우리보다 엄청나게 높은 생산성을 자랑합니다

부의 가난은 우리 경제에 의존 할 필요가 없습니다 우리는 모든 사람들이 우리는 부와 아마도 가장 중요한 교훈을 집중할 수 있습니다 내 책에서 내 연구에서 기술은 운명이 아니라는 것입니다 우리는 우리의 운명을 형성합니다 우리는 우리가 우리가 원하는 가치에 대해 매우 염려 할 필요가 있습니다 우리 기계에서의 사회와 우리 지도자들에게 무엇을 선출 할 것인가? 우리가 할 의사 결정과 우리가 세계로 나아갈 지 여부 공동 번영 또는 부의 집중적 인 집중 중 하나 다른 질문이 있는데이 숙녀분이 여기 와서 내가 너에게 여기서 다시와

미래의 사회 나는 지리적 질문의 일부를 만지고 싶다 일부 패널 위원이 제기 한 지리적 포인트 계정 빅 테크의 역할 신생 기업의 역할과 정부의 역할 세계의 어느 부분에서 앞으로 5 ~ 10 년 내에 생각하십니까? 혁신을 선도 할 것입니다 에스토니아 당신은이 질문에 대답하기를 원합니다 대량의 질문은 유감 스럽네요 세상의 어떤 부분이 나를 이끌어 갈지 모릅니다

에스토니아는 솜털 같은 비 통합적이다 흥미로운 장소이며 실제로이 회의에서 더 좋은 사람들입니다 그것에 대해 이야기하는 것보다 우리 인프라처럼 다시해야만하는 것 같아요 인터넷이 이미 도움을 많이 받았을 때 우리는 많은 도움을 받았습니다 이 긍정적 피드백 고리에 우리가 기본적으로 정부의 사람들 어떤 병원에서나 혁신적인 제품이 세상에 내가 조언을 구하는 등 지금 질문은 마지막으로가는 것입니다 그리고 나는 참치 타르 타르가 한 가지 큰 단점이 없다고 생각한다

130 만명의 사람들은 에스토니아처럼 생각하지 않는다 나는 돌이 있었다 그 무게보다 실제로 펀치하지만 불행히도 나는 생각하지 않는다 그 정도면 오래 갈 것입니다 에릭, 거기에는 두 가지가 있다고 생각합니다

내가 하나를 찾겠다는 특성은 교육받은 인구입니다 기술은 사람들로 하여금 추상적 인 방법과 국가에서 일하도록 요구할 것입니다 교육에 투자하는 사회들 중 두 번째는 포용하는 문화이다 미래에는 미국의 부품을 포함하여 너무 많은 사회가 있습니다 미래로부터 과거를 보호하려고 노력하고있는 영국은 되돌아 가려고합니다 석탄 광산이든 아니면 과거를 상상할 수 있든간에 역사상 성공한 적이없는 사람들이 더 좋거나 더 안전했다

사회는 언제나 미래를 포용하고 기꺼이 일을하고 새로운 기술을 받아들이는 옛 방식 중 일부를 포기하라 비즈니스 모델 새로운 일을하는 방식과 불행하게도 나를 괴롭히는 것은 우리의 정치 지도자 중 너무 많은 사람들이 낙관주의와 성공 그리고 당신이 그 문화적 태도를 올바른 교육은 사회를 선도하는 사람들이 될 수는 없지만 너도 에릭이 내가 기본적으로 라다 루디가 맞았다는 말을하고있어 산업 혁명은 임금을 억제하고 그래서 그렇게했다 진행 방식은 궁극적으로 배포 메커니즘이있는 경우에만 발생합니다 무슨 일이 있었는지 사람들이 싸우는 많은 혼란이있었습니다

당신이 볼 수있는 Charles Dickens를 읽었습니까? 조건 중 일부는 궁극적으로 대중에 투자하기로 결정했습니다 교육 우리는 사회 안전망을 만들었고 우리는 많은 규칙을 만들었습니다 반독점 법과 우리가 이러한 새로운 제도를 발명했을 때 나는 상승 조수가 모든 보트를 들어 올렸지 만 오늘날에도 대부분의 사람들은 오늘날 가장 가난한 사람들은 수백 년보다 훨씬 나아졌습니다 전에는 큰 어려움을 겪었지만 나는 이것을 강조하고 싶다 기술이 결정하고 자동으로 발생하는 것은 아닙니다

다른 사회는 다른 길을 가고있다 좋은 궤적에 있었고 그 다음에는 어떤 선택을했는지에 따라서 우리는 우리가 더 많은 부를 가질뿐만 아니라보다 많은 것을 공유하는 궤도에 올 수있게합니다 번영과 나는 그 토론이 두 가지 기회를 모두 이해하고 위험을 감수해야합니다 이것이 바로 아시아가 광범위하게 흥미로운 이유입니다 그러나 나는 우리가 중국과 인도에 대해 이야기하는 데 많은 시간을 소비한다는 것을 알고 있다고 생각합니다

일본은 정말로 매력적이라고 ​​생각합니다 미래의 선택은 인구 통계 학적 측면에서 매우 흥미 롭습니다 왜냐하면 그들은 인구가 많지 않기 때문에 사람들이 실제로 일을 제대로하고 회사의 일부를 볼 때 거기에 ml와 Tec의 국경의 일본에서 대규모 채택 우리 사업을 시작하기에 가장 빠르게 성장하는 곳 반 직관적 인 생각은 우리 모두가 중국과 인도에 집중하고 있다고 생각합니다 하지만 그들은 내가 생각하기에 그들이 당신이 많이 알고 있다고 생각합니다

디자인이나 사고에 의한 선택권은 귀하에게 직면하게됩니다 10 20 길을 내려가는 50 년을 아십시오 파스칼 예 어떤 것이 다시 노동 시장에 들어가는 노동 비용인지를 결정 짓는다 특히 혁신에 대한 큰 동인 중 하나를 아는 것 자동화 경제는 당신에게 어떤 비용도 들지 않으면 노동 비용입니다 인간에게 왜 기계를 만들기 위해 물건을 발명하는지 알게 될 것입니다

일본과 다른 시장을 알고있는 이유입니다 유럽 ​​특히 여기에 내가이 흥미로운 혁신 드라이버 공간이 너무 때로는 중국이 아니다 우리는 마지막으로 간단한 질문과 데이비드를 할 시간이 있다는 것을 알았습니다 궁금한 미래파의 의장이 되겠다 나는 에릭에게 언급 한 루 브릭에 가고 싶다 당신은 자신의 직업이 기계 학습에 취약 할지를 결정합니다 바스 트가 기계의 다양한 새로운 트렌드에 대한 루 브릭 인 방법 오늘은 아니지만 더 성공적으로 될 수있는 것들을 배우십시오

대량 데이터의 학습뿐만 아니라 학습과 같은 매우 특정한 것들 1 샷 또는 2 샷에서 전송 학습 향상 인공 감성 지능 또는 확률 론적 학습 같은 것들 Stuart Russell이 이전의 이야기에 대해 이야기하고있었습니다 분석하고 더 많은 일자리를 더 빨리 파기 루 브릭이 기계를보기 위해 특별히 설계되었으므로 감독 학습 시스템을 학습합니다 우리는 두 가지 새로운 루 브릭을 개발했습니다 기계 학습의 다른 범주에서는 내가 떨어 뜨린 총알 포인트 중 하나 매우 빨리 내가 ​​생각하지 못했던 다른 발명품들이 있다는 것입니다 아직 아무도 그 가능성이 상당히 변경됩니다 감독 학습 시스템 기계 학습 시스템은 실제로 양자 였다고 우리가 전에 가지고 있었던 것의 개선과 내가있을 것임을 나는 모른다

많은 사람들을 묘사하는 중요한 기술 목록이 우리가 6 개월이나 1 년 중 하나를 볼 수있을 때 그들에게 일하는 것은 우리가 볼 수 없을지도 모릅니다 10 년이나 20 년 동안 그 획기적인 것들을 나는 모른다 그러나 우리는 그것을 알고있다 현재 감독 학습 시스템은 시스템이 확산 될 경우 추가적인 혁신이 없다면 경제 전반에 걸친 모든 다른 직업에 영향을 미치지 만 나는 루 브릭을 개발하는이 방법론은 우리가 다른 신기술 중 일부를 더 잘 이해하고 싶습니다 우리가하고있는 로봇을 위해 우리가하고있는 다른 것들과 똑같은 것입니다

하나는 규칙 기반 시스템을위한 것이지만 귀하의 요점은 기술은 계속 진화 할 것이며 아직 수행되지 않은 작업에도 영향을 줄 것입니다 그 목록 그래서 경제학자는 안전하지만 다른 사람이 다른 사람이 모든 우리는 그곳에서 끝내야한다고 생각하지만 우리 모두에게 감사드립니다 패널리스트 당신

8 Fun Machine Learning Projects for Beginners | Machine Learning with Python Online Training

안녕하세요 여기 Barrett 이신 분은 제 화면을 볼 수 있습니다

내 말을들을 수있다 오늘 세션에서 감사드립니다 우리는 단지 그것에 대해 이야기하려고합니다 단지 여덟 가지 재미 또는 기계 학습 프로젝트 당신은 기계를 많이 가지고 초보자를위한 프로젝트를 특별히 배우고 있지만 나중에 이야기 할 것입니다 좋아, 언제든지 시작하는 것이 매우 중요합니다

기계 학습 프로젝트에서 일하기 시작하지만 비행 가능한 가장 좋은 방법으로이 문제가 발생합니다 두 가지 유스 케이스가 있습니다 맞아, 그 사람이 당신이 좋아하는 순간을 이해해야 만하는 것처럼 이해해야 할 첫 번째 일은 올바른 데이터 세트를 선택하는 것과 같습니다 그것이 어떤 기계 학습 알고리즘이 적합한지를 해독하거나 해독하는 것으로 이해하십시오 비즈니스 문제를 해결할 수있는 유형 또는 클래스 또는 비즈니스 유스 케이스와이 비즈니스 문제가 가능한 최상의 방법으로 이 부분은 기계 학습 초보자를위한 초보자를위한 것입니다

그래서 우리는 당신이 알맞은 크기의 데이터 세트를 얻었음을 알게되었습니다 전문가들에 의해 연구되고 그것에 대한 아무런 노출도 주어지지 않고 시작되기도합니다 당신이 가지고있는 것은 이것이 우리의 의제 인 것입니다 이것은 데이터가 설정하는 모든 데이터 유형입니다 우리는 검투사 게임 머니볼을 배우는 기계를 찾을 것입니다

우리의 주가가 신경망에 필기 자릿수를 읽도록 가르친다 비스타가 처음 엔 엔론 알고리즘을 쓰는 것 같아요 그리고 건강 관리를 향상 시키십시오 나는 당신이 한 가지에 모든 것을 할 것을 요구하는 것이 아니라 단지 예, 당신은 당신의 관심과 필요에 따라 그 중 하나를 고를 수 있습니다 좋습니다 그래서 여기에서 일어나는 것은 기계 학습 초보자를위한 것입니다

특히 높은 데이터 소스의 여러 라이브러리가 있습니다 양질의 데이터 세트는 UCI UCI를 대학으로 지정합니다 Arwen에서 캘리포니아와 당신은 데이터 도트 골드 또는 도트 u 당신이 소를 가지고있다 당신은 어디에서나 당신이 실시간 데이터 세트를 찾을 수 있도록 github을 가지고 있습니다 ml 프로젝트를 시작하기 전에 목표가 항상 있어야합니다

비즈니스 문제에 대한 심층적 인 이해는이 점을 이해하십시오 비즈니스 문제를 이해할 때까지 문제의 깊이있는 이해에 문제를 해결할 수 없다는 데이터 자체가 문제를 분명히 나타내는 데이터를 나타냅니다 데이터 이해에서 비즈니스 사용 키를 이해하고 데이터도 나타납니다 데이터 구조의 데이터 구조는 현재이 시대에 80 가지가 있습니다 우리가 가지고있는 모든 데이터의 90 %는 구조화되지 않은 구조이므로 구조 모든 기계 학습 알고리즘이 가장 적합한 데이터 세트의 최선을 다해 해결할 수있는 문제를 알고 있습니다

분석해야하는 모든 것, 그리고 어떤 데이터 세트를 공부할 때도 괜찮습니다 통계 환경으로 가라 그래, 그렇지 않다 나는 도서관을 가지고있다 파이썬이 있습니다

IB가 있습니다 데이터 세트가 있습니다 코드를 작성하고 실행하면됩니다 그런 식으로 작동하지 않는다면 환경을 사용하십시오 또는 심지어 그것이 옵션과 같은 것입니다

당신의 초점이 남아 있도록 통계 환경을 사용해야 만하는 의무 당신이 대답 할 때 찾고있는 질문에 비즈니스 사용 사례 및 통계를 이해하시기 바랍니다 환경은 매우 중요한 역할을하므로 데이터 세트에 관한 것입니다 주어진 테크닉에서 산만 해지는 대신에, 당신은 배워야한다는 것을 알고 있습니다 코드에서 구현하는 방법은 통계를 통해 나온다 내 첫 요점은 당신이 아주 분명해야한다는 것입니다

데이터가 나타내는 두 번째 문제에 대한 심층적 인 이해 하나는 기계 학습 데이터 집합을 서술 적으로 요약 해주십시오 통계는 매우 구체적입니다 추론 통계 및 설명적인 통계 당신은 설명적인 통계와 함께 가야합니다 데이터가 훨씬 더 효과적인 방법으로 설명 될 것입니다 데이터에서 관찰 한 모든 구조를 기록하고 모든 것을 제출하십시오

당신이 관측 한 관계, 그러면 당신은 빨리 알 수 있습니다 당신은 몇 가지 기계 학습 알고리즘의 상단에있는을 통해 실행할 수 있습니다 데이터 세트를 찾고 어떤 클래스가 더 나은 성능을 가지고 있는지 찾아라 의지를 수행하는 Al Gore 종교 간 알고리즘을 조정할 수 있습니다 사실 당신은 주어진 데이터가 모든 최신 정보를 모두 알고 있다고 말합니다 데이터 알고리즘 일부 특정 데이터 세트는 당신과 함께 갈 것입니다 다른 데이터 세트와 함께 사용되지 않는 알고리즘이므로 질산염이 있어야합니다

접근법이 계속 반복됩니다 그래야이 모든 것이 생겼을 때입니다 프로젝트를 시작하기 전에 이전에 언제 할 수 있습니까? 그 이론적 인 개념은 통계적 개념을 설명하는 통계는 철저히 알고 있습니다 이것은 정말 쉬울 것입니다 좋아요

우리는 이것들을 옹호하거나 권장하지 않습니다 프로젝트를 시작한 전문가에게는 조금 유용합니다 기계 학습 및 이러한 프로젝트가 완벽하게 다양한 유형의 조화로 도전 하나 올 수 있습니다 우리가 묻지 않는 이해하시기 바랍니다 당신은 이것 하나를 할 수 있지만, 만약 당신이 여러 가지의 완벽한 조화를 원한다면 기계 학습으로 일하면서 이것으로 갈 수있는 도전의 유형 엔지니어 또는 데이터 과학자 또는 건축가 예 알다시피 검투사를 배우는 많은 기계 여기서는 새로운 제품이 아닙니다 상자 밖에서 생각하는 것은 어떤 모델입니까? 강력하고 누락 된 데이터는 모델이 범주 형 미래를 처리 할 수 ​​있도록합니다

알고리즘 자체에 대한 통찰력을 얻고 있습니다 프로젝트는 이미 UCI 가축과 모든 곳에서 사용할 수 있습니다 그것이 완료되고 무엇이 정확성을 향상시키는지를 통해 언제나 달릴 수 있습니다 그들이 취한 강요는 뭔가를 조금 만들었습니다 귀족 건축에서 괜찮아요

비록 당신이 그것을 언급하고는 있지만 그것은 문제가되지 않습니다 당신이 그것을 할 때 데이터 시각화 또는 정확성에 약간의 변화가있다 알고리즘의 선택 또는 무엇이든간에 당신이 어떤 느낌이 든간에 무엇이든 만들 수 있습니다 그것이 완료되었는지 확인 그래, 이건 그냥 당신이 가지고있는이 과정이 아니에요 그 안에서 많은 과정을하지만 정확한 것은 당신이하는 첫 번째 일은 당신과 같습니다 먼저 도서관을 가져올 것입니다

첫 번째 부분에 라이브러리를 추가 한 다음 데이터 세트를 입력합니다 그 후에 당신의 정화 stats는 모든 결핍 한 가치가있는 무엇이 거기있다 모든 것이 찰흙에 언급 된 모든 것을 복제한다 괜찮아요 당신이 알고있는 null 값을 버리는 것은 매우 중요한 역할입니다 그걸로 대체하고없는 경우 누락 된 값이있는 경우 번호가 중복되면 더 이상 찾을 필요가 없습니다

데이터 세트를 준비 중이며 사전 처리 과정을 이해하십시오 데이터 세트는 시간의 80 %를 차지합니다 대부분의 시간 데이터는 70-80 %입니다 과학자가 기계 학습을하고 너의 것이 레온 클렌징과 데이터 세트를 준비하고 모델을 테스트하고 모델을 배치하거나 배치는 다시 도전이지만 모델 테스트 및 모델 교육 완벽한 데이터 세트를 가지고 있지만 데이터를 준비하는 것이 그리 어렵지 않습니다 세트는 정말 힘들 네요

그렇다면 프로세스가 뭔지 알고 싶다면 그래 라이브러리를 가져온 다음 레이어 데이터를 입력 한 다음 데이터를 정리합니다 그런 다음 엄지 손가락 규칙을 훈련하고 테스트하기 위해 데이터 세트를 분할합니다 80/20이 될 것입니다 데이터의 80 %는 훈련 20 테스트에 대한 퍼센트를 입력하면 거기에있는 EDA 탐색 데이터 분석이 수행됩니다 귀하의 기능 엔지니어링과 모든 것을 제공하고 모델 테스트를 훈련하십시오 그러면 다시 앙상블 기법이나 다른 것을 사용하게 될 것입니다

그리고 나서 당신은 모델이 잘 수행하고있는 정확성을 생각해낼 수 있습니다 당신이 다른 도전을하는 것은 괜찮습니다 질문은 채팅 창에서 ping을 주저하지 말고 아무 것도 없습니다 옳고 그른지 또는 어리석은 질문이라고 불리는 질문 계속 가셔서 언제든지 저에게 물어보십시오 시작하기 전에 기계 학습에 철저한 지 확인하십시오

알고리즘 감독되지 않은 감독과 당분간 보강 예 당신은 숨겨진 마코프 모델처럼 보강을 만질 필요가 없습니다 몬테카를로 기술은 회귀 분류와 함께 갈 수 있습니다 감독하고 나서 그럴듯하게 감독되지 않은 예를 보자 알고리즘은 거기서 무엇을하는지 이해해보십시오 그것은 회귀 분석에 의해 분류가 무엇인지 또는 무엇이 주요인지를 의미합니다

사용 사례와 클러스터링이 어떻게 이루어 졌는지 여기에 아주 큰 이야기가 있습니다 Satish 나는 이것을 한 시간 만에 완전히 알 수 있다고 설명 할 수 없다 특정 세션은 당신이하지 않은 프로젝트에만 초점을 맞추기위한 것입니다 프로세스는 괜찮습니다 그래서 여기서 일어나는 일은 스카이가 무엇인지 이해해야한다는 것입니다

Caitlin은 파이썬에서 기계 학습 라이브러리이며 이후에는 이러한 모든 기본 단계를 수행하면 데이터 세트를 선택하여 작업 할 수 있습니다 그래서 이것들은 모두 데이터 세트 가용성입니다 UCI Kangol과 당신이 가지고있는 데이터를 github에는 많은 저장소가 있으며 많은 저장소가 있습니다 온라인에서 오픈 소스로 사용할 수 있지만 이것을 사용할 수는 있지만 CA와 Kangol 세 번째 것은 Godot에서 데이터를 내보내거나 데이터를 밖으로 말할 수 있습니다 또한 다양한 형식으로 많은 데이터 세트를 가지고 있습니다

좋아요 어떤 게임이든 나는이 게임을 말하는 것이 아닙니다 Moneyball 괜찮은 게임 당신은 탐험 데이터 분석 냄비에 많은 것들을 가지고 탐색 데이터 분석 부분은 매우 명확하게 이해됩니다 스포츠 좋아요 그래서 당신이 알고있는 어떤 스포츠라도 될 수 있습니다 Bihar는 당신이 축구를 취할 수 크리켓을 취할 수 Moneyball 경기 재생 언급 축구 당신은 당신이 원하는 무엇이든지 가져 가라

그러나 스포츠는 매우 크다 미래의 엔지니어링 기법을 이용한 탐구 데이터 분석의 이점 및 데이터 엔지니어링 기술을 매우 잘 이해할 수 있습니다 그것에 대한 깊이있는 지식 그래, 스포츠가 X 인 것을 본다 데이터 시각화를위한 온 디맨드 (on demand) 100 %라면 20 ~ 30 명이 시각화로 갈 것이라고 말하고 싶습니다 인간 창작자가 더 좋기 때문에 10 ~ 20 % 엑셀보다 오히려 이미지를 이해하면 엑셀 시트 나 TSV CSV를 볼 수 있습니다

우리는 항상 더 큰 방식으로 데이터를 시각화하기를 원합니다 이 데이터 시각화가 많은 데이터 세트에서 도움이되도록 확인하십시오 그러나 스포츠에서는 특히 당신이 알고있는 박스 플롯을 그릴 수 있습니다 히스토그램 차트의 종류 원형 차트 막대 차트 모든 종류의 작업을 수행 할 수 있습니다 당신이 할 수있는 일을하고 싶습니다

당신은 그것을 시각화 할 수 있습니다 당신의 데이터가 당신이 알고있는 놀라운 방식은 첫 번째 장소는 언제 당신이 데이터가있는 데이터 집합을 이해하면 데이터에 많은 진실을 말해줍니다 그 아래에 많은 기본 개념이 있으므로 어떻게하면 모든 것을 탐색해야합니까? sprinty 데이터 분석 시각화 및 모든 것을 사용하여 탐색 할 수 있습니다 이 모든 작업을 수행하면 데이터 구조를 볼 수 있습니다 예 제발 오케이 예를 말해주세요

오, 그래요 스크립트 G는 Shivaji Crick sheet에 IPL t20의 모든 CSV 파일이 있습니다 국제 경기는 당신이 가지고있는 모든 것, 당신은이 데이터를 가지고 있습니다 저기서 CSV로 다운로드하면 쉼표로 구분 된 값을 의미합니다 그것은 당신이 비교할 수없는 시트를 능가하는 박차 같은 것이지만, 그렇습니다

그것은 TSV와 같은 것을 가지고있는 엑셀 시트와 상당히 비슷한 것입니다 탭 구분 값과 모든 것 그래서 당신은 당신이 알 수 있습니다 원하는 형식으로 데이터 세트를 다운로드하면 바로 진행할 수 있습니다 그걸 시각화하다 네가 가질 수 없다면 그 일을 할 수 없다 당신은 꼭 가지고 있어야하는 데이터 셋입니다 중간에 데이터를 다루는 동안 당신이 전에 당신 때문에 프로젝트를 시작하면 수학 이해가 철저히 이루어져야합니다

기계 학습 알고리즘과 Python이 3 가지가 있다면 할 수있다 프로젝트 네, 다른 데이터 배포 기술에 대해 이야기하는 것이 아닙니다 불꽃 같은 Hadoop이나 플라스크 또는 Django 또는 AWS의 배포 단계입니다 그것에 대해 이야기하면서 프로젝트로 시작하려면 매우 철저해야합니다 수학이없는 수학 수학 여기서 아무것도 할 수 없다

수학을 이해해야한다 확률 통계 선형 대수학 및 미적분 통계 다음으로 시작할 수 있습니다 당신의 기계는 Python으로 알고리즘을 학습 한 다음, 이해가 문제가 비즈니스 성명을 선택 후 당신이 좋아 시작할 수 있습니다 프레젠테이션 PPD가있을 것입니다이 세션의 녹음 내용은 다음과 같습니다 항상 당신과 공유 할 수 있습니다

그래야 Moneyball을 즐기고 나서 예측할 수 있습니다 주가이기 때문에 조금 시간이 걸리기 때문에 이것이 중요합니다 시리즈 이벤트 이것은 당신이 아는 어떤 것도 가지고 있지 않은 것과 같습니다 그것은 바로 여기에서 멈춘다 ok 주가 예측은 이것이 무언가이다 모든 데이터 과학자를위한 재미있는 사명 학습 프로젝트 아이디어 특히 금융 도메인에서 온 사람이라면 금융 도메인에서가 아니라 괜찮습니다 그렇습니다

특히 그렇습니다 금융 도메인 C 주식은 주가 예측 시스템과 같은 것입니다 회사의 실적에 대해 배우고 미래 주가를 예측합니다 당신은 미래 주가를 예측할 것입니다 주식 가격과 관련하여 많은 어려움을 겪고 있습니다 이 데이터는 매우 세분화되어 있으며 다른 유형의 변동성 가격 지표와 같은 데이터 글로벌 거시 경제 지표 펀더멘탈 지표와 모든 것을 포함 할 수 있습니다

괜찮아요 좋아,이게 전부 들리는거야? 좋아, 주식 시장 데이터로 작업하는 것에 대한 가장 큰 장점 중 하나는 금융 시장은 더 짧은 피드백 사이클을 가지고있다 우리의 데이터 과학을 사람들이 알고 있다는 사실을 확인하고 있습니다 새로운 데이터에 대한 예측 당신은 활발한 기초 위에서 새로운 데이터를 얻고 있습니다 그래서 주식 시장 데이터로 작업하기 시작하면 간단한 기계를 선택할 수 있습니다

예측과 같은 학습 문제 또는 6 개월 또는 6 개월 예측 너 같은 근본적인 지표를 기반으로 한 월간 가격 변동은 매년 분기 별 보고서를보고하는 조직의 분기 보고서 UCI 에서뿐만 아니라 많은 주식 시장 옵션을 다운로드하십시오 quand elle comm 당신은 qu a와 DL calm을 알고 있거나 당신은 quanto pn calm을가집니다 스캔들과 퀀텀 피아노는 완전히 당신이 아니에요 주로 금융 도메인에 초점을 맞 춥니 다 당신은 시계열이 어떻게 변하는지를 이해하는데 많은 장점을 많이 가지고 있습니다

좋아, 양적 가치 투자가된다 통계적 arbitraged 예보 그래서 이들은 모두 매우 유용합니다 그래서 당신은 주식 시장과 함께 매우 잘 이해하고 실무 지식을 가지고 있습니다 금융 시장은 피드백주기가 짧다는 데이터 이 툴과 튜토리얼을 모두 사용할 수 있습니다 파이썬은 투자에 대한 대출을 요청합니다 예, 데이터 분석에 사용할 수 있습니까? 모든 것과 내가 전에 Crandall quanto pian으로 말했듯이 근본적인 아카이브 이들은 Excel 형식으로 다운로드 할 수있는 많은 데이터 소스를 제공합니다

CSV TSV 형식은 원하는 형식으로 할 수 있습니다 그런 다음 신경망을 가르치십시오 예 이것은 제가 아닌 것과 같습니다 고급이라고 말하지만 기계 학습에 능숙해야합니다

개념을 신경 네트워크 깊숙히 파고 들기 전에 폭스의 미적분 부분에 대한 많은 지식이 필요합니다 그라디언트 강하 발견 최적화로 최적화에 대한 철저한 지식 역 전파와 편미분 미분을하는 법 미적분학 그래, 수학의 그 부분은 매우 강하다 당신은 신경 네트워크가 무엇인지 이해할 수 있습니다 뉴런은 활성화 기능을 수행합니다 당신은 그것을 시작할 수 있습니다

그러나 이것은 당신이 조금 알고있는 것처럼 보입니다 아주 좋아 좋아,이 깊은 학습과 신경 네트워크를 이해하시기 바랍니다 이미지 인식 자동 텍스트 생성 자체 구동에 중요한 역할을 함 당신이 알고있는 차들과 이것들로 일하기 시작하는 대신에 괜찮은 차들 간단하고 관리하기 쉬운 데이터 세트로 시작해야하는 영역 항상 현대의 국립 연구소입니다 em 목록에 파고 알아보십시오 기술의 일부 현대 국립 기술 연구소는 그들이 가지고있는 곳 1 만 5 천 개 정도의 자필 자국이 주위에있다

백 십 자리 괜찮아 그래서 제로 하나는 당신이 아는 많은 사람들이 썼습니다 필기체이므로 시스템이 제로인지 또는 제로인지를 식별해야합니다 2, 3, 4 번 괜찮아요 함께 일하기가 어렵습니다 초급자로서 평면 관계형 데이터를 통한 이미지 데이터가 필요합니다

항상 픽업하고 해결하기를 제안한다 그래서 당신은 이해하기 쉽고 저명한 데이터를 가지기에는 너무 작아서 적합하지 않습니다 초보자 친화적 인 PC 메모리에서 GPU를 사용할 필요가 없습니다 또는 Linux 또는 Windows와 정상적으로 할 수있는 모든 작업 okay 및 all 동시에 손으로 쓰는 숫자 인식이 당신에게 도전 할 것입니다 좋은 정확성을 얻기 쉽거나 아주 좋은 입장을 취하는 것

이런 종류의 사면 암묵은 정말로 당신이 어떻게 신경망은 무슨 일이 일어나고 있는지 말하고 레이어와 모든 것들이 괜찮 았기 때문에 튜토리얼이라는 것이 있습니다 미국 국립 표준 기술 연구소 (US Institute of Standard and Technology) 손으로 쓴 데이터의 이미지로 인해 70,000 개의 이미지가 만들어졌습니다 필기를 이해하거나 그것이 필적인지 여부를 식별하는 데 사용할 수 있습니다 하나 둘, 셋, 넷, 알았어, 알았어, 이거 엔론 조사 야 얼마나 많은지 모르겠다

당신의 사람들은 당신이 알고있는 것을 그려야합니다 회사 알았어 당신이 알고있는 회사 야 나는이 회사가 무너 졌다고 말했을 텐데 좋아, 그럼 여기서 일어나는 일은 당신이 이런 종류의 프로젝트에 올바른 데이터가 있는지 확인하십시오

추운 남자를 얻는 것은 나의 소년이다 그것은 나를 위해 코트를 잠시 마시고있는 okay 이리 알았어 이제 괜찮아 질 것 같아 좋아, 들어가기 전에 괜찮아 오,이 데이터 세트는 Udacity에서 사용 가능합니다

모든 코드가 있습니다 당신은 github 저장소에서 그것을 발견 할 수 있다는 것을 알고 있습니다 우리는 당신이 알고 있거나 기본적인 프로그래밍과 기본적인 것을 수학과 모든 것을 이해하면 괜찮아 질거야 이것은 기술적으로 사기 행위를 조사하는 것과 같습니다 사기의 조사는 데이터 세트의 배경이 좋아 보이는 것을 알 수 있습니다

Enron 전자 메일과 재무 데이터 세트를 사용하면 전자 메일임을 알 수 있습니다 Tran 당신은 그들의 재정적 인면에서 그들이 가진 대화가 Energy Commonity 인 Enron Corporation과 관련된 정보 미국에서 회사가되었고 실제로 2001 년 12 월에 파산했습니다 사기성 비즈니스 관행 그들은 많은 사기 행위를하고있었습니다 사업 관행에 대해서는 합법적이지 않습니다 우연히 회사의 붕괴가 일어났습니다

연방 에너지 규제위원회 (Federal Energy Regulatory Commission)는 거의 1 천 6 백만 달러 엔론 경영진이 보내고받은 이메일은 다음과 같습니다 2000 년에서 2002 년 사이에 알았어 그들은 모두 고위 간부 야 잘 모르겠다 하워드가 밝혀졌지만 당신은이 연방 에너지 규제를 압니다 연방 통신위원회 (Commission)가 160 만개 이상의 이메일을 보내고 받았다

Emraan 또는 Enron 회사의 최고 경영자를 2000 년부터 알고 있습니다 2002 년까지 그들은 불만이 많았습니다 이메일의 민감한 특성에 관한 수많은 불만들 후에 우연히 발견 된 것입니다 이메일로 보내지 만 이제는 일반인이 사용할 수있는 것은 단지 50 만 개입니다 당신이 거기에서 알고 있었던 나머지는 거대한 거대한 것이었다 조사가 진행 되었기 때문에 공개되지 않아야한다는 것을 알았습니다

계속해서 그들은 부츠를 제거하지 말라고 말했고 하루의 감각과 그들이 가지고있는 이메일의 성격을 고려한 후 모든 것을 제거했으며 현재 사용 가능한 데이터는 05 백만입니다 알았어 이메일과 재무 데이터 메타 데이터가 포함되어 있으면 메타 데이터가 있습니다 메타 데이터 메타 데이터 인 일부 데이터에 대한 정보 각 개별 재무 정보에서 수신 한 번호 그들의 급여를 포함하여 당신을 포함하여 스톡 옵션 모든 것이 개발되고 관심있는 사람을 식별 할 수있는 모델을 사용해보십시오

데이터를 통해 해당 데이터 내에서 그 사람의 관심사를 찾을 수 있습니다 조금은 괜찮 았어 일종의 관심사 또는 궁극적으로 오라클을 시도한 개인은 사기로 코드를 시도했습니다 Enron 수사의 범죄 활동으로 그들 또는 몇몇 최고 경영진은 괜찮습니다 그래서이 프로젝트는 주로 이 프로젝트의 목적은 컴퓨터 학습 모델을 만들어서 이해 관계가있는 다른 사람을 분리해라 그건 우리가 부르는 것이다

당신은 또한 당신이 선택할 수있는 텍스트를 포함 할 수 있습니다 이메일 또는 음식 내 분류자를 사용하는 대신 메타 데이터를 사용할 수 있습니다 이메일과 금융 정보를 사용할 필요가 없습니다 NLP에 들어가는 텍스트 네, NLP를하고 싶지 않다면 괜찮아요 메타 데이터 정보를 얼마나 많은 남성이 얼마나 많은 남성이 사라 졌는지 확인하십시오

그들이 당신이 알고있는 스톡 옵션이 무엇인지에 대한 급여가 무엇이라고 대답했습니다 거래되어서 이것들은 모두 메타 데이터이므로 재무 Enron 날짜에 대한 조사의 궁극적 인 목적은 정보이므로 어떤 종류의 사기 사례를 예측할 수 있는가? 사업에 안전하지 않은 관행은 물론 그렇습니다 우리는 거기에서 처벌받을 수 있고 무고한 사람들도있다 이 큰 음모 안에 괜찮아 그래서 여기서 기계 학습은 세상 끝을 더 이상 약속하지 말자

엔론에 대해 많이 말할 수는 있지만 처음부터 시작하겠습니다 당신은 당분간 당신이 비정상 탐지 소셜 네트워크를 할 수 있다는 것을 압니다 NLP 분석을 원할 경우 여기에서 데이터 세트를 찾을 수 있습니다 오른쪽에서 알고리즘을 처음부터 모든 것을 가지고 있지만 참조하십시오 github에는 약 50,000 또는 60,000 코드가 충분합니다 당신은 단지 복사 / 붙여 넣기를하지만, 그렇게하지 마십시오

언제나 참조 할 수 있지만 코드를 하드 코딩했는지 확인하십시오 당신이 철저한 지식을 가지고 있지 않는 한 코딩에 대해 붙여 넣기를 복사하지 마십시오 파이썬을 배우기 전에 항상 코딩을 할 때마다 항상 그렇듯이 당신은 아주 좋은 수학 능력을 가지고 있다면 당신은 아주 좋은 수학 능력을 가지고 기술을 배우고 기계 학습 알고리즘에 대한 사명을 이해하면 파이썬으로이 모든 것을 할 수 있고 항상 뭔가를 선택하십시오 선형 회귀와 마찬가지로 분류 나 회귀와 같이 매우 쉽습니다 또는 로지스틱 회귀 및 괜찮아요

그런 다음 연습을하게되면 전체 시스템이 어떻게 작동하는지 이해하게 될 것입니다 당신이 그것을 더 취할 수 있도록 작품은 로지스틱 회귀 또는 릿지입니다 정규화 매개 변수를 추가하거나 모든 작업을 수행하여 회귀 분석 기스로부터 얼마나 많은 노드가 나에게 알려주 었는지이 시점에서 의심의 여지가 있습니까? 추론을 의미하는 통계 확률 통계가 필요합니다 통계 및 기술 통계 확률 선형 대수학 미적분학 그것은 미적분학과 미적분학에 초보자가 아닙니다 데이터 과학 기계 학습 프로젝트의 초보자이므로 D로 초보자를위한 것이 아니라는 것을 이미 알고 있습니다

너는 네가 알고있는 것을 알았을 것이다 그들은 기계에서 학습하는 것이 아니라 기계에서 학습하는 것에 대해 이야기하고 있습니다 학습 – 괜 찮 아 요 광업 소셜 미디어 감정이 정말 좋다 실제로 여기서 일어나는 일이 소셜 데이터는 우선 많은 장점을 가지고 있습니다 많은 통찰력을 얻을 수 있습니다 당신은 그것이 긍정적이든 혹은 중립적이든 당신이 얻는 제품을 출시합니다

귀하의 제품에 대한 리뷰를 얻을 수 있으며 75 %의 사회적 데이터 분석을 사용하지 않는 마케팅 판매 회사는 오랜 시간 동안 성공 했어 그게 바로 그거야 소셜 데이터는 마케팅에 정보를 제공하는 것이 아니라 사업 괜찮아요 당신의 고객 목소리가 있다면 당신은 정말로 나쁜 고객의 목소리를 통찰력을 얻을 수 없습니다 좋아, 그럼 어떻게하면 검은 브랜드와 모든 것을 구축 할 수 있겠는가? 이 데이터에서 발견 된 것은 비길 데없는 것과 같습니다 내역 및 실시간 대화 데이터 제품과 모든 것, 아마존 하나의 제품이 내가 원하는 것을 얻고 싶다면 2,500 개의 리뷰가있다

그것으로부터 통찰력을 얻으면 당신은 2,500 자 또는 코멘트를 읽을 수 없으며 통찰력을 얻습니다 맞아, 그렇게 할 수있는 시스템이 필요해 네가 가면 네가 할 수있어 이 소셜 미디어 감정 분석을 우리는 그것을 감정 분석이라고 부릅니다 일반적으로 이것을 기반으로 사용할 수 있으므로 기술적으로 미국에 본사를 둔 1,000 명이 넘는 마케팅 디렉터가 있습니다

주제 1에 제공된 입력과 비슷하다고 말합니다 이 조사 결과가 사업에 실제로 큰 영향을 줄 수 있음을 알고 있다고 생각하십시오 아무것도 될 수있는 페이스 북이 되라 무엇이든지 완벽한 장소가 될 수있다 당신이 알고있는 변화하는 통찰력을 발견하기 위해 고객은 전체 비즈니스에서 많이 바뀔 수 있습니다

전체 비즈니스 모듈이 알 수있는 단 하나의 비즈니스가 변경 될 것입니다 어느 정도까지는 API에 대해 걱정할 필요가 없습니다 Kaggle과 CA에서 사용할 수있는 데이터 세트 머리를 잡거나 잡아라 당신은 트위터를 어떻게 만들어야하는지 이해할 수있다 API와 연결하는 방법을 쌍으로 한 다음 계속 해보 라

오, 내가 문제를 일으킬거야 이 짹짹의 증오 발언을 감지하는 것과 같다는 것을 이해하십시오 당신은 증오 연설을 식별하고 탐지해야하는 트위터 계정을 가지고 있습니다 트윗이 적개심이나 증오심 표현을 포함하고 있다고 말하면 아마도 일종의 인종 차별 주의자입니다 공격 또는 그와 관련된 여하 한 감정을 트윗의 인종 차별적 공격이거나 정상적인 것입니다

정상 분류가 가능하므로 라벨이있는 트윗 샘플을 사용할 수 있습니다 너는 인종 차별적 인 공격을 알고 너는 인종 차별적이지 않은 짹짹이있어 귀하의 목표를 공격 여부 주어진 데이터 세트에 레이블을 예측하는 것입니다 인종 차별적 인 트위터이거나 그냥 평범한 대접이야 내가 너에게주는 한 가지 예일 뿐이야 당신이 짹짹 사전 처리 및 청소해야 할 예를 많이 가지고 심지어 NLP는 많은 사전 처리 기술과 깨끗한 클렌징을 가지고 있습니다

기술을 사용하면 트위터 핸들을 제거해야합니다 해시 태그와 모든 것이 우리에게 좋지 않은 모든 것을 아는 속도 구두점 번호 제거 특수 문자 제거하기 NLP의 특정 절차가 있다는 것을 알고 있습니다 요소 이해 당신은 모든 것을 이해할 수 있도록 중지 단어를 제거합니다 이 데이터 세트에 들어가기 전에이 데이터 세트는 정말 좋은 데이터 세트입니다 전체 비즈니스 모듈 또는 제품 또는 프로세스에 대한 이해 사업을 위해 건강 관리 의료 AI 장소에 오셔야합니다

매우 중요한 역할을 할 수 있습니다 그러면 빠르게 변화 할 것입니다 내가 건강 관리라고 말할 때 의사를 대신 할 수는 없다는 것을 이해하십시오 어느 시점에서든 의사를 대신 할 것은 아닙니다 전문가의 조언 그것은 예를 들어 나는 모든 사람들로부터 제게 조언을 듣고 배웠습니다

그게 그 것입니다 그것이 차트 채팅 봇을 만들 수 있다고해도됩니다 심지어 당신이 많은 이미지 인식 개체를 가지고 마약 발견을 구축하십시오 이 세포가 암 세포인지 아닌지를 확인하는 인식 EMR 전자 의료 기록은 핵심 건강 관리를 잘 알고 있습니다 기계 학습에 사용할 수있는 데이터 세트를 선택할 수 있습니까? 당신이 원하는 것을 원하는대로 여기에 괜찮을거야 그래, 그것은 예방 치료 진단 영역도 보험 부문이 있는지 여부 사람이 청구 할 것인지 또는이 사람이 알고 있는지 여부를 알 수 있는지 여부 이 특별한 질병을 갖게되면 건강을 얻는 기회는 무엇입니까? 데이터 또는 정부가 목표로하는 가장 큰 데이터 인 정부 인구에 걸쳐 건강 증진을 위해 인간 사망률을 확인하십시오

보험 공급자 및 지불 데이터 생명 과학 데이터가 많은 경우 심지어 MRI 데이터가 필요한 경우에도 특정 데이터를 가질 수 있습니다 Alzheimer neuroimaging 당신은 생명 과학을위한 많은 데이터 세트를 가지고 있습니다 건강 관리 및 의약품을 제공하므로 이러한 데이터 세트를 사용하여 가장 큰 AI를 사용하여 의료 AI가 어떻게 진행하고 있는지 여기에서 이해할 수있는 중요한 사항과 데이터 세트가 많을 까 걱정합니다 병원 데이터 세트 고객 오크가있는 데이터 세트 미안 여기에 많은 질문을합니다 진행하기 전에 의심의 여지가 있습니다

기술을 향상시키기위한 목적으로 만 사용하면 도움이 될 것입니다 귀하의 이력서의 상세한 포트폴리오를 준비하십시오 프로젝트 및 당신은 당신의 기술을 잘 나타낼 수 있습니다 이 프로젝트가 당신에게 유망한 방법을 제공하는 데이터 과학을 이해하시기 바랍니다 어떤 분야에서든 당신의 경력을 시작할 수 있습니다

그것을 적용하여 데이터 과학뿐만 아니라 당신은 이러한 프로젝트가 도움이 될 프로젝트를 얻을 당신은 이력서에 당신의 기술을 보여줄 수 있습니다 그리고 요즘에는 채용 담당자가 평가합니다 그의 작품으로 잠재적 인 후보자와 제발 강조하지 말아주세요 인증은 귀하가 제품을 구입할 때 강조 할 필요가없는 것과 같습니다 인증은 가능한 한 많이 시도하고 표시해야합니다 당신이 무엇을했는지 말하기보다는 당신이 한 일을 보여주십시오

모든 일이 다 끝났어도 문제가되지 않는다 너는 그것들을 보여줄 것이 아무것도 없다 그것이 대부분의 사람들이하는 곳이다 투쟁과 밖으로 놓치지 마라 당신은 전에 여러 프로젝트에서 일했을지도 모른다

그러나 만약 당신이 그것을 지구상에서 어떻게 설명하기 쉽도록 만들 수 없으면 누군가 당신이 할 수있는 것이 무엇인지 알기 때문에 설명 할 수 있어야합니다 너는 이걸 통해 너가 한 모든 일들을 그들에게 보여줘야 해 프로 시저이 알고리즘이 메트릭 만 다음 사람들이 이해할 것입니다 이 모든 것이 프로젝트가 시간을 생각하는 데 도움이 될 것입니다 당신은 당신의 교육 세션처럼 당신이이 프로젝트에 쏟을 것입니다 훈련을 받으면 연습하는 데 더 많은 시간을 할애 할 수 있습니다

더 나은 데이터 과학자를 훈련 시키면 괜찮을거야 우리가 당신과 함께 당신을 제공했는지와 같이 다른 도메인의 문제는 시작해야합니다 엄청난 양의 데이터를 사용하여 아주 작게 시작한 다음 대용량의 데이터이므로 대용량 데이터 세트가 포함되어 있으므로 큰 알았어 괜찮아 괜찮아 나는 초급 수준의 중급 수준과 고급 수준의 초급 수준에 해당합니다

이는 데이터 집합으로 구성됩니다 작업하기가 쉽고 복잡하지 않아도됩니다 CNN 시간과 같은 아키텍처는 기본 회귀 분석을 사용하여 해결할 수 있습니다 분류 알고리즘을 사용하면 이러한 데이터 세트가 충분히 열려있어 너가 달릴 때 github에 도움을 너는 온라인 과정을 또는 또한 가지고 갈 수 있는다 교실 세션도 어떻게 작동하는지 이해하고 확인할 수 있습니다 동영상을 많이 재생하면 초급부터 시작할 수 있습니다

당신이 이미 중급 수준 인 단어들을 다 읽은 적이 있다면이 경우 레벨은 본질적으로 더 도전적인 데이터 세트로 구성됩니다 이 데이터 세트가 1 ~ 2 일 안에 작동하지 않아야합니다 완전한 일을 이해하기 위해 일주일이나 열흘 동안 중대 규모의 데이터 세트가 포함되어있어 심각한 패턴이 필요합니다 인식 기술 미래의 엔지니어링은 깊이에 있어야합니다 제한이 없습니다 ML 기술의 사용은이 기계 학습하에있는 모든 것이 될 수 있습니다 괜찮아요

일단 인턴쉽을 받으면 그걸 했어요 그리고 모든 것은 경험을 그때 당신은 고급 수준으로 이동 이것은 실제로 신경과 같은 고급 주제를 이해하는 사람들에게 가장 적합합니다 네트워크 심층 학습 추천 시스템 당신은이 숨겨진 마르코프를 안다 모델 및이 모든 데이터 세트는 고차원 데이터 세트로 많이 포함되어 있습니다 미래의 데이터 또한이 또한이 사실을 알기 위해 많은 시간이 필요합니다

창의력을 좋게 만들고 창조성이 거의 없다는 것을 이해하십시오 약간의 데이터 과학자들이 자신의 작업과 인용문을 함께 가져와야합니다 그걸로 알았어 네가 이걸 알거나 몇 가지 예를 든 것 같아 초급 수준의 데이터 집합에 대해 이야기했는데 시간 시리즈를 알고 있습니다

그것은 당신이 그것을 취할 수있는 주식 예측이고 만약 당신이 중급 수준으로 이미이 튜터와 함께 센터에 들어갔습니다 감정적 인 분류 당신이 알고있는 이것과 함께 고급 이동하려는 경우 신경 네트워크 종류의 일 이니 그것은 당신의 선택이지만 시작입니다 천천히 다음 얼굴에 이동 데이터 과학 아닙니다 하룻밤 사이에 할 수없는 스프린트 녀석이거나 아니면 한 달 넘어야한다 점차적으로 향상되면 정기적 인 연구를하면 3-6 개월이 걸립니다 좋은 질문이나 질문이 있으시면 알려주세요 나는 그 대답에 기쁜 것보다 더 행복 할 것이다

좋아, 더 이상 질문하지 않아도된다 몇 가지 질문이 있으시면 언제든지 우편으로 보내주십시오 뭔가 잘못 됐어 항상 괜찮아 질거야 감사합니다

즐거움에 동참 해 주셔서 감사합니다 언제든지 이메일이나 알림을받을 수 있습니다 당신은 어떤 질문을 주저하지 말고 이메일에 도달하려고 시도하십시오 우리는 어떤 방식 으로든 당신을 돕기 위해 기꺼이 돕겠습니다