SAS Demo | Deep Learning with Python (DLPy) and SAS Viya for Computer Vision

안녕하세요, 저는 Susan Kahler이고 인공 지능과 기계 학습에 대한 책임이 있습니다 SAS에서

이 비디오에서는 SAS Deep Learning Python API 또는 DLPy에 대해 간략하게 설명합니다 이 시리즈는 DLPy가 지원하는 최신 컴퓨터 비전 모델에 중점을 둘 것입니다 DLPy를 통해 Python에 익숙한 데이터 과학자는 딥 러닝을 활용할 수 있습니다 SAS Viya의 컴퓨터 비전 기능 설명의 링크를 사용하여 주제로 직접 이동하십시오

첫 번째 섹션에서는 DLPy와 함께 Functional API를 활용하여 빌드하는 방법을 살펴 봅니다 ResNet 모델을 포함한 기능 추출을위한 복잡한 모델 다음으로 축구를 추적하기 위해 U-Net 모델을 사용하여 이미지 세분화를 수행하는 방법을 볼 수 있습니다 선수 그런 다음 DLPY가 VGG16을 백본으로 사용하여 Faster R-CNN을 사용하여 객체 감지를 지원하는 방법을 살펴 보겠습니다 회로망

스위칭 기어, DLPy가 어떻게 MobileNet 및 ShuffleNet을 지원하고 성능을 비교하는지 살펴 보겠습니다 ResNet50 모델이있는 모델 중 하나입니다 마지막으로 훈련과 추론 모두에서 멀티 태스킹 학습이 수행되는 방법을 살펴 보겠습니다 제품 권장 사항에 대해서는 소매 도메인에서 추론을 위해 Python 용 이벤트 스트림 처리 패키지 인 SAS ESPPy를 사용합니다 DLPy에는 Python 3 이상 및 SAS Viya 34가 필요합니다

또한 Analytics 전송을위한 SAS 스크립팅 래퍼 또는 SWAT 패키지가 필요합니다 DLPy는 python-dlpy 디렉토리의 SAS 소프트웨어 용 GitHub에서 사용할 수 있습니다 이 비디오에 실린 Jupyter 노트북도 해당 위치에 있습니다 DLPy의 최신 컴퓨터 비전 기능에 대해 배우고 즐기시기 바랍니다 스스로를 위해

안녕하세요, 저는 SAS의 데이터 과학자 인 Wenyu이며 딥 러닝과 컴퓨터에 중점을 둡니다 비전 API 이 비디오에서는 고급 Python API, Python을 사용한 SAS Deep Learning 또는 (DLPy) 이 비디오의 목적은 SAS에서 기능적 API를 활용하는 방법을 보여주는 것입니다 복잡한 모델을 만들기위한 DLPy 보다 유연한 방법을 제공하기 때문에 Functional API에 중점을두고 있습니다

Keras Functional API와 매우 유사한 복잡한 모델을 구현하십시오 Sequential API는 공유 모델을 만들 수 없다는 점에서 제한적입니다 레이어 또는 여러 입력 또는 출력이 있습니다 입력 및 출력이 여러 개인 모델이 Functional API를 사용하는 좋은 예입니다 간단한 6 단계로 SAS DLPy를 사용하여 모델을 생성 해 봅시다

텐서를 반환하는 Input ()에 의해 두 개의 텐서 (회색조 이미지와 RGB 이미지)를 정의합니다 목적 그런 다음 그레이 스케일 이미지가 두 개의 컨볼 루션 브랜치에 공급됩니다 이 모델에는 또 다른 입력 컬러 이미지가 있습니다 그런 다음 이미지의 특징을 추출하기 위해 컨벌루션 연산이 사용됩니다

세 개의 텐서가 연결되고 OutputLayer_1에서 분류를 계산하는 데 사용됩니다 손실 또한 모델은 OutputLayer_2를 통해 감독됩니다 그런 다음 정의 된 입력 텐서 및 출력 텐서를 Model () 함수에 전달합니다 마지막으로 compile ()을 호출하여 네트워크를 컴파일합니다

여기서는 모델의 요약과 네트워크 그래프를 보여줍니다 레이어 연결 이 다음 모델에서는 ResNet 유사 모델을 작성하는 방법을 고려하십시오 이 작업에서는 돌고래 또는 기린을 포함하는지 여부에 따라 이미지를 분류합니다 먼저 각각의 직후에 배치 정규화를 채택하는 회선 블록을 정의합니다

회선 다음으로, 나머지 블록 내에서 바로 가기 연결을 사용하여 입력 기능을 연결합니다 컨볼 루션의 출력에 4 개의 누적 잔차 블록이 있으며 네트워크는 전체 평균 풀링으로 끝납니다 다음은 4 개의 잔차 블록이 순차적으로 누적되고 전체 평균이 표시되는 모델의 그래프입니다 풀링

모델이 빌드되면 ImageTable API에 의해 데이터가로드되고 모델을 학습 할 수 있습니다 순차적 인 모델처럼 SAS DLPy API를 사용하면 사전 훈련 된 여러 출력 모델을보다 쉽게 ​​정의 할 수 있습니다 기능 추출기로서의 백본 다음 경우에는 가중치와 함께 ResNet18 모델을로드합니다 다음으로로드 된 모델을 기능 모델로 변환하고 원래 작업 계층을 삭제합니다 이를 위해 to_functional_model ()을 사용하고 stop_layers를 지정합니다

그래프 이동을 중지하는 레이어 즉, stop_layers와 stop_layers가 뒤에 오는 모든 레이어가 제거됩니다 기능적 모델 그런 다음 OutputLayer와 Keypoints Layer라는 두 가지 새로운 작업 계층을 추가합니다 그래프 하단에서 새로 추가 된 두 개의 레이어를 볼 수 있습니다

이 비디오에서는 DLPy를 사용하여 여러 입력 및 출력을 가진 모델을 만든 다음 ResNet과 유사한 모델이며 마지막으로 순차 모델을 기능 모델로 변환했습니다 시청 해 주셔서 감사합니다 안녕하세요, 저는 Maggie Du이고 SAS의 기계 학습 개발자이며 딥 러닝 및 컴퓨터 비전 API 이 비디오에서는 DLPy라고하는 SAS 고급 딥 러닝 Python API를 사용하여 게임에서 축구 선수를 추적하는 이미지 분할 문제를 해결하는 방법을 보여줍니다 각 플레이어에 대한 통계를 제공합니다

코치에 의한 경기 후 분석과 같은 여러 목적으로 통계를 사용할 수 있습니다 팬들에게 증강 게임 시청 경험을 제공합니다 이미지 분할은 이미지를 의미 적으로 의미있는 부분으로 분할하려고 시도합니다 각 부분을 사전 정의 된 레이블 중 하나로 분류합니다 따라서 픽셀 수준에서 이미지를 이해하는 새로운 방법입니다

예를 들어이 이미지에는 개, 고양이 및 배경의 세 가지 클래스가 있습니다 따라서 우리는 각 픽셀에 어떤 클래스가 속하는지를 나타내는 특정 색상을 부여합니다 전반적으로 각 객체의 정확한 경계를 얻을 수 있습니다 시작하자 필요한 모듈을로드 한 후 데이터 세트를로드하려고합니다

우리는 축구 경기의 이미지를 예로 들어 170 이미지가 포함 된 모두 256 * 256으로 조정되었습니다 다음은 원시 이미지와 해당 주석의 시각화입니다 이미지에는 축구 선수, 축구 공 및 배경의 세 가지 다른 객체가 있습니다 따라서 주석 이미지에는 세 가지 색상이 포함됩니다 그런 다음 데이터 세트를 학습 데이터, 유효성 검사 데이터 및 테스트 데이터로 무작위로 나눕니다

다음으로 SAS DLPy를 사용하여 U-Net 모델을 구축하려고합니다 이 대칭 모델은 인코딩과 디코딩의 두 부분으로 볼 수 있습니다 기능 크기가 가장 작은 레이어 인 병목 현상 레이어로 분할됩니다 인코딩 부분에서 풀링 레이어를 사용하여 다운 샘플링을 수행하여 기능을 추출합니다 디코딩에서 입력 컨볼 루션 레이어를 사용하여 입력 이미지에서 업 샘플링 학습 된 정보를 재구성하는 부분

또한 텐서를 직접 결합하는 4 개의 연결 레이어를 모델에 추가했습니다 두 개의 다른 레이어에서 이전의 특정 정보를 쉽게 상속받을 수 있습니다 층 SAS DLPy는 사전 정의 된 U-Net 모델을로드하는 기능을 제공합니다 인코딩을위한 4 개의 풀링 계층 및 디코딩을위한 4 개의 전치 컨볼 루션 계층

축구 경기 데이터 모델에는 3 천 4 백만 개가 넘는 매개 변수가 포함되어 있습니다 SAS DLPy API를 사용하여 계층별로 고유 한 U-Net 모델을 만들 수도 있습니다 병목 현상 레이어의 크기 및 컨볼 루션 수와 같은 기능을 쉽게 결정할 수 있습니다 두 풀링 레이어 사이에 원하는 레이어 아키텍처가 구축되면 교육 데이터를 사용하여 모델을 교육하고 유효성을 검사 할 수 있습니다 검증 데이터 사용

교육이 완료된 후 테스트 데이터를 사용하여 모델의 성능을 테스트 할 수 있습니다 새로운 이미지를 수행합니다 스코어링 메트릭을 확인하거나 예측을 직접 시각화 할 수 있습니다 이 예에서 잘못된 분류 비율은 056 %로 65,536 픽셀 중 약 360 픽셀 만 잘못 레이블이 지정됩니다 두 번째 방법은 간단합니다

여기에 원시 이미지, 주석 및 예측을 나란히 놓고 모델의 성능을 확인하기 위해 모든 것을 쉽게 비교할 수 있습니다 첫 번째 열에는 원시 이미지가 표시되고 가운데 열에는 실제 이미지가 표시됩니다 세 번째 열의 이미지는 예측에서 얻습니다 마지막 두 열 사이에는 약간의 차이 만 있습니다 이는 U-Net 모델을 의미합니다

이 데이터에 매우 효과적이었습니다 이 비디오에서는 SAS DLPy를 사용하여 이미지 세분화 모델을 신속하게 구축하고 이 모델에 대한 교육 및 스코어링 방법 SAS DLPy에는 훨씬 더 많은 기능이 포함되어 있으므로 향후 사용 사례 시청 해 주셔서 감사합니다! 안녕하세요, 제 이름은 Xindian Long이고 컴퓨터 비전을위한 딥 러닝 알고리즘을 개발합니다 YOLO, Faster R-CNN, Mask R-CNN 등 SAS Deep Learning for Python (또는 DLPy)은 고급 Python과 함께 제공됩니다 사용자가 이러한 기능을 사용할 수 있도록하는 API

현재 그림 1과 같이 주로 물체 감지 방법에는 두 가지 유형이 있습니다 첫 번째 방법은 단일 단계 방법입니다 이 유형의 방법에서 경계 상자 지역화 및 객체 분류는 하나에서 수행됩니다 단계 YOLO, SSD와 같은 알고리즘이이 범주에 속합니다

두 번째 방법은 다단계 방법입니다 여기에는 두 가지 단계가 있습니다 첫 번째 단계에서 지역 제안 네트워크는 관심있는 직사각형 지역을 찾는 것입니다 객체를 포함 할 가능성이 높은 (또는 ROI) 두 번째 단계에서는 추가 회귀 및 분류를 수행하여 실제로 해당 지역에 개체가 있으며, 그렇다면 범주와 정확한 위치 그리고 모양입니다 Faster R-CNN, R-FCN과 같은 알고리즘이이 범주에 속합니다

첫 번째 범주의 알고리즘은 일반적으로 두 번째 범주의 알고리즘보다 빠릅니다 예를 들어 실시간 성능이 필요한 응용 프로그램이있는 경우 YOLO는 아마도 좋은 선택 Faster R-CNN과 같은 두 번째 범주의 알고리즘은 일반적으로 더 정확합니다 “Faster R-CNN”이라는 이름이 언급 된 다른 알고리즘보다 더 빠르게 실행되는 것은 아닙니다 이리

R-CNN 및 Fast R-CNN 알고리즘보다 이전 버전보다 훨씬 빠릅니다 그림 2는 앵커 박스의 중요한 개념을 보여줍니다 그들은 객체에 사용됩니다 YOLO와 Faster R-CNN의 탐지 알고리즘 이 개념을 이해하는 것이 매우 중요합니다 앵커 상자는 이미지의 여러 위치에있는 추상 상자이며 일반적으로 그리드 패턴

사전 정의 된 모양으로 사전 설정된 개수의 경계 상자를 예측하는 데 사용됩니다 각 위치에서 앵커 상자는 예측 된 위치의 초기 값으로 사용됩니다 모양에 따라 개체 크기 / 모양에 대한 사전 지식이 포함되어 있습니다 그림 2의 이미지에서이 한 위치에 많은 앵커 박스가 있음을 알 수 있습니다 상자마다 모양이 다른 물체를 감지합니다

예를 들어이 이미지에서 빨간색 앵커 상자는 사람을 감지하는 상자입니다 물론 최종적으로 감지 된 물체 모양은 원래 물체와 약간 다를 수 있습니다 알고리즘이 최적화하기 때문에 앵커 박스의 모양 그림 3은 Faster R-CNN 네트워크 아키텍처를 보여줍니다 DLPy를 사용하면 계층별로 구축 할 필요가 없습니다 알고리즘 이해를 돕기 위해 그것에 대해 이야기하고 있습니다

그것의 첫 번째 부분은 백본 네트워크입니다 백본 네트워크에는 일반적으로 많은 회선 레이어와 풀링 레이어가 포함되어 있습니다 입력 이미지에서 기능 맵을 추출합니다 널리 사용되는 백본 네트워크에는 VGG16, ShuffleNet 또는 ResNet 등이 있습니다 응용 프로그램 및 요구 사항에 따라 선택할 수 있습니다

지역 제안 네트워크는 백본 네트워크를 따릅니다 지역 제안 네트워크는 많은 제안 된 관심 지역을 출력합니다 개체를 포함 할 가능성이 높은 창입니다 지역 제안 네트워크는 지역 이전에 두 개의 특수한 컨볼 루션 레이어로 구성됩니다 제안서 계층

지역 제안서 레이어에 대해 사용자가 지정해야하는 중요한 매개 변수는 앵커 박스는 제안 될 수있는 형태의 범위를 대략 결정합니다 그 후에는 ROI 풀링 레이어입니다 관심 영역을 백본 네트워크 출력 인 페더 맵에 매핑합니다 창 내부의 픽셀 값을 추출하고 다른 크기의 하위 이미지를 형성합니다 ROI 풀링 레이어는 모든 하위 이미지의 크기를 같은 크기로 조정합니다

이것은 기능 맵의 모든 채널에 대해 수행됩니다 따라서 각 ROI마다 3D 데이터 배열을 얻습니다이를 텐서라고합니다 ROI 풀링 레이어의 출력에는 제안 된 각 영역마다 하나씩 많은 텐서가 포함됩니다 관심의

네트워크의 마지막 부분은 각 텐서와 ROI에서 독립적으로 작동하며 하나를 만듭니다 각 ROI에 대한 결정 세트 먼저, 두 개의 완전 연결된 레이어가 있으며 분류간에 공유됩니다 그리고 경계 상자 회귀 그런 다음 분류 헤더와 경계 상자 회귀 헤더가 있으며 각 헤더 앞에 하나의 완전히 연결된 레이어로 각각

우리 시스템에서 분류 헤더와 바운딩 박스 회귀 헤더는 모두 FastRCNN 계층에서 구현됩니다 빠른 R-CNN 네트워크 아키텍처에 대한 간략한 소개와 알고리즘의 방법 공장 이제 노트북을 볼 수 있습니다 먼저 CAS 서버에 연결합니다 조치 세트를로드하십시오

그리고 CAS 라이브러리를 빌드하십시오 그런 다음 DLPy 함수를 호출하여 앞에서 설명한 모델 아키텍처를 빌드해야합니다 Faster_RCNN 그런 다음 데이터 세트를로드하고 훈련 세트와 데이터 세트로 분할합니다 여기서 데이터 셋과 라벨을 그래픽으로 시각화하고 이미지와 경계를 볼 수 있습니다 상자 및 레이블

네트워크 교육을 위해 사전 훈련 된 가중치를로드하고 대상 열을 정의한 다음 가중치를 계속 최적화하려면 fit 함수를 호출하십시오 그런 다음 predict 함수를 호출하여 객체 위치와 범주를 예측할 수 있습니다 마지막으로 탐지 결과를 시각화 할 수 있습니다 이미지에서 감지 된 개체 주위에 상자가 그려져 있음을 알 수 있습니다 객체 카테고리 자신감뿐만 아니라 보여줍니다

이미지에서 감지 된 양을보십시오 이것이 데모의 끝입니다 DLPy와이 예제를 사용해보십시오 시청 해 주셔서 감사합니다! 안녕하세요, Guixian Lin입니다 저는 SAS의 컴퓨터 비전 딥 러닝 개발자입니다

여기에 DLPy로 알려진 SAS 고급 딥 러닝 Python API를 사용하여 가벼우면서도 강력한 컨볼 루션 뉴럴 네트워크를 쉽게 구축하고 훈련 할 수 있습니다 이미지 분류 문제에 대한 (또는 CNN) 이 예에서는 의류를 분류합니다 VGG16 및 ResNet50과 같은 인기있는 CNN은 이미지 분류에 널리 사용되었습니다 뛰어난 정확성을위한 작업 그러나 자원이 제한된 모바일 및 에지 장치의 경우 이러한 CNN은 종종 너무 유용하게 큰

얼굴 인식 및 자율 주행 차와 같은 실시간 애플리케이션에는 충분히 빠르지 않습니다 다음으로 세 가지 효율적인 CNN 인 MobilenetV1, ShufflenetV1 및 MobileNetV2를 소개합니다 이 인기 CNN보다 훨씬 작지만 정확도는 비슷합니다 CNN의 핵심 구성 요소는 컨볼 루션 레이어라는 것을 알고 있습니다 효율적인 MobileNet 및 ShuffleNet의 기본 아이디어는 표준 컨볼 루션을 대체하는 것입니다

가벼운 컨볼 루션 그림 21은 표준 컨벌루션과 깊이 분리형의 차이점을 보여줍니다 깊이 컨벌루션과 포인트 컨벌루션으로 구성된 컨벌루션 맨 윗줄에서 각 블록은 컨벌루션 필터를 나타내며 총 c2 필터가 있습니다

각 컨볼 루션 필터는 공간 정보를 필터링하고 채널 정보를 결합합니다 한 번의 단계로 입력 기능 이를 위해서는 각 컨볼 루션 필터의 깊이가 입력 피처의 깊이와 일치해야합니다 여기서 깊이는 c1입니다 레이어가 깊어 질수록 피쳐 맵의 깊이가 더 커지는 경우가 종종 있습니다

이러한 인기있는 CNN이 매우 큰 이유입니다 두 번째 행은 깊이 컨벌루션이 공간 정보를 채널별로 필터링 함을 보여줍니다 즉, 각 깊이 방향 컨볼 루션의 깊이는 레이어의 깊이에 관계없이 항상 1입니다 입니다 깊이 컨볼 루션은 입력 채널 만 필터링하므로 출력을 결합해야합니다

유용한 기능을 생성하는 기능 이것은 커널과의 표준 컨볼 루션 인 포인트 컨벌루션으로 수행 할 수 있습니다 1 회 1 회 표준 컨벌루션을 깊이 컨벌루션으로 교체 한 다음 점별 컨볼 루션에서 유사한 방식으로 피쳐와 패턴을 추출 할 수 있지만 모델 크기는 극적으로 감소했습니다 그림 22는 그룹 컨볼 루션을 설명합니다

채널을 여러 그룹으로 나누고 각각의 표준 컨볼 루션을 적용합니다 그룹 예를 들어 g 개의 그룹이있는 경우 모델 크기를 1 / g의 차수로 줄일 수 있습니다 그림 23은 MobileNetV1, ResNet50, ShuffleNetV1 및 MobileNetV2의 빌딩 블록을 보여줍니다

MobileNetV1의 경우 아키텍처는 VGG와 유사합니다 VGG의 표준 컨벌루션을 경량 깊이 컨볼 루션으로 대체합니다 포인트 컨벌루션이 뒤 따른다 ResNet은 종종 ResNet 블록으로 인해 VGG보다 성능이 우수하기 때문에 ShuffleNetV1 MobileNetV2는이 아이디어를 빌 렸습니다 둘 다 ResNet 블록의 표준 컨벌루션을 깊이 컨벌루션으로 대체하여 모델 크기

ShuffleNetV1은 포인트 컨벌루션을 그룹 컨볼 루션으로 대체하여 모델 크기 이제 경량 컨볼 루션이 더 작은 모델을 빌드하는 데 유용하다는 것을 이해합니다 및 ShuffleNet 다음으로 의류 소매 제품 데이터에 대한 성능을 보여 드리겠습니다 먼저 데이터 세트를로드하고 일부 이미지를 표시합니다

여기에는 6 개의 수업이 있으며 약 2,100 개의 이미지가 있습니다 다음으로, 우리는 훈련과 평가를 위해 무작위로 데이터를 훈련과 테스트로 나누었습니다 다른 CNN SAS DLPy는 다양한 사전 구축 네트워크 아키텍처를 제공합니다 매우 효과적입니다

여기서는 CNN을 구축하는 데 사용할 것입니다 MobileNetV1 아키텍처의 경우 다음과 같은 기본 매개 변수를 지정합니다 클래스 수 입력 이미지를 정규화하기위한 오프셋 및 스케일로 분류 될 수있다 또한 임의 뒤집기와 자르기를 사용하여 입력 이미지를 보강합니다 MobileNetV1 모델에는 축소 매개 변수 인 alpha가있어 출력 채널 수 옵티 마이저를 설정 한 후 모델을 학습 할 준비가되었습니다

훈련 로그는 많은 유용한 정보를 알려줍니다 여기에서 모델 매개 변수의 수가 8 백만임을 알 수 있습니다 대상에는 6 개의 클래스가 있습니다 훈련 손실과 오류로 반복 기록을 그릴 수 있습니다

16 오류 후 훈련 오류가 감소하고 수렴 함을 보여줍니다 최종 교육 오류는 약 54 %입니다 다음으로 테스트 데이터에서 모델 성능을 평가합니다 MobileNetV1 모델의 오류율은 5

3 %입니다 좋아요! 올바른 예측과 잘못된 예측을 통해 모델을 확인함으로써, 모델이 패턴을 배우고 합리적인 예측을한다는 것을 알 수 있습니다 다음으로 비슷한 단계를 따라 다른 CNN (ShuffleNetV1, MobileNetV2, 및 ResNet50 자세한 내용은 노트북을 참조하십시오 이 모델의 테스트 오류는 다음과 같이 요약됩니다

탁자 이 3 가지 경량 모델은 일반 모델보다 매개 변수가 훨씬 적습니다 ResNet50은이 소매 데이터의 정확성을 향상시킵니다 이 비디오에서 SAS DLPy를 사용하면 이러한 작은 크기를 빠르게 구축하고 훈련 할 수 있습니다 그러나 효율적인 CNN

앞으로의 작업에 이러한 모델을 적용 해 볼 수 있기를 바랍니다 시청 해 주셔서 감사합니다! 안녕하세요 제 이름은 웨인 톰슨입니다 저는 SAS의 데이터 과학자이며 딥 러닝과 함께 일할 수있는 특권이 있습니다 R & D 팀 컴퓨터 용 Python 및 DLPy 및 SAS Viya를 사용한 딥 러닝을위한 비디오 시리즈입니다

시력 이 특정 비디오에서는 패션에 태그를 지정하기 위해 멀티 태스킹 딥 러닝 모델을 훈련하고 싶습니다 품목 이제 기계 학습에서 종종 이미지를 가져 와서 레이블을 지정하고 단일 이미지를 만듭니다 옷의 종류를 분류하는 것과 같이지도 학습을 통해 하나의 작업을 분류합니다 드레스인가요? 티셔츠인가요? 벨트인가요? 그리고 색상과 같은 다른 의미 속성이 있고 입력 데이터에 레이블을 지정하면 색상을 분류하기 위해 회선 신경망과 같은 다른 것을 훈련하십시오

종종 고려해야 할 장점과 장점 중 하나는 단일 모델을 훈련시키는 것입니다 이 두 가지 과제를 동시에 동시에 배우는 것입니다 이를 유용한 정보를 활용하는 패러다임 인 멀티 태스킹 학습이라고합니다 전체적인 일반화를 향상시키기 위해 여러 관련 작업에서 즉, 모델이 더 잘 맞는 경향이 있습니다 한 작업에 대한 정보가 다른 작업을 예측하는 데 신뢰성을 부여 할 수 있기 때문에 좋습니다

단일 모델이 있으므로 두 모델을 사용하는 것보다 배포가 훨씬 쉽습니다 또는 더 많은 모델 따라서보다 쉽게 ​​관리하고 생산할 수 있습니다 시작하기 전에 멀티 태스킹 학습은 매우 강력합니다 자율 주행 차와 같은 많은 응용 분야에 사용됩니다

영어로 된 문서 모음이 있다고 가정 해 봅시다 프랑스어, 독일어 및 이탈리아어로 번역하고 싶습니다 거기에는 동시에 훈련하는 세 가지 작업이 있습니다 이제이 예에서는 이미 CAS 세션을 시작했습니다 DLPy를로드했으며 CAS 서버에 연결했습니다

가장 먼저 보여 드리고 싶은 것은 디스크에서 이미지를로드하고로드하는 방법입니다 이 예제에서는 하위 디렉토리에서 읽은 후 레이블을 재귀 적으로 가져옵니다 따라서 실제로 디스크에서 데이터를로드하여 메모리로 읽어들입니다 서브 디렉토리에서 레이블을 당기십시오 다음으로하는 일은 간단한 빈도 수이며 데이터가 상당히 균형을 이루고 있음을 알 수 있습니다 모든 작업에서 332 개에서 386 개의 관측치가 있습니다

이런 종류의 균형을 가질 필요는 없으며 분명히 콜스 나 메이 시즈, 우리는 더 많은 관측을 할 것이지만 이것은 간단한 데모입니다 이제 멀티 태스킹 딥 러닝을 수행하는 데있어 가장 까다로운 부분 중 하나는 작업 레이블 자체 이제 내가하고있는 첫 번째 일은 Pandas 데이터 프레임을 사용하고 getDummies를 단순히 이진 지표를 만듭니다 딥 러닝 패키지에는 정말 강력한 것이 있습니다 SAS 함수 컴파일러입니다

이를 사용하여 자신의 손실 함수를 찾을 수 있습니다 여기에서는 계산 된 vars를 사용하여 조건부로 추가 작업을 조건부로 정의하고 있습니다 여성, 의복의 조화는 무엇이며, 나는 그것을 다른 사람들과 다시 합류합니다 데이터 여기 간단한 머리를보고 몇 가지 관찰 만 살펴보면 이제 9 개의 총 작업이 동시에 진행되고 있음을 알 수 있습니다

여자를위한 것이 든 아니든 자, 여기에 이미지를 보여 드리는 예가 있습니다 그들이 어떻게 생겼는지 딥 러닝의 많은 머신 러닝 문제와 마찬가지로 데이터 크기도 조정합니다 200×200으로 설정하고 CAS 서버의 모든 작업자 노드에서 데이터를 섞습니다 여기서 20 %의 샘플을 작성하고 있음을 명심하십시오 이것은 홀드 아웃 데이터 세트 테스트이며, 나머지 80 %의 데이터를 사용하여 학습합니다

에 모델 이제이 시점에서 직접 비순환 그래픽 인 기본 아키텍처를 정의하겠습니다 네트워크를 위해 그리고 DL Plot을 사용하여이를 수행하고 있습니다 입력 레이어, 컨볼 루션 레이어, 배치 규범 풀링 및 밀집 레이어가 있습니다

그러나이 네트워크 플롯을 보면 기본적으로 하나의 아키텍처가 있음을 알 수 있습니다 그리고 그 아키텍처는 우리가 시도하는 모든 결과 작업과 공유됩니다 예측하십시오 모든 작업에 대해 동일한 네트워크를 가질 필요는 없습니다 이것은 기본 예이며 여기에서 실제로 잘 작동합니다 예측하려는 각 작업에 대해 서로 다른 네트워크 아키텍처를 가질 수 있습니다

아키텍처를 정의한 후 모델을 학습하려고합니다 이 예에서는 운동량과 같은 매우 기본적인 최적화 방법을 사용하고 있습니다 60 개의 EPICS를하고 있는데 훈련 옵션을 정의하고 싶습니다 이제 partition이 0 인 곳을 사용하고 있습니다 그것은 훈련 데이터의 80 % 만 가져올 것입니다

모델 무게 등 나중에 득점을 할 수 있습니다 GPU에서도 이것을 훈련하고 있습니다 딥 러닝의 곱셈 특성으로 인해 네트워크를 더 빨리 훈련시킬 수 있습니다 모델과 더 빠른 실험

다양한 최적화 방법을 시도해보고 궁극적으로 최상의 모델을 얻을 수 있습니다 더 빠르게 여기에 약간의 출력이 있지만, 내가 시도한 것은 이것을 이것에 요약합니다 반복 플롯 우리가 60 번의 EPICS를했다는 것을 기억하십시오 약 13 ~ 14 개의 EPICS 어딘가에서 쇠퇴와 상실과 시대를보고 있습니다

모델이 실제로 안정화 된 것 같습니다 나는 실제로 그것을 자랑스럽게 생각합니다 좋아 보인다 테스트 데이터와 비교하여 먼저 확인하겠습니다 이 모델은 훈련을 위해 개발되었습니다 이제 데이터의 20 %를 부분 집합 화하겠습니다

훈련에서 절약 한 모델 가중치를 사용하여 해당 데이터의 점수를 매길 것입니다 그리고 여기서 볼 수 있듯이 모든 작업에 대해 평균 제곱 오차가 매우 낮습니다 좀 더 세분화되고 실제로 혼동 행렬과 같은 것을보고 모델이 테스트 데이터에 얼마나 잘 맞는지 그런데이 예측값 p_는 테스트 데이터에 대한 예측값을 나타냅니다 내가 훈련 한 모델에 나는 판다에서 약간의 일을한다 파이썬을 DLPy와 똑바로 혼합하는 것이 좋습니다

그리고 9 가지 작업 각각에 대한 분류 행렬 인 혼동 행렬을 얻습니다 행은 실제 값을 나타내고 열은 예상 값을 나타냅니다 벗어난 대각선에서, 우리가 잘못한 곳입니다 여기에 검은 색은 4 개, 파란색은 4 개, 빨간색은 1 개, 우리는 다른 수업을 살펴보고 정말 잘하고 있습니다 마지막으로, SAS에서 딥 러닝의 비밀 소스 조각 중 하나는 ASTORE

여기에서 실제로 모델을 이진 파일에 저장하여 배치 스코어링을 수행 할 수 있습니다 스트리밍 분석을 사용하여 점수를 매기거나 다른 모델과의 작업을 위해 모델을 ONNX로 가져 오기 PyTorch 및 TensorFlow와 같은 패키지 여기에이 작업을 완료하고 모델을 저장했으며 다음 비디오에서는 실제로 스트리밍 분석을 사용하여이 모델의 점수를 매기는 방법을 살펴 보겠습니다 결론적으로, 멀티 태스킹 딥 러닝은 실제로 여러 개를보고 예측할 수있게합니다 동시에 작업

DLPy를 사용하면 간단합니다 다음 비디오에서 to기를 기대합니다 Python 및 SAS Viya Computer Vision Series를 사용한 딥 러닝에 오신 것을 환영합니다 제 이름은 웨인 톰슨입니다 저는 SAS의 데이터 과학자이며 SAS Deep과 함께 일합니다

학습 R & D 팀 이 비디오에서는 DLPy의 자매 인 ESPPy를 사용하여 멀티 태스킹을하고 싶습니다 딥 러닝 모델 이제 이미 멀티 태스킹 딥 러닝 모델을 훈련했습니다 이미지를 모아서 9 가지 작업을 예측하고 동시에 수행 할 수있는 모델을 개발했습니다

이 예제에서하고 싶은 것은 ESPPy를 사용하는 것입니다 또한 SAS 이벤트 스트림 처리 창에 연결할 수 있습니다 프로젝트를 구축하고 창과 상호 작용하며 모델을 배포합니다 SAS Event Stream Processing은 정말 멋집니다 여기에는 클러스터링에서 시계열 분석에 이르는 여러 스트리밍 작업이 포함됩니다

감정 분석 또는 공동 필터링과 같은 작업도 수행 할 수 있습니다 하지만이 데모에서는 이미지 처리 창과 온라인 창을 사용하겠습니다 딥 러닝 멀티 태스킹 모델을 배포 할 수 있습니다 이제 가장 먼저해야 할 일은 실제로 프로젝트를 만드는 것입니다 이 멀티 태스크를 호출하고 실제로이 셀을 실행하겠습니다

그리고 다음으로하고 싶은 것은 프로세스 흐름이나 관로 실제로 이미지를 읽으려면 소스 창이 필요합니다 우리가 일부 교육에서했던 것처럼 모델을 훈련 할 때마다 일반적으로 이미지 따라서 점수를 매길 때 20에서 20으로 크기를 조정하고 이미지 처리를 사용하겠습니다 그렇게하는 창

다음은 모델을 가져와야한다는 것입니다 모델을 학습하고 ASTORE로 저장 했으므로 모델 리더가 있습니다 그것을 읽을 수있는 창 그리고 실시간으로 점수를 생성하는 득점 창이 있습니다 그리고 보면, 프로젝트는 다음과 같습니다

나는 데이터를 읽고 이미지를 표준화하고 점수를 생성합니다 그런 다음 실제로 프로젝트를로드하고 몇 개의 출력 테이블을 설정하겠습니다 여기에 쓸 것입니다 이제 첫 번째 노트북을 사용하여 실제로 노트북을 정의하기 때문에 별도의 노트북이 있습니다 ESP 프로젝트

이 책에서는 간단히 게시하고 점수 매기기 프로세스를 시작하겠습니다 그래서 저는 팔고이 모든 것을 실행합니다 실제로 모델의 점수를 매 깁니다 다시 여기로 돌아가서 이제 이벤트 스트림 처리 엔진을 사용하겠습니다 득점

실제로 예측 확률과 함께 태그가 지정되고 라벨이 지정된 이미지가 표시되는 것을 볼 수 있습니다 작동하는 예제를 제공하는 작은 세트입니다 수면 시간은 03입니다 이벤트 스트림 처리 엔진은 실제로 초당 최대 50 프레임을 수행 할 수 있습니다

시원한 이 데모에서는 이미 멀티 태스킹 학습을 위해 개발 된 모델을 검색을 용이하게하기 위해 스트리밍 분석을 사용하여 배포 할 수있었습니다 콜이나 메이시 같은 사람 교육용 DLPy와 함께 ESPPy를 사용하면 실제로 쉽게 수행 할 수 있습니다

How is deep learning different than machine vision?

인공 지능과 심층 학습 기술은 거의 혁명을 일으키고있다 공장 자동화를 포함한 모든 단일 산업

깊은 학습은 제조 자동화를 돕고 있습니다 이전에는 불가능했던 방식으로 그러나 깊은 학습이 확실히 가능성을 넓히는 동안 공장 바닥에, 운영자가 여전히 많이 사용하는 도구 중 하나입니다 그들의 회사가 향상시키는 것을 도울 수있다 제품 품질 및 처리량 전통적인 규칙 기반 머신 비전 일관성있게 안정적으로 수행 잘 제조 된 부품 및 탁월한 제품 고정밀 응용 프로그램에서

여기에는 지침, 신분증, 측정, 검사, 이 모든 것은 극도로 실행될 수있다 빠른 속도와 높은 정확도 이러한 종류의 머신 비전은 변수가 잘 이해하고 있습니다 파트가 존재하거나 부재합니까? 구성 요소가 올바른 모양과 크기입니까? 로봇은 그 부분을 어디에 두어야합니까? 이러한 작업은 어셈블리에 쉽게 배치 할 수 있습니다 통제 된 환경의 선

그러나 일이 그렇게 명확하지 않을 때 어떻게됩니까? 예를 들어,이 패키지들을 가져 가라 눈물을 검사하는 프로그램을 어떻게 디자인합니까? 또는 긁힘? 두 가지 결함은 똑같이 보이지 않습니다 이론적으로, 당신은 이것을 규칙 기반 알고리즘, 그러나 모든 것을 설명하기 위해서는 많은 노력이 필요할 것입니다 예기치 않은 변수, 이것은 봉투의 한 종류에 불과합니다 깊은 학습이 구제에 이르는 곳이 바로 여기에 있습니다

깊은 학습은 신경망을 사용하여 일을합니다 분석 결함, 개별 부품의 위치 파악 및 분류 인쇄 된 표식을 읽으십시오 좋은 부분을 네트워크에 가르침으로써 예를 들어, 그것은 좋은 것의 차이를 말할 수있을 것이다 봉투 및 결함이있는 봉투, 예상되는 변동을 설명합니다 또한 네트워크를 새로운 목표로 교육하고, 다른 종류의 봉투처럼, 새로운 참조 이미지 집합에 대한 교육만큼 쉽습니다

흔히 동일한 부품이 나타날 수 있습니다 카메라와 다르게 눈부심은 너무 밝아 보일 수 있습니다 부품이 다른 방향으로 배향 될 수 있음 또는 너무 자연스럽게 변형 된 기존 규칙 기반 비전 도구를 사용하여 안정적으로 찾습니다 그러나 이전과 마찬가지로 충분한 샘플 이미지가있는 심층 학습 가능 비전 시스템 쉽게 부품을 찾아 식별 할 수 있습니다 이 정도의 뉘앙스를 가진 어플리케이션의 경우, 깊은 학습은 종종 더 잘 수행 할 수 있고 다른 비전 기술보다 빠르게 동일한 작업에서

깊은 학습은 현재 응용 프로그램에서 사용되고 있습니다 검사는 일반적으로 수동으로 이루어졌지만, 최종 조립품 검사와 같습니다 이러한 작업은 한 번 고려되었습니다 자동화하기가 어렵다 깊은 학습과 같은 도구를 사용하여 보다 일관되게 비전 시스템으로 수행 할 수 있으며, 보다 안정적이고 빠른 수동 검사보다

깊은 학습이 공장을 변화시키는 동안 우리가 알고있는 자동화, 운영자가 할 수있는 또 다른 도구입니다 일을 끝내기 위해 고용하십시오 전통적 규칙 기반 머신 비전 많은 직업에 매우 효과적인 도구입니다 그리고 복잡한 상황에서 인간의 시각과 같은 속도가 필요하다 및 컴퓨터의 신뢰성, 깊은 학습은 진정한 것으로 입증 될 것입니다

게임 변경 옵션

The Power of Machine Learning (w/ Jim Pallotta) | Interview | Real Vision™

작년에 우리는 Dario Villani와 함께 Real Vision에 대해 이야기했습니다 Dario Villani는 Duality의 CEO 겸 창립자입니다

그룹 너는 그의 후원자 야 그가하는 일에 대해 무엇이 흥분합니까? 궁극적으로 기계 학습의 힘을 어떻게 활용합니까? 네 그들의 경우에는 두 가지 일을하고 있습니다 하나는 자산 관리 사업 인 Duality입니다

르네상스 시대의 사람들과 다른 사람들처럼 거기에는 많은 사람들이 가지고 있지 않은 무언가가 있다고 생각합니다 사람들 앞에서 다년간, 기계 학습에서 무엇을하고 있는지 특히 시계열 분석의 일부 그리고 그들은 훌륭합니다 Dario와 Sasha와 Corinne이 그것을 시작한 사람입니다 수학 올림피아드 수상자들 – 내가 가진 재미있는 대화들 대부분을 이해하지 못한다 내 말은, 그들은 정말 엄청났다는거야

그러나 그들은 실제로 – 특히 다리오 – 그 사람에 대해서도 정말로 말할 수 있습니다 그 부분은 자산 관리 부분에 있습니다 어쩌면 중요하고 의미있는 2 시그마 형 비즈니스를 구축 할 수 있습니다 그 반대편에는 분석 비즈니스가 있으며,이 비즈니스는 스핀 아웃됩니다 그리고 그 비즈니스는 흥미 롭습니다

그 이유는 그들이 큰 데이터 세트에 대해 40,000 개의 데이터 세트를 볼 수 있기 때문입니다 금융 기관 자산 관리 또는 기관이 모든 데이터를 사용한다고 가정 해 보겠습니다 본질적으로 훌륭한 필터링은 없습니다 알다시피, 진실한 신호는 무엇입니까, 그렇지 않은 것입니까? 그들이 할 수있는 능력은 마치 그들이 말할 수있는 것처럼 보입니다

40,000 개의 데이터가 있습니다 나는 그것을 단순화하고 있으며,이 1,500 개의 데이터 세트는 오늘날과 관련이 있습니다 그리고 이러한 데이터 세트의 기간이 적절합니다 그리고 계속 업데이트되고 있습니다 그러나 그곳에 모든 데이터를 저장하고 비용을들이는 것 대신에 상당한 양의 빙하 구름을 기본적으로 빙하 구름 또는 그와 비슷한 것으로 이동시켜 일부를 저장하십시오

그것의 위에 비용 – 그리고 보험 또는 금융에있는보기로 가격 재료는 잘 나아진다 그들이 전에 가질 수 있었던 것보다 제 생각에 그들은 매우 재능이 많습니다 재능이 뛰어납니다 두 시그마 (Sigma) 시대부터 오랜 기간 동안 사람들을 쳐다 보았습니다 내가 실제로 가지고있는 유일한 것들은 뛰어 올랐다

Machine Vision – 3D Models

안녕 세상 Suraj이고 며칠 전 Facebook의 인공 지능 연구팀이 데모를 발표했습니다 조밀 한 포즈라고 부름 그들은 주어진 한 비디오에서 인체의 모든 단일 픽셀을 매핑 할 수있었습니다

하지만 많은 사람들이 한꺼번에 훨씬 인상적입니다 그들은 단일 GPU에서 혼란과 혼란이 많은 비디오에서이 작업을 수행 할 수있었습니다 그것들은 단지 깊은 학습이 아닙니다 이것은 매우 멋지며 응용 프로그램을 많이 가지고 있으며, 우리는 그들이이 비디오에서 어떻게했는지 배우게 될 것입니다 3D 애니메이션 캐릭터를 만드는 작업은 비용이 많이 들고 필요한 작업입니다

월말에 일하는 사람들의 팀 사용 가능한 예산이있는 대규모 제작 스튜디오는 사람을 추적하여 애니메이션으로 변환 할 수 있습니다 큰 예산이없는 사람들에게이 기술은 이 능력은 깊은 가짜 알고리즘에 대한 내 비디오 기억 우리가 인간을 추적 할 수 있다면 이것을 풀 바디 버전으로 사용할 수 있습니다 우리는 geoff hinton과 같은 몇몇 초현실적 인 시나리오에 대출하는 것과 다른 것으로 전신을 교환 할 수 있습니다 Aragorn 증강 현실 대신에 Mordor에 위탁하다 응용 프로그램은 이것을 사용하여 실시간으로 볼 수있는 사람들에게 모든 종류의 통계를 표시 할 수 있습니다

그리고 모든 것을 위해 우리 몸의 언어를 더 잘 읽을 수 있도록 네 대의 기계를 버릴 것입니다 가상 현실 게임에 대한 전신 추적에 대한 감정 분석 이것은 예술의 새로운 상태입니다 비인간적 인 포즈 추정과 그것이 어떻게 작동 하는지를 이해하기 위해 우리는 사고 과정을 시도하고 연구해야 할 것입니다 저자는 이전의 발견에 기반을두고 다양한 방법을 시도하는 측면에서 그래서 우리는 인간의 춤에 대한 비디오를 가지고 있다고 가정 해 봅시다

이것은 픽셀의 2 차원 그리드,하지만 당신이나 내가 그것을 볼 때 우리는 실제로이 개체가 나타내는 3D 개체가 있음을 알 수 있습니다 2 차원 그리드 우리는 우리의 컴퓨터가 이러한 능력을 가지고 있고 그것을 시각화 할 수 있다는 것은이 2D 인간을 3D 모델로 한 번 변형시키는 것을 의미 할 것입니까? 우리는 3D 모델을 가지고 우리가 원하는 모든 것을 그것을 어떤 종류의 장면으로도 넣을 수 있습니다 다른 3D 모델로 바꾸면 기능이 많이 변경되지만 이러한 모든 가능성 우리가 3D를 만들 수 있는지에 달려있다 우리가 만들고자하는 인간의 움직임으로서 움직임을 업데이트하는이 인간의 실시간 모델 서신 이것은 하나의 이미지에서 얼마나 잘 픽셀인지를 나타내는 컴퓨터 비전 용어입니다 우리의 경우 다른 이미지의 픽셀에 해당 2D 이미지에서 3D 이미지가 될 것이고 우리 이미지에서 어떤 구멍도 원하지 않을 것입니다 우리는 모든 픽셀을 최대한 가깝게 배치하기를 원하기 때문에 밀도를 높여야합니다

서신과 우리는 지금 당장 인간과 밀집된 서신을 만드는 데 집중할 것입니다 우리는 어떤 객체 탐지를 수행 할 필요가 있습니다 객체 세분화 및 포즈 추정, 다중 레벨 문제이므로 메서드로 시작하려고합니다 가능한 한 간단합니다 우리는 이것에 관해 많은 다른 길을 가졌지 만 이상적으로 우리는 일종의 라벨 데이터 세트를 사용할 수 있습니다

왜냐하면 라벨이 단지 교육을하기 때문입니다 기계 학습 알고리즘은 학습 기능이 포함되어 있기 때문에 훨씬 쉽습니다 이 경우 입력 데이터와 레이블 간의 매핑을 나타냅니다 이상적인 라벨 데이터 세트에는 요즘에는 수많은 라벨 이미지 데이터 세트가있는 것처럼 보입니다 파스칼은 멀리 이미지 그물을 보았습니다

이것들은 기본적으로 각기 다른 임의의 객체 이러한 데이터 세트의 특수한 라벨은 컴퓨터 비전 알고리즘의 최근 모든 진보를위한 촉매제였습니다 그러나 우리가 비디오에서 하나를 본다면 인간에게 표시하기를 원하지 않습니다 우리는 하나의 3D 모델을 만들 수 있기를 원합니다 레이블이 3D 모델 인 인간 이미지의 데이터 세트는 실제로 없습니다 그래서 우리는 스스로를 만들어야합니다 그리고 3D 이미지를 표면 기반으로 주석을 수동으로 작성하는 작업이 인간에게 필요합니다

인체의 표현은 정확히 그 것이다 그들은 기본적으로 어노 테이터에게 지역에 주석을달라고 요청 했습니까? 머리와 다리와 같이 정의 된 신체 부위에 해당하는 모든 주석에는 해당 주석 레이블로 행동하는 3d 본문 부분 그들은 50,000 명의 사람들에게 이것을했는데, 총 500 만 명이 수동으로 주석이 달린 우리가 우리의 데이터 세트를 갖게되면 우리는 어떤 모델을 만들지 결정해야 할 것입니다 우리는 분류 학습에 관해서 깊은 학습이 최첨단이라는 것을 알고 있습니다 컨벌루션 네트워크는 이미지 분류의 최첨단 기술입니다

그러나 그것은 단지 우리가하려는 분류, 그러나 회귀 분석 인간이 다음 질문을하게 될 다음 행동은 무엇인가? 물론 길쌈 네트워크 다행히 최근에 모든 종류의 객체에 대해 이것을 수행하고 괜찮은 결과를 얻은 dense reg이라고하는 아키텍처는 그렇게 시작할 수 있습니다 아키텍처는 첫 번째 단계에서 픽셀로 픽셀을 분류합니다 배경 좌표 또는 표면 좌표의 대략적인 추정치를 제공하는 여러 영역 부분 중 하나에 속합니다 본질적으로 회귀 모델의 두 번째 단계에서 그라디언트 디센트를 사용하여 학습 할 수있는 라벨 작업 영역 부분 a 내의 픽셀의 정확한 좌표를 나타냅니다 이것을 말하는 더 공식적인 방법은 첫 번째 단계에서 위치 L을 몸에 할당하는 것입니다

파트 C 가능성이 가장 높은 분류에 의해 계산 됨 지점으로 이동하고 두 번째 단계에서는 회귀를 사용하여 점 L을 연속 좌표 쌍에 배치합니다 자외선은 부품 CC의 매개 변수화는 25 가지 값을 취할 수 있습니다 P는 25 가지 방법을 의미하는 배경이됩니다 분류 단위와 우리는 24 회귀 함수를 훈련시킬 수 있습니다 각각은 분류와 회귀의 두 부분을 2 차원 좌표로 제공합니다 과제는 각각의 손실 함수를 최소화하여 훈련됩니다 그러나 회귀 손실은 픽셀이 내부에있는 경우 일부분에만 고려됩니다

네트워크가 작동 할 수 있도록 특정 부분 그러나 부분 세분화 및 픽셀 현지화와 같이 단일 네트워크에 많은 작업이 필요합니다 그들은 다음과 같은 기술을 사용합니다 관심 영역 풀링을 사용하여 다른 영역을 만들고 결과를 지역별 특정 분기에 제공 이것은 작업의 복잡성을 분해했습니다 제어 가능한 모듈에 모두 엔드 투 엔드 접근 방식으로 공동으로 훈련 될 수 있음 따라서 관심 영역 풀링 영역의 꼭대기에있는 전체 컨볼 루션 네트워크로, 두 가지 작업에 전적으로 전념합니다 분류 및 회귀 생성 부품 할당 및 부품 좌표 예측을 제공하는 헤드로 그들이 사용하는 모델을 향상 시켰습니다

한 모델의 출력에서 ​​수집 된 모든 정보를 사용하여 모델 모음을 사용하는 계단식 의미 다음에 대한 추가 정보 계단식 분류기는 라인 모듈이 고밀도 네트워크에 공급하는 관심 영역의 출력뿐만 아니라 마스킹 및 핵심 포인트 작업을위한 네트워크 모든 작업의 ​​첫 번째 단계 예측이 결합되어 각 분기의 두 번째 단계 세분화 단위로 공급됩니다 소설 비디오 실험을 통해 자신의 아키텍처는 한 사람뿐 아니라 여러 사람을 위해 전반적으로 잘 작동했습니다 불행히도 초기 소스 코드를 공개하지 않았습니다 바로 지금 그러나 우리는 그들이 종이의 세부 정보를 사용하여 만든 것을 다시 만들 수 있습니다 또한 만든 데이터 세트는 오픈 소스이므로 확실히 확인하십시오

이 동영상에서 기억해야 할 세 가지 사항이 있습니다 밀도가 높은 포즈는 3D 모델을 추정 할 수있는 새로운 심층 학습 모델입니다 하나의 GPU에있는 하나의 비디오에서 여러 사람이 콜렉션을 사용합니다 이 작업을 수행 할 수있는 길쌈 네트워크 과제 분류 및 좌표 예측을위한 회귀 및 오픈 소스는 사람들이 해당 3D 모델에 매핑하는 방식으로 만든 데이터 세트를 엽니 다 더 많은 프로그래밍 비디오를 구독하십시오

이제는 작별 인사를 만들어야합니다 감상 해 주셔서 감사합니다

Custom Vision – Machine Learning Made Easy | The Xamarin Show

>>는 자 마린 쇼에 모두를 환영합니다 나는 당신의 호스트 제임스 Montemagno입니다

그리고 오늘은이 흥분 슈퍼 미쳤다고 나의 아주 좋은 친구 모든 방법에서 짐 베넷, 난 당신이 현재 살고 아무 생각이 없습니다 여기에서 클라우드 개발자 옹호 마이크로 소프트는 누가 얘기에오고 이 멋진 블로그 게시물 / 사용자 정의 비전은 / 우리가 여기 BB8을 얻었다 >> 우리는 모든 장난감을 얻었다 >> 우리는 심지어 얘기? >> 우리는 심지어 얘기? 그래, 우리는 이미지를 분류에 대해 말하고있다 멋진 새 AI 도구 중 하나 그래서 즉, 푸른인지 서비스에서 나올 것 화상 분류이다

>> 아, 멋진 >> 그리고 그것은 마법의 작은 도구입니다, 당신은 어떻게 생겼는지 뭔가를 가르쳐 그리고 다음을 식별 할 수 있습니다 >> 니스 그래서 일단 짐 떨어져 우리는에 도착하기 전에, 어쩌면 자신에 대해 조금 얘기 >> 좋아, 그래

나는 해요, 짐 베넷 해요 여기에 마이크로 소프트의 클라우드 개발자 옹호자, 이 보드에 내 넷째 주입니다 >> 니스 >> 나는 아마 제임스를 알고 있었다 자 마린 커뮤니티를 통해 지난 4 년 정도 I는 자 마린 MVP 봤는데 다음 마이크로 소프트 MVP 나는 지역 사회에 참여했습니다

남자 "행동하는 자 마린"의 저자 누가 그의 서문이 특히 좋은 녀석이다 썼다 >> 나는 꽤 잘 들었어요 >> 그것은 꽤 좋은 책, 그리고, 그래 단지 마지막 쇼에있을 슈퍼 불을 지폈다 >> 편집 그래, 여기 당신이하는 것이 좋다

정말 열정적입니다 종종 내가 말하는거야 기계 학습 및 건물 모델은 말 그대로 그것에 대해 아무것도 몰라 그래서 프랭크 나의 좋은 친구가, 누가 나와 함께 팟 캐스트를 수행합니다 그는 전문가입니다 그는 모든 것을 알고 있으며, 우리는 갔어요 에 대한 다른 세부 사항의 모든 종류에, 이 이미지 대 모델을 만들기 위해 무엇을 의미 하는가, 어떻게 당신은 본질적으로, 핫도그를 만들거나하지 않습니다

그런 것들 글쎄, 당신은했다 핫도그 여부보다 훨씬 더 흥미로운, 어쩌면 당신은에 의해 그것을 큐 수 당신이 내장 된 어떤 사람을 말하는 그리고 왜 당신이 그것을 만들었습니다 >> 그래서, 제가 구축 한 것은 내 딸의 장난감을 식별하는 데 도움을위한 작은 도구 그래서 나는 어린 소녀를 가지고, 그녀는 다섯 내일집니다 내일 그래서 생일, 이비,

그리고 그녀는 다른 귀여워 장난감의 전체 뗏목을 가지고, 그리고 나는 그들이이라고하는지 추적을 잃게됩니다 심지어 그녀는 않습니다 그녀는 그때 그녀의 장난감과 이름을 선택합니다 그녀는 그녀가 그 장난감이라고 기억 수 없습니다 그래서 나는 그것을 구축하는 좋은 줄 알았는데 등급 분류 나를 사용할 수 있도록 모두 내 휴대 전화의 사진을 찍을 장난감 그것은 나에게 이름을 알려줍니다 그리고는 나를 위해 좋은 생각 또한 생각하는 것을 좋아, 우리는 최근에 영국으로 이동 한 – 당신을 , 내가 지금 살고있는 곳을 당신이 모르는 말 나는 전 세계 이동 계속

최근 영국으로 이동했다 우리는 많이 지출 영국에 기반으로 부모님과 함께 시간 그들은 그녀의 장난감이 무엇인지 단서가 없다 그래서 그들이 다시는이 응용 프로그램을 사용할 수 있습니다 종류의 저변에서 그 내용 이번 주라고 그녀의 마음에 드는 장난감, "아기 오리" >>을 얻었다

>> 그래서 그들은 알 수 있습니다 즉,이 구축을위한 영감이었다 >> 그건 꽤 멋진 당신도 할 수 있기 때문에 다음 단계로 가져가, 이는 당신이 다음에 태그를 추가 할 수있다 [들리지] 당신은 응용 프로그램 어디를 만들 수 있습니다 뿐만 아니라 당신이 장난감을 스캔 할 수있는, 하지만 당신은 다음 데이터베이스 항목을 만들 수 있습니다, 문제는이 많은 비용처럼 우리가 도착했을 때,이입니다 그것은 바로, 더 이상 좋아하는 때이 없다? 그것은 종류의 경향을 볼 수있다 즉 실제로 정말 좋은 생각이다

당신이있는 경우 >>이 좋아요 아이들과 자신의 아이가 다른 부모는 당신의 장난감을 좋아한다 왜 올바른 장난감을하지? 빠른 사진을 찍습니다 그것을 봐 오 예, 우리는이 특정 상점이 장난감을 샀다 >> 그래서 난 당신이 데이터 과학자 걸 다음 가정합니다

당신은 기계 학습 전문가입니다 그런 것들 권리? >> 아니 아니 조금있다 지금까지 내가 걱정으로이 마법의 상자입니다

>>을 얻었다 >> 그리고 정말 멋진 무엇이 전체 푸른인지 서비스, 어디 그들과 함께 연주했습니다 당신은 데이터 과학자가 될 필요가 없습니다 >> 네 >> 지금 나는 당신 같은 사람을 얻을 수있는 확신 여기에 페이지 베일리는 어떻게 모든 작품을 설명합니다

나는 단서가 없다,하지만 난 단서가 필요하지 않습니다 >> 매직 나는 마법의 물건 마술을 좋아한다 예 >> 그것은 모든 마법입니다

그것은 마법의 상자입니다 >> 예 그래서 우리는보고있는거야? 당신은 지금 무슨 일을해야합니까? >> 그래서 내가 여기 있어요 것은 애저 사용자 정의 비전 서비스 당신은 customvisionai에서 그것을 얻을 수 있습니다

그냥 표준 Microsoft 계정으로 로그인합니다 그리고이에서 당신은 훈련 할 수있다 신경 네트워크 식별 이미지는 단지 이미지의 작은 번호를 사용 깨끗 시작한다면, 당신은 필요 수천 개의 서로 다른 이미지의 수천에 따라 >> 네 >> 그리고 시간이 지남에 따라이 네트워크를 훈련 어떤 일을 인식합니다

마이크로 소프트가 무엇을했는지, 그들이 가지고있다 일부 사전 교육을받은 이미지 – 난 몰라 어떻게 작동하는지 이해 – 하지만 일부 사전 훈련 된 이미지, 당신은 그것을 그대로 대여섯 사진을주고 그건 이 것을 배울 충분한 이 문제는이 장난감이 장난감입니다 당신은 고전 핫도그에 대해 생각, 더 핫도그, 당신은 그것을 다섯 개 핫도그 사진을주지 오 개 어떤 핫도그 사진, 그것은 직선을 알 수있는 다른 사진을 찍을 때 하나는이다 >> 네 나의 이해에서, 것이 중요, 그것이 무엇인지가하지 그러나 그것은 거의 더 중요 그것이 바로이 아니라 무엇이 있나요? 이 학습을 유지하는 것 때문에 이 핫도그가 아닌 경우, 하지 핫도그,하지 핫도그, 알고 정말 좋은 얻을 것 어떤 핫도그가, 그것은 그렇지 않은 것을 알고 있기 때문에

correctish에 대해인가요? >> 나는 그렇게 생각한다 그것은 overfitting라고, 나는 생각한다 나는 아직도 그 비트가 어떻게 작동하는지에 100 % 확실하지 않다 난 그냥 가지의 마법 상자 측면에 의존하고 있습니다 >> 그래서 내가 여기 어떻게 시작까요? 이것은 무엇입니까? >> 그래서 시작하려면 점 AI를 customvision로 이동합니다

당신은 클릭 "새 프로젝트" 이름을 지정, "내 프로젝트", 그것에게 설명을 제공 "맡은 일" 그리고 당신은 도메인을 선택합니다 그래서 다른 도메인이 모델의 숫자가있다 한에 대한 사전 설정합니다 그래서 "일반" '나는 정말 그게 뭔지 모르겠어요

'의미 당신은 당신이 원하는대로, 그것을 훈련 할 수 있습니다 는 "음식"사람이있다, 이는 식품과 함께 훈련을하고있다 그래서, 당신은 핫도그을하는 경우, 핫도그, 사과 대 오렌지, 그것은 그것을위한 좋은 하나입니다 그들은, 그들이 소매있어, 랜드 마크있어 그들은 인, 성인 있어요 좋은 콘텐츠 필터링을 구축하고자합니다 그래서 당신은 소셜 미디어 응용 프로그램을 구축하고자 또는 이미지 공유 앱 당신이 있는지 확인하고 싶은 사람들 그들은 안 일을 공유하지 않습니다

>>을 얻었다 >>는 성인용 콘텐츠에 대한 하나의 특히합니다 그리고 당신은 바닥을 알 수 있습니다 세 가지의 반복이다 세 상단에,로 표시 "컴팩트" >> 네, 그게 무슨 뜻 이죠? >> 그래서이 모델은 작은 의미합니다 >> 아, 그것을 가지고 모델처럼 때문에 일반적으로 세계에서 가장 큰 것은, 그래서 어떻게 바로 모바일 장치에서 그 배치해야합니까? >> 당신은 아직 할 수 없습니다

[들리지] 안드로이드에 흐르기 쉽다 당신은이 모델을 수 장치를 실행, 그들은 GPU에서 실행됩니다 >>을 얻었다 >> 당신은 보통의 일반 모델을 설정하는 훈련을한다면 즉, 클라우드에서 실행 자원이있는 곳, 당신이 알고, 실행 다른 전문 과정의 bejillions 그건 정말 멋진,하지만 당신은 전화를 할 수 없어

>>을 얻었다 >> 컴팩트 모델은 일반 모델로 좋지 않다 하지만 여전히 당신이 필요 충분합니다 >> 네 >> 소형 전자 기기, 즉 대단히 중요하다 >> 그것은, 컴팩트 시작 나는 당신이 구축한다고 가정 추가하려고하고 있기 때문에 모델 그것에 이미지의 무리, 맞죠? >> 예

>>을 얻었다 시원한 >> 그래서 나는 새로운 프로젝트를 만들려고하고 있지 않다 나는 이전에 준비 하나를 사용하겠습니다 >> 좋아

>> 그래서, 나는 내 딸의 장난감을 사용하는 여기에 하나를 가지고있다 그리고 많은하지 장난감을로드 한 그래서이 그 것이다 이것은 할 충분하다 >> Porgs? >> 네, 거기에 약간의 Porgs

그녀는 그녀의 Porg 사랑 않습니다 우리는 고양이, 귀여워 오리를 얻었다 우리는 BB-8 있는데 나는 꼭 껴안고 싶은 호랑이를 얻었다 >> 문제는 Porg 또는이다 BB 탄-8 현재 좋아? 그녀는 "마지막 제다이"봤어? >> 그녀는 너무 젊은입니다 >> 좋아, 오

>> 그녀는 다섯 내일집니다 >> 그러나 우리가 알고있는 모두가 Porg이 사랑스러운 것입니다 >> 그녀는 Porg은 사랑한다 그녀는 정말 있어요 때 그녀는 다른 일을 화나게 Porgs 실제 아니라는 것을 배웠습니다 >> 그래, 오

>> 네 난 정말 진짜 Porg, 아빠 싶다 >> 스포일러 경고 >> 죄송합니다, 그들은 진짜 아니에요 하지만 그래,이 그것을 훈련을했다 전부입니다

그래서 당신은, 그것을이 사진을 제공 다음은 "매직 기차"버튼을 클릭, 그 충분이 꺼지고 파악하기 위해 아웃 : 이것은 호랑이 모습입니다, 이 BB-8 모습입니다 >>이 태그에 이런 일들은 무엇입니까 여기? 때문에에게, 어떻게 알 수 있습니까? >> 오른쪽 그래서 때 이미지를 업로드, 당신은 그것을 이미지의 수를 줄 당신은 그것에게 태그를 제공합니다 그리고 그 태그는 이미지에있는 것입니다 >> 오

알았다 >> 그래서 나는이 하나를 업로드 여기에 그녀는 작은 '호출하는 술래 잡기, '나는로 태그를 추가 한 "작은 술래 잡기" >>을 얻었다 그래서 바로 다음, 그것은 호랑이 아니다 알고, 그것은 이러한 태그를 가지고 있지 않기 때문에 >> 네

그래서 여기이 하나의 태그를 가지고있다 "BB-8" 우리는 여기에 Porg을 가지고있다 그녀는의 태그있어 '포치'이라고 부른다 "포치" >>을 얻었다 >> 그래서 태그가 당신이 무엇을 식별하는 데 사용거야

당신은 당신이 아니라 그 태그, 사과의 업로드 "사과를" 당신은 오렌지, 당신은 같은 그 태그 업로드 "오렌지을" 그래서 태그는 말을하다 "이 일이 무엇인지 배울 때, 이 일이라고합니다 이 사람은이라고합니다 이 사람은이라고합니다

" >> 좋아 >> 그건 정말, 그것의 종류입니다 당신이 "기차"를 명중 할 때 >> 그래서, "기차"는 무엇입니까? 당신은 "기차"버튼을 쳤을 때 >> 그래서,이는 꺼집니다 이것은 반 전체 모델을 취할 것입니다, 그리고 그 모델을 전문으로 거기에 이미지를 기반으로 >> 그래서, 다른 장난감을 얻을 수 있다면, 그때 업로드하고 재교육 것? >> 네 당신이 더 많은 이미지를 원하는 경우에, 당신은 재교육 것입니다

그리고 매번 당신은 훈련을, 당신은 반복이라는 것을 얻는다 그럼, 어디입니까? 그래서, 당신은 서로 다른 반복이있다 >> 좋아 >> 그래서, 내가 가진 첫 번째 반복, 나는 두 개의 특정 장난감을 가지고 훈련을했다 >>을 얻었다

>> 그리고 다음 반복, 나는 또 다른 장난감을 추가 그리고 나는 몇 더 많은 이미지를 추가 다른 장난감은 후 다시 훈련했다 그래서, 당신은 예측을 수행 할 때, 당신은 실제로 이미지를 볼 수 그 예측이 여기에 표시 사용합니다 >> 아, 좋아, 멋진 >> 내가 잘 말할 수있는, 실제로 여기 하나, 그것은, 그것은 porg이었다 예측하지만, 그때 나는 그것을 태그를 말할 수 물론, 그것은 명확한 태그는 예 이것이 porg가요 >> 그래서, 그것은 알고있다 >> 그래서, 그것은 알고있다

그래서, 특히 이 사람이 인식하지 못하는 발견하면, 나는이 이렇게 말할 수 있습니다, 또는 내가 먹고 싶어 경우는 새로운 장난감이 있다면 여기 원숭이의 사진, 나는 그 하나를 추가 할 수 있습니다 새로운 장난감으로, 새로운 태그를 추가합니다 >>을 얻었다 >> 그리고 내가 다시 "기차"버튼을 클릭, 그것은 또 다른 반복을 실행하고, [들리지]에 대한 자세한 내용을 배운다 >> 아, 괜찮아 그래서, 당신은 본질적으로 교육을 유지할 수 있습니다 당신이 모델을 사용하고 같은 모델? >> 예

>> 그것은 멋지다 그건 아주 좋은입니다 >> 그래, 당신은 가지에 필요하기 때문에 모델을 전문으로합니다 당신이 뭔가의 사진을 가지고가는 경우에, 그리고, 그 핫도그의 여부 모르는 당신은 예는, 아니 그렇지 말한다 다시 모델을 훈련

그래서, 당신은 유지할 수 있습니다 모델 성장 및 개선 >>을 얻었다 >> 더 전문 보관하십시오 >> 그럼, 어떻게 이걸 가지고 있습니까? 내 말은, 그것은 여기처럼 보인다, 내가 할 수 이미지 또는 뭔가를 업로드 할 수 있습니다 하지만 내가 어떻게 내 응용 프로그램에서받을 수 있나요? 내가 퍼팅에 대해 신경 좋아하기 때문에 자 마린 응용 프로그램의 내부 그것

어떻게합니까? >> 그게 내가 걱정하는거야 그래서 만약 나는 여기에 빠른 테스트를해야합니까 어디 그냥 이미지를 선택할 수 있습니다 이것은 내가 이전에 찍은 이미지입니다 >> 좋아 >> 그리고이, 때때로을 바로 돌아 오지 않습니다

아,했다 그리고 나는 한 번 더 클릭합니다 그들이 돌아 오지 않는 경우에 따라서 태그는 안된다 거기에서 우리는 100 시간의 확률이 BBI입니다 이동합니다 그래서, 모든 기반 확률이다

이것이 X입니다 내 생각, 말을하지 않습니다 그것은, 여기이 태그입니다 확률이다 말한다 이 태그이 태그 >> 그것은 꽤 좋다 그것은 BBI의 100 % 확실합니다 >> 100 % 확인이 PBI이야, 그리고 전에이 영상을 본 적이있다

그래서, 지금, 내가 예측을 다시 얻는 경우에, 당신은 이미지가 나타납니다 볼 수 있습니다 >>을 얻었다 당신이 시도하고 태그 네 >> 그래서, 괜찮아

그러나, 분명히, 이 모바일 앱에서 더 재미 있어요 >> 네 >> 당신이 조부모 주위에려고하고 있기 때문에, 당신은, 당신이 주위에있을거야, 주위에있을거야 그들은 장난감 및 태그 물건을 필요로 할 것입니다 >> 예 >> 그리고 실제로, 그것은이다 정말, 정말 쉬운이를 얻을 수 있습니다

>> 나는 쉽게 일을 좋아합니다 나는 큰 팬입니다 >> 네 그것은 새로운 패키지입니다 >> 그 사랑

>> 말 그대로, 그건 MicrosoftCognitiveCustomVisionPrediction 그것은 새로운 패키지를 얻을 수 있습니다

당신은 당신에게, 그 다음에 가져 예측 엔드 포인트 인스턴스를 생성 당신은 사용자 정의 비전에서 오는 IP 케이스를 제공 당신은 코드, 이미지를 예측 당신은 그것을 스트림 전달 그 스트림은 이미지가 포함되어 있습니다 그래서, 당신은 예를 들어, 사용한다면, 당신이 작성한 미디어 플러그인, 그 파일을 내뿜으며, 우리는 그에서 스트림을 얻을 수 있습니다, 여기에 스트림을 전달합니다 >> 그래서,이 타격은 무엇인가? 이 엔드 포인트를 타격, 아니면 무슨 일이야? 나는이 이미지를 예측 호출하면 어떻게됩니까? >> 그래서, 무대 뒤에서, 당신은 코드 이미지를 예측할 때, 그것은으로 꺼집니다 사용자 정의 비전 꽤 많이 정확히 내가 빠른 테스트를했을 때와 같은 당신은 엔드 포인트에 해당 이미지를 위로 업로드합니다 그래서, 분명히 당신은 인터넷 연결이 필요 ,, 그 다음 결과를 다운로드, 구름이 실행됩니다

>> 좋아 >> 바로이를 가져옵니다 그래서, 난 그냥 여기 내 전화에를 실행하면, 우리가 희망 것을 볼 수의 데 미첼리스는 나와 함께, 우리는 거기 BB8와 작업을 참조하십시오 >> 그래서이 통과하는 것입니다, 다음이이를 반환합니다 이미지 태그 예측 모델은 무엇입니까? 돌아 오는 것을 뭔가 당신이 만든, 아니면 무엇입니까? >> 그래서, 이것은 API의 한 부분으로 돌아옵니다

그래서, 새로운 GET 패키지의 일부로서 우리 이러한 예측 모델을 가지고있다 그들은 태그와 확률의 이름을 포함합니다 그래서, 우리가 예측할 때, 우리는 경우 백 수 나는 우리가 볼 수 있도록 여기에 휴식이 걸릴 것이 었습니다 그래서, 난 그냥 여기 내 응용 프로그램을 실행하면, 나는, BB8의 사진 할게요 그래서 우리는, 연결 미디어를 사용하고 그 업로드, 우리는 여기 내 엔드 포인트에 충돌 그리고, 클라우드를 갈 것 그 일을, 돌아와 그리고 정말 should- >> 당신은 너무 많은 코드를 단순화했습니다

>> 내가 너무 많은 코드를 단순화했습니다 나는 무슨 일이 일어날 지 볼 수 없습니다, 하지만 오,이 실행하세요 >> 그것이 무엇인지하지 마십시오 >> 그것이 무엇인지하지 마십시오 이제 다시 해보자 우리는 BB (8),이 시간의 전면을 사용하자

이 모델은 그것이 무엇인지 이해하지 못하는 약속, 그들은 서로 다른 색상을 이해하고, 이미지를 이해합니다 그래서, 거기에 우리는 간다 아마 때문에이 전면에 검은 눈 >> 앞서 가서, 여기에를 당깁니다 >> 자, 그들을 가져올 수 있습니다

그것은 BB8의 발견 >> 그래서, 당신은 가서 브레이크 포인트를 추가 할 수 있습니다 다음이 결과를 보려면, 우리는 다시 할 경우? 그래서, 당신은 어딘가에이 얻을 최고의 태그에서이 전화하는거야 >> 예 >> 그래서, 내가 다시 무슨 일이 일어날 지 정말 관심이 있어요 >> 네 >> 거기 우리는 간다

흥미, 좋아, 오 그래서, 즉 리팩토링 코드는 그렇게 살아? >> 그게 할 수있는 방법이있다 거기에 좋은 포인트가 okayIt의 라이브 리팩토링 >> 예

>> 그리고 이제 다시 실행하자 그녀가 돌아 오는 이유를 우리는 볼 수 있습니다 >> 나에게 흥미로운 무엇 때문에, 나는 무엇의 결과에 정말 관심이 있어요 실제로 문자 그대로 단지 일어났다 그래서 여기, 당신은 어떤 예측을 얻을, 다음이 그냥 아주 쉽게 코드 것으로 보인다, 다음 링크를 사용하여 기본적으로 쿼리에 같은입니다, 나는 가장 높은 확률을 찾으려면 또는 당신은 the- 무엇을 결정하는거야? >> 나는 가장 높은 확률을 찾고 싶어요 >>을 얻었다

>> 본질적으로, 그것은 아니다 나는 여기에 임계 값을 가지고 나는 당신의 사진을 복용 끝낼 수 있기 때문에, 예를 들어, 그리고 그것은 거기에 생각 당신이 BB8있어 01 %의 기회, 05 %의 기회는 porg되는 >> 네

>> 그리고 소위 >> 높은 확률뿐만 아니라 > 예 내가 그 통해 올 싶지 않아, 나는 당신이 누군지 모르는 말하고 싶었다 >>을 얻었다

>> 그래서 나는 50 %로 설정된 임계 값을 가지고있다 그래서, 난 그냥 다시 실행거야, 같은 사진을 촬영, 우리는 지금 희망한다, 이 버튼을 누르면, 우리가 돌아 오면 무엇을 참조하십시오 본질적으로 무엇 돌아 오는 것은 우리가 가진 것과 동일 이 공국 우리는 간다 >> 그래서, 오 개 예측 >> 그래서 다섯 예측

첫 번째 그래서 하나의 가능성이있다 그래서, 0에서 하나 이중 추측이다 하나되는 100 %의 확률로, 그리고 태그 BB8 함께 제공됩니다 >> 그래서, 우리가 본 태그입니다 사용자 정의 비전이다 좋아, 오

>> 네 그리고 거기 우리는 간다 porg는 14 배 10 양이 17 %의 기회입니다 >> 그 사람이 항상 저를 던졌습니다, 당신이 다시 수학 수업에 가야하기 때문에, 맞죠? 그것이 부정적인 (17)에 기하 급수적으로 사실 이니까

그래서, 그것은 기본적으로 제로 그래, 정직해야합니다 >> 네, 거의 그래 그리고 다시 타니 태그는 제로 꽤 많이있다 아기 오리는 거의 제로, 내 MEMA입니다 >> 그래서, 이들은 반환합니까 특정 순서 또는 결과에서 임의? >> 그들은 태그의 순서입니다 >> 좋아, 그것을 얻었다

>> 그래서, 내 태그 여기에 정의 된 방법으로, 이 순서는 점에서 그것을 않습니다 태그는 원래 추가되었습니다 내가 아는 한, 일이 변경 될 수 있습니다 >> 내 얼굴을보십시오 우리는 내 얼굴에 무슨 볼 수 있습니다 >> 좋아, 해보자

>> 수염은 어쩌면 수염은 porg 될 것입니다 >> 좋아 의 그것을 말하는 보자 나는 그것이 porg로 온다 바랍니다 >> 나는 흥분

>> 당신은 기쁘게 생각합니다 좋아, 그럼 우리는 무엇을 가지고 있습니까? >> 나는 순서대로 돌아 오지 않을 생각 이 반대로 때문에 당신이 porg 있습니다 마이너스 6 가능성이 23 배 (10) >> 나쁘지 않습니다 >> 당신은 다음 스타 워즈 영화가 될 것입니다

그럼 당신은, 일 그리고 5 마이너스 12로, 당신은 호랑이입니다 >> 좋아 그리고 >> 4 마이너스 13 그 당신은 작은 귀여워 고양이있어, 다음 3 마이너스 13에 BB-8 그래서 당신이 porg로있는 가장 가까운 것은, 하지만 당신은 10 마이너스 6에 2 회에서 찾고 있습니다

그래서 당신이 porg있어 매우 매우 작은 확률입니다 그럼, 여기에 일어날 것은 나는 확률 임계 값을 기준으로 필터링하고 말할 것이다 "나는 당신이 누군지 모르겠어요" >>을 얻었다 >> 당신은 50 % 뭔가 아니에요 지금 이것은 인터넷 연결이 필요합니다 해당 연결을 확인합니다

내가, 내가 장소에있어 경우 어떻게 나에게 의미 나는 숲에서 오두막의 중간에있어, 나는 인터넷에 연결되어 있지 않습니다 나는 아직도이 I- 없습니다 싶지 또는이다 사용자 정의 비전 AI가 저를주는 일이 그렇게 할 수 있습니다 내가 내장하는 iOS 및 안드로이드 모두 알고 있기 때문에, 이전 코어 ML 언급 한 것처럼,이 이는 애플의 핵심 기계 학습이다, TensorFlow 한 후, 구글은 본질적 버전입니다 그래서 같은, 내가 사람들을 사용하여받을 수 있나요 또는 나는 바퀴를 재발견 가야합니까? >> 예 당신은 매우 많은 사람들을 사용하여 얻을 그래서, 그것은 매우 멋진 한 가지입니다 사용자 정의 비전 시스템은 모델을 내보낼 수 있습니다

>> 좋아, 오 >> 그래서, 내 반복 볼 때, 여기 상단에 '내보내기'버튼이있다 볼 수 있습니다 >> 나는 그것을 좋아한다 >>이를 선택합니다 아이폰 OS 11 코어 ML, 안드로이드 TensorFlow

>> 좋아 >> 그래서 난 내 모델을 다운로드 할 수 있습니다 나는 소형 모델에 들어갑니다 이유입니다 나는 비 컴팩트 모델에 갔다 경우, 나는 그것을 다운로드하지 것이다 >> 너무 큰 것 때문에, 당신이 정말로 업로드 할 수 없습니다 응용 프로그램에 공연 응용 프로그램은 어쨌든 저장합니다

>> 예 >> 겠어요 – >> 나는의 같은 500 megas의 한계가 있다고 생각 코어 ML 모델의 크기입니다 나는 TensorFlow에 대해 알고하지 않습니다 >> 그래서, 여기에이 모델, 당신은 그것을 다운로드 할 수 있습니다 이제 좋은 것은 나는 것으로 가정했다 자 마린는 직접 바인딩을 제공하기 때문에, 당신을 그냥 사용 코어 ML API를 스스로? 그것은 어떻게 작동합니까? >> 예

그래서 여기 앱의 다른 버전을 가지고있다 그리고이 응용 프로그램의 한 부분으로 당신이 얻을 수 에 대한 패키지 자 마린 플러그인 이건 정말, 정말 쉽게 만들기 >> 아, 멋진 >>이 종류이기 때문에 꽤 열심히 당신은 이러한 API가 작동하는 방법을 모르는 경우 >> 네

>> 그래서 iOS에서, 당신이하는 일은 당신이 모델을 다운로드 할 수 있습니다 당신은 다음과 같이 제공, 컴파일해야 당신이 비 압축 버전은 컴파일합니다 나는 왜 의미하지 않는다 확실해 말해 줄 수 많은 API가있다 나는,이 모델을 얻고, 당신이 할 수있는 일은 내가 그를로드입니다

그래서 모든 것이 모든 당신을 위해 작성된 것입니다, 그의 모든 API는의 보류입니다 핵심 ML API는 비전에서 기지입니다 >> 네 >>을 VNCoreMLRequest에, 이는 요구 인 그 의미의 핵심 ML 비전 액세스합니다 >> 네 >> 그것은 모든 비동기입니다

그래서 이미지를 얻을 수 있습니다 나는거야 나는 스트림을 다시 당신에게 내가 이미지를 그 변환합니다 나는 그 다음에 그 전달 핵심 ML 요청이를 통해 CoreMLRequest, 사물과 사이트의 이미지를 식별하도록 설계된다 그것은 꽤 많은이 특정 목적을 위해 만들어진 것 >>을 얻었다

>> 그리고, 그것은 손에있다 통화는 어떤 결과를 반환 백업합니다 그리고이 결과는 본질적으로 분류 목록 텍스트 확률 통과되어있다 >> 네 >> 동일한 출력의 종류 다른 클래스 유형 그것은하지만 아이폰 OS API이기 때문에, 본질적으로, 출력은 동일하다

이제 한 가지이 "ToCVPixelBuffer"에 대한주의 그래서이 모델은 실제로 이미지를 이해하지 않습니다 그들은 이미지에 대한 아니에요, 그들은 단지 이진 데이터 규칙을 이해합니다 그래서 좋아 보이지 않습니다 >> 것들은 이미지의 제로가 아닌 이미지 자체

>> 예 >> 네 >> 그리고 기대는 특정 크기가 될 것으로 보인다 그래서 사용자 정의 VisionWorks 이미지는 227에 의해 227입니다 그래서 적당한 크기로 변환해야 다음에 본질적으로 픽셀이 변환해야합니다 버퍼는,이 수레 잡아 RGB의 부동 소수점 숫자를 개최합니다 당신이 거기에 있음을 펌프 할 때, 그것은 신경 네트워크를 실행 마법 상자에서 마법을 수행합니다

마법의 책, 않습니다 다음, 당신의 텍스트와 확률을 뱉는 다 >> 아, 멋진 >> 그리고 정말 멋지다 그리고 안드로이드에, 그것은 같은 일이 본질적이다 그래서하는 TensorFlow 추론 라이브러리가, 그 중 상당 이 비전 기반의 코어 ML 라이브러리, 어떤 이미지는 처리를 위해 설계된다

그것의, 랩핑 된 것 그것을 위해 결합으로 결합된다 그것은 새로운 갭 패키지로 사용할 수 있습니다 그냥 당신과 순간에 얻을, 이 자 마린 패키지의 TensorFlow입니다 >> 아, 멋진 >> 그리고 난 내 코드에 그것을 사용하고 있습니다

꽤 많이, 정확히 동일합니다 나는 비트 맵, 안드로이드 비트 맵을 가지고있다 나는 227에 의해 227를 축소 나는 수레의 훨씬을 뱉어 꽤 많이 난 그냥 큰 바이트 배열을 짓고 있어요 >>을 얻었다

>> 본질적으로 플로터의, 여기서는 RGB 값에 뜬다 내가 모델을 실행 한 후 공급 그래서 좀 출력을 얻을 밖으로 검색 iOS 및 안드로이드에 대한 모델의 차이, 핵심 ML 텍스트 내장되어 있습니다 안드로이드 하나하지 않습니다 그냥 알고있는 제로 번째 항목이 제 속성 Y

에서 X의 특성을 갖는다 >>을 얻었다 >> 그러나 모델, 당신은 라벨의 파일을 얻을 그리고이 파일이 바로 당신의 레이블을 제공 레이블 본문 당신은 것을 알 수 있도록 제로 번째 사람은 첫 번째 레이블의 외 될 것입니다 >>을 얻었다 >> 다음 단계가 될 것 하나

>> 그래서는 nice-의 종류입니다 >> 잘못된 장치 >> 내가 인터넷에 연결되어 있다면 그래서, 나는 때문에 그것을 사용할 수 있습니다 그 모델은 바로 업데이트 할 수 있는가? >> 예 >> 나는, 그대로 때문에 오프라인 경우 좋은 점은 의미 내가 TensorFlow을 사용할 수있는 말하고는,뿐만 아니라 난 사실을 핵심 ML을 사용할 수 있습니다 그렇게 나는 완전히 오프라인 될 수 있습니다 얻을, 하지만 온라인 버전을 사용하는 경우, 나는 계속, 그것은 반복 포장 할 수 있습니다 다음 또한 내 모델 온라인으로 할 수있다 여기에 모델보다 더 나은 >> 네

>> 그래서 당신은 전략의 것이 좋습니다 것입니다 어쩌면 로컬로 처음 확인, 다음 온라인에, 또는 무엇이 최선의 전략이 될 것입니다 두 하나 또는 다른 조합처럼? >>이 달려있다 >> 좋아 >> 나는 그것이 종류의 소리를 알고있다 >> 나는 핵심 ML이 될 것입니다 있으리라 믿고있어 웹 요청을보다 훨씬 더 빨리, 맞죠? >> 수행하는 사전 코어 ML 또는 TensorFlow에에 흐름은 라이브 비디오 피드를 통해 그것을 할 수 있습니다 >>을 얻었다

>> 그래서, 하나의 좋은 예 내가 이것을 본 적이 나는 작년 NDC 시드니에서 데모를 보았다 그들은 초음파 검사에 사용하고 있던 곳 자궁에서 아기의 방광 결함을 찾습니다 그래서, 초음파와 같이, 그들은 어떤 결함을 볼 수 있습니다 >> 예, 스캔 >> 당신은 당신이 무엇을 찾고 있는지 알고 있다면 그리고 모델은 매우 단지에 지어진 이러한 식별 빠르게

지금, 당신은 일정한 생중계로 그를 가지고 싶다면, 그래서 당신은 스캔을하고있는 등 라이브 초음파 공급, 그것을 관광 명소 경우, 그것은 바로 당신을 핑 >> 네 그것은 웹 요청 매 5 자체를 만들 수 있습니다 >> 그것은 수 있으며, 당신이 생각하는 경우, 당신은 큰 플래시 병원 인 경우 최초의 세계에서 미국, 당신은 통지, 이러한 것들을 발견 방사선이있다 당신은 아프리카의 중간에서 인 경우에, 예를 들어, 그래서 당신은 매우 일반적인 의사에게 어쩌면 의약 국경있어 당신은 최대 훈련을 돕고있어 지역 조산사는 초음파를 수행하는, 당신은 초음파를 가지고있는 경우 안드로이드 태블릿에 연결

>> 네 >> 당신은 그 인터넷 연결을 할 수 없습니다 당신이에 모델을 넣을 수 있도록 검색을 할 수 있습니다 >> 아마 국경없는 의사 회는 외출 당신이 뭔가를 스캔 할 것입니다 당신이 바로 장치에 그것을 할 >> 그래, 당신은 반드시 필요하지 않습니다 모든 것을보고 모든 사람을 훈련

이 장치는 당신을 위해 그것을 찾을 수 있습니다 뭔가 관광 명소 경우, 그것은 우리 중 하나를 ping합니다 우리는 와서 실제로 그것을 더 검색 할 수 있습니다 >> 네 >> 그래서, 유스 케이스가 무엇인지에 따라 달라집니다 당신이 라이브 비디오 피드를 가지고 싶다면, 당신은 아마 온 디바이스 (on-device)에합니다

>> 온 장치 >>하지만이 모델을 지속적으로 개선하고 싶은 경우, 당신은 원격으로 갖고 싶어 물론, 당신은 항상 단지 모델을 다시 다운로드 그래, 그것을 다시 >> 지금, 당신은 당신이 혼합 할 말 와 일치하는, 그래서 당신은 종류의 그것을 밖으로 얻을 수 있습니다

>> 즉 최고입니다 나는 그것을 사랑 해요 나는 그것이 정말 멋진 유스 케이스 생각 단지 핫도그 이상 여부를 더, 및 GitHub의 또는 방법에 대한 모든 소스 코드는 우리가 그것을받을 수 있나요? >> 네 그래서,이에 대한 모든 소스 코드는 GitHub의에 달려있다 우리는 쇼 노트에 새로운 자식 패키지 의지를 넣을 수 있습니다

>> 아래의 쇼 노트에 넣습니다 >> 아래의 쇼에 넣습니다 >> 편집 >> 그것은 모든 거기 그것은 사용하기 매우 쉽습니다 >> 나는 그것을 사랑 해요

그것은 쉽게 보인다 나는 정말 좋아 신난다, 짐 >> 코드의 두 줄 >> 네

>> 이미지를 인식한다 >> 음, 감사에 대한 이상 모든 방법을 오는 이 사용자 정의 비전 AI를 표시합니다 나는 그것을 사랑 해요 나는 될 갈거야 지금은 전문 학습 기계 감사 그래서 다시 짐에 오는

>>이 날을 받아 감사합니다 >> 얍 의 조정을위한 그리고 감사합니다 여러분 IT는 자 마린 쇼의 또 다른 에피소드이었다 당신이 거기까지 가입 확인 땡, 거기, 거기 이상 종, 당신은 무엇을 해야할지

그래서 당신은 모든 최신 에피소드를 얻을 구독하기 받은 편지함에서, 각 매주 먹이 다음 시간까지 나는 제임스 Montemagno 해요, 시청 주셔서 감사합니다

Computer Vision and Machine Learning, by Nick Wong

SPEAKER 1 : 이것은 내가 가장 좋아하는 버즈 terms– 두 가지에 대한 세미나 기계 학습, 컴퓨터 비전 당신은 파티의 대화처럼 거기에 사람들을 밖으로 던져 사람들이 괴상한 말 외에, 그들은 또한 아주 나쁜 엉덩이 있다고 생각합니다

그들은 컴퓨터 과학자라면, 그들은 수도 당신이 실제로 얼마나 알고 있는지 질문입니다 그래서 기계 학습 및 컴퓨터 비전, 나는했습니다 가지가 무엇인지에 cutesy 작은 슬라이드를 넣었습니다 나는 보통 자신의 이름으로 그들에게 참조 할 것 내가 ML 말한다면 나는 기계 학습을 의미한다 내가 CV를 말한다면 나는 컴퓨터 비전을 의미한다

아주 쉽게 그리고 이러한 종류의 신화 사람들이의있다 기계 학습에 대한 있습니다 그들은 두 극단 중 하나에 보통입니다 어느 것은 불가능하고 오직 최고 기술 괴짜를 위해입니다 끝에 시간 동안 자신의 컴퓨터에 앉을 수 마법사 우리는 그들이 할 일을 더 잘이기 때문에 아니면 그 흥미로운 아니에요

당신이 그 두 극단의 betweens에 속하지 경우에, 그 너무 멋지다 그러나 기본적으로 기계 학습 및 컴퓨터 비전, 우리가 그들을 필요로하는 이유에 대한 상황은 우리입니다 그 사람들이 문제를 해결할 수 있도록하려면 하루 종일, 프로그래밍 매일하지만 해결 그래서 컴퓨터 프로그램을 할 수 없습니다, 뭔가보고있다 그리고는 소파의, 즉 그 사람의, 그 강아지의, 고양이의 말 실수로 사람을보고 아,이 차를, 말을하지 번호판 거기 어디있어 그리고 당신이 기존 상상할 수 어쩌면 실제 예제 트래픽 인식이다

당신이 뭔가가 무엇인지 알아 내려고 노력하는 경우, 컴퓨터 비전은 매우 중요하다 내가 말할 수 있도록하려는 때문에, 일 그 내 붉은 빛 갈색 곰이나 차를 달렸다 그리고 중요합니다 그리고 그것은 우리가 일반적으로의 후 친절 정말로 무언가이다 이리 그러나 우리는 매우 구체적인 문제에 접근하는거야 우리에게 약간의 컨텍스트를 제공합니다

그리고 지금까지이 두 가지에서 저에 대한 상황과 배경의 나의 종류로 내가 년 전 이전에 코딩 된 적이있다, 년 전에 경우에 그래서 2016 인 이것은 미래에있다 그리고 기본적으로 내가 원한, 내 CS50 최종 프로젝트, 정말 멋진 일을 할 나는 내 자신에 그것을하고 싶었다 그리고 나는 그것이 액세스 할 수있었습니다 뭔가 싶었습니다 그래서 많은 사람들이 오, 같았다, 기계 학습, 컴퓨터 비전은 그 세 가지 기준 중 두 같은 휴식, 가능성이 있습니다

마찬가지로, 당신은 당신의 자신에 그렇게 할 수 있으며 액세스 할 수 없습니다입니다 그 일이 불가능 할 수 있습니다 왜 당신은 이제까지 그 접근 할 것인가? 그리고 네 그 이론적 측면 등으로부터 아마 사실이다 나는 앉아서 기계 학습 뒤에 수학을 모두 자신을 가르쳐주지 않았다 나는 앉아서하는 방법 컴퓨터 비전을 사용하여 윤곽을 수행하는 자신을 가르쳐주지 않았다

나는 앉아서 어떤 YouTube 동영상으로 주위했다 그리고 그 세미나의 포인트는 기본적입니다 그들은 전문 용어가있는 동안,이 두 개념을 가르치거나 표시하거나 증명한다는 것입니다 그리고, 그들은 매우 시원하고 각 주위의 모든 분야가있다 그들이 당신에 액세스 할 수있어, 단지 CS를 시작 CS50 학생, 코드의 어떤 라인을 볼 수없고, 그 전에 무엇을 의미하는지 좋아하지 않았었다 즉,이가 누구입니다 그래서 당신이하는 CS 전문가의 일종 경우 기계 학습, 컴퓨터 비전, 작은에 대한 모든 일을 알고있다 혼란 시청뿐만 아니라, 정말 감사하는 이유 그리고 잘하면 당신은 적어도 재미 있고 어쩌면 조금 찾을 수 있습니다 정보이었다

그리고 기본적으로 내 이야기는 내가 와서되었다 소프트웨어의 두 가지 패키지 또는 조각을 사용하여 최종 프로젝트를했다 기계 학습 부분과 열기 CV이다 Keras 2 컴퓨터 비전 부분과 구축하는 것입니다 알고리즘 또는 소프트웨어의 조각 것 나에게 매우 특정 작업을 수행 할 수 있습니다 나는 악보의 이미지를 변환하고 싶어 음악의 기계 판독 버전으로 지금은 존재하지 않는 소프트웨어 그리고 나는 이유를 발견했다 정말 어려운 현실에서 도피하고 있기 때문에

그러나 시원한 과정은 어쨌든이었다 그리고 나는 그것이 가치있는 노력이라고 생각했다 그리고 나는 그들이 원한다면 그것을 시도 모두를 격려한다 현실 세계 예 그러니 종류의, 우리는 사명의 종류가 이 종류의 패턴 인식의 아이디어로 우리를 완화하는 것입니다 그것은 우리가 어쨌든 기계 학습에 계신입니다

그래서 나는 스톡 이미지에 대한 있습니다 그들은 파워 포인트 슬라이드의 템플릿으로왔다 그냥 자신의 설명을 변경했습니다 그리고 기본적으로 나는 가지 생각하라는거야 당신이이 사명 사이에서 찾을 수있는 패턴에 대한 당신의 머리이다 그리고 인간으로서, 당신은 find– 수 있습니다 나는 수백 말을 주저입니다

심지어 어쩌면 정말 충분히 수백 데이터,하지만이 있는지 모르겠어요 권리? 패턴의 매우 많은 수의 그래서 지금은 의미에서 그 제한거야 기계가, 그들이 선택할 수 있습니다 제한된 양의 데이터가 있습니다 우리도 그래 그러나 우리의 즉시 많은 종류의 많은 데리러 기계가 정말 우리가있어 특히 기계에가는 것보다 이러한 종류의 부드러운 이하 소프트웨어 측면에서, 작업

그래서 당신은이 세 가지를 얻을 그리고, 당신은 인간, 당신이 어떻게 많은 눈 기본적입니다 당신은 포니 테일을 가지고 않습니다 나는 짧은 시간에 있었다 그래서,이 세 가지 범주에서, 나는 경우 당신에게 질문을하면 사람들이 어떤 그룹을 식별 할 수 있어야했다 또는 누군가를 가리 키도록했고, 이러한 범주에 따라 말하고, 무엇을 그들이에 속하는 할 범주, 당신은 할 수 있어야합니다 그리고 인간은, 우리는 꽤 잘있어

나는이 사람이라고한다면, 당신은, 거의 100 % 자신있게 말할 것 그래 그거야 여기에 동일합니다 하나와 동일합니다 네 번째와 동일합니다 그것은 말하기 어렵다,이 여자입니다

여자는 정말 범주 중 하나가 아닙니다 그리고 데이터를 찾고, 잘 어쩌면 당신은 어떤 외부 데이터가 그 빛깔과 사람들이 아마 말한다 약간의 성 차별이다 소녀 그러나 같은, 당신도 알다시피, 우리는 가지 그 가정을 무시하는거야 그냥 묶은 머리는 아마 여자입니다 말한다 우리는 95 % 신뢰과 같이 말할 것이다 함께 글쎄, 당신이 하나를 얻을 그러나이 모든 나머지는 같은, 잘, 더 포니 테일 없습니다

그래서 나는 그들이 여자 아니에요 100 % 확신한다 약간의 문제 그 하나입니다 그래서 이것은 매우 인위적인 만 가지 재미있다 당신이 볼 수있어 데이터의 양을 제한하는 경우, 당신은 지금 당신이 찾을 수있는 패턴으로 제한됩니다 그리고 그것은 매우 직관적 인 것입니다

즉 거의 순간적인 계시해야 뭔가 당신이 경우 같은 샤워는 생각했다 그러나 몇 가지 심각한 증상의 종류가 있습니다 우리는 기계 학습 및 컴퓨터 비전을 적용하려고 할 때 사람들이 만드는 가정 그래서 하나 우리가 필요로 우리는 많은 데이터를 축적 할 수 있다는 것입니다 그러나, 나는 구글 아니에요 또한 구글 아니에요

당신은 아마존이나 마이크로 소프트 아니에요 우리는 데이터의 hedabytes에 대한 액세스 권한이 큰 회사 중 하나 아니에요 그래서 많은 사람들이 다음, 음,처럼 다음 기계 학습 나를 위해 아니다 내가 구글에서 작업 할 때 그때 나는 그것을 할 것입니다 그리고 그들은 이동합니다

하지만 당신은 hedabytes 필요하거나 데이터를 반드시 기가 바이트하지 않습니다 기계 학습이 일을 얻을 수 있습니다 내가 당신에게 간단한 패턴을 제공한다면, 우리는 로직 게이트와 얘기하자 두 개의 입력, 0 또는 1을 취 그리고 그것은 하나 개의 출력, 0 또는 1을 반환합니다 그리고 말과 1과 1, 당신은 1을 반환합니다

내가 말하고 다른 입력, 당신은 나에게 공을 제공합니다 그것은 데이터의 매우 적은 양입니다 사실, 나는 하나의 비트와 입력을 나타낼 수 있습니다 그리고 표현 할 수 있으며, 우리는 10 비트 미만 말할 것이다 지금 당신은 전체 패턴, 완전한 패턴, 만약에 당신을 배웠습니다

그리고 그것은 당신에게조차 킬로바이트 미만했다 그래서 패턴은 많은 데이터를 필요로하지 않는다 당신이 볼로 복잡한 패턴은 어쩌면, 더 많은 데이터를 필요로한다 그리고 그것은 직관적의 종류입니다 그러나 우리는 가지 않고이 문제 과거를 얻을 수 있습니다 단지 더 많은 데이터를 수집합니다

우리는 시간과 시간 동안 앉아서 할 필요가 없습니다 라벨 가지 수동으로 모든 권리를 가고, 그 고양이입니다 즉 간다 즉 개입니다 그것은 여기에 표시됩니다 즉 삼각형입니다

왜 여기에있는 삼각형은? 당신은 실제로 그 일을 앉아서 할 필요가 없습니다 존재하는 모든 다른 기술이있다 그리고 나는 그들이뿐만 아니라 공개하지 않은 생각합니다 그리고 당신이 일의이 종류에 대해 알았다면, 어쩌면 당신은 처음에 기계 학습에서 외면 않았을 것이다 그래서 내가 거기에 열거 한 최초의 사람 중 하나, 이 데이터의 증가라고

화두처럼 들리는 것들의 또 다른 하나 당신이 그것을 버리고 그냥 같은, 내가 일부 데이터를 증강입니다 그리고 당신은 단지 종류의 이동 실제로 아무도 희망 그게 무슨 뜻인지 묻는다 그러나 모두가 정말 그냥 당신이 가지고있는 데이터를 가지고있다 및 종류의 새로운 데이터를 만들거나 패턴이 보존되어 있는지 확인하고 하지만 어떻게 생겼는지 변경 당신이 누군가의 얼굴 사진을 찍을 경우 그래서 제가 그 의미하는 것은 당신은 지점으로, 당신은 여전히 ​​그들을 인식 할 수있는, 그것을 밖으로 스트레칭

그러나 컴퓨터에, 당신이 그것을 밖으로 뻗어 각 픽셀은 더 많은 데이터입니다 지금이 사진을 찍은 나는 그것을 밖으로 뻗어했기 때문에 즉, 같은 사람이다 그러나이 두 개의 서로 다른 이미지입니다 나는 두 이미지를 비교한다면, 그들은 단지 비트가 아니다 동일한 비트별로 비교 그리고 중요합니다

그 기술 중 하나입니다 그래서 이미지를 스트레칭입니다 나중에에 대한 액세스를 얻을 수 있습니다 예제 코드 또는 배포 코드에서, 당신은 전용 전체 구성 파일이 있다고 볼 수 있습니다 당신이 당신의 데이터를 보완 할 방법 그들이 뭔가를 회전합니다 나는 옆으로 돌리면 여전히 삼각형은 삼각형인가? 네 그리고 얼굴과 같은 일

나는 당신의 얼굴을하고 난 거꾸로 아니라, 사람들을 켜면 우리는 거꾸로 자신을 켜고 당신의 얼굴을보고하려고합니다 그러나 같은 일이 기계와 그들이 어떻게 학습에 적용 할 수있다 나는 데이터의 조각의 데이터도 작은 금액을 취할 수 있다면, 나는 그것을 변화의 서로 다른 모든 방법에 따라 증폭 할 수 있습니다 색상이 무슨 상관하지 않는 경우 나는 그림 이모티콘을 사용하고 경우 그들이은 (는) 모든 색상이있을 수 있습니다

당신은 여전히 ​​이모티콘을 인식 할 수있다 그것은 노란색 또는 검은 색 또는 파란색 또는 분홍색하더라도, 여전히 웃는 얼굴 이모티콘입니다 하지만 난 그냥 준 특별한 경우에, 약간의 문제가있다 일부 이모티콘은 의미를 전달하기 위해 색상을 사용합니까 화가 난 이모티콘은 빨간색입니다

당신이 밝은 분홍색 같았다 성난 이모티콘이 있다면, 그것은 약간 다를 수 있습니다 우리는 다른 메시지를 얻을 수 있습니다 그래서, 당신은 당신의 데이터를 보강 할 때하는 것이 중요합니다 패턴을 변경할 수 있습니다 당신은 무엇을 염두에 두어야 어느 사람이 할 수없는, 실제로 이후에 당신을 어떤 정보를 제공합니다 그리고 그 똑똑한 데이터의 다음의 점에 온다 당신이있어 기본적으로 무엇이다, 수집 당신이 당신의 데이터를 보강 할 때 일 당신은 더 많은 것을 얻을 수 밖에 않을 것입니다

내가 데이터를 수집하는 경우 그래서, 난 그냥 이미지를 따기되었다 인터넷에있는 떨어져 종종 무엇인지 나는거야 나는 기계 학습 모델을 구축하기 위해 노력하고있어 경우 수행, 나는 아마 더 있지만, 올바른 종류를 수집 있는지 확인해야합니다 그래서 만약 내가 같은 고양이 30 개 사진을 수집하고 나는 말했다 이 고양이 또는 개 인 경우 모든 권리, 기계, 말해 데이터 수집이 매우 좋은하지 않습니다 난 그냥 같은 일을 포착했습니다 난 단지 그 정보를 가지고 있다면 심지어 인간은 물론, 같은 것입니다

난 그냥 그 고양이가 아니다 말할 것입니다 그러나 기본적으로 여기에 생각입니다 당신이 작은 아이를 가르치고 있다면 당신은 유아 무언가를 가르치거나한다면 또는 당신은, 대학생 복잡한 개념에서 전체 가르치는 경우에도 당신은 그들에게 패턴을 충분히 제공해야 것을 그들은 잘 때마다 얻을 수 있습니다 그들은 주어진하고있는 패턴에서 추정 할 수 있습니다 내가 있다면 그래서 당신에게 번호를 알려 sequence– 1, 1, 2– 다음 어떤 사람들은 갈 수도, 오, 그 피보나치 순서입니다

음 아니 그것은 1, 1, 2, 1, 1, 2입니다

그리고 그 패턴의 매우 종류의 인위적인 방법으로 몇 가지 예를 수 있습니다 내가 당신에게 충분한 정보를 제공하지 않았다 그리고 당신은 이미지를 사용하는 것은, 이런 종류의, 그 패턴의 많은입니다 그것은 눈 색깔이 될 수 있습니다 그것은 머리 색깔이 될 수 있습니다 그들이 사람들이하지 않은 경우? 그것은 모양이 될 수 있습니다

그것은 상황이 교차하는 각도 될 수 있습니다 거기에 많은 정보가있다 그리고 우리는 거의 즉시 그것을 선택하십시오 당신은 한 장의 사진을보고 당신은 같아 여기에서 400 패턴의 이름을 수 있습니다 당신이 생각하지 않는 경우, 오, 나는 정확히 400 개 패턴을 ​​알고 하지만 당신은 아, 그래,이 속성이있어, 열거 시작할 수 있습니다

이 속성이 하나있다 그래서 당신은 당신의 컴퓨터가 있는지 확인해야 충분한 데이터와 실제로 물건을 선택할 수있는 데이터의 오른쪽 종류 당신이 종류의 당신의 mind–를 좁힐 수 있다면 그에게 좋은 벤치 마크입니다 이 단지 좁은 minded– 수, 내가 말할거야 몇 가지 경우 중 하나입니다 오직 당신이있어 어떤 맥락에서 뭔가보고 당신은 아직도 그것을 알아낼 수 있다면, 거기에 아마, 주어진 기계에 대한 방법도 할 수 있습니다 그리고 당신은, 기계는 아마 중 하나를 수행 할 수없는 경우 그리고 자동화 된 데이터 수집이의 다음 솔루션 중 하나입니다 나는 충분한 데이터의 문제가 발생하지 않습니다

기본적으로 원래 때문에, 무력, 솔루션은 사진의 무리을하고 레이블을하는 것입니다 그리고 우리는 여기에 영상 분류와 같은 구체적으로는 약 얘기 기계 학습의 다른 종류가 있습니다 하지만 난 종류의 이미지를 향한이 더 준비하고있어 분류는 이해하고 직관에 조금 더 쉽게하기 때문이다 그래서 만약 내가 수동으로 이미지를 라벨했다 그리고 내가 전에 이런 짓을했습니다

그것은 끔찍 당신이 그것을 피할 수 있다면, 그렇게하지 않습니다 그러나 당신이 앉을 수있는 당신이 아니라, 이것이 A는, 말할 수있다, 이것은 B이다, 이것은 C입니다하지만 당신은 확인하기 위해 충분한 데이터가 필요 당신의 패턴이 완료됩니다 그래서 당신은 일곱, 여덟 시간 동안 그 일을 할 수 있습니다 그것은 끔찍한입니다

좋은 음악을 찾을 수 있습니다 그것은 수행하기가 조금 더 쉽게 것입니다 하지만 당신은 그 과정을 자동화 할 수 있습니다 나는이게 뭐야 모두를 생성 할 수있는 경우의 말을하자 우리는 편지의 일종을하고있는 recognition– 내가 100 개 다른 글꼴 26 개 모든 문자에 생성 할 수 있다면, 우리는 당신이 소문자와 대문자를 할 어쩌면 52 경우, 말할 것이다 그런 다음 내 모든 데이터 수집은 매우 간단합니다

버튼을 클릭하면, 그것은 이루어집니다 당신이 당신의 데이터 수집을 자동화 할 수있는 방법이 있다면 그래서, 그것을 할 그리고 지금 당신이 그것을 자동화 한 것을, 당신은뿐만 아니라 많은 데이터를 생성 할 수 있습니다 원하는대로 그리고 당신은 시간 제한이 될 수도 있습니다 컴퓨터가 더 많은 데이터를 배운다로하기 때문에, 그것은 더 많은 시간이 걸릴 수 있습니다 그래서 지금 당신은 당신이 수행해야 균형을 맞출 수 있습니다

내가 모델링 학습 더 많은 데이터를 생성하고 더 나은 기계를 얻을시겠습니까? 희망에 더 적은 데이터를 생성하고이를 빠르게 수행 할 수있다? 그리고 더 좋은 그것을하지 않습니다 그것을 더 많은 데이터를 제공하는 지점이있다 그러나 그것은 느린 만드는가? 그 시점에서 중지해야하기 때문에 그것은, 어떤 나아지고 있지 않은 경우보다 어쩌면 당신은 당신의 모델을 변경해야합니다 그리고 그 마지막 지점은 우리가 때때로 beefier에 모델을 필요로하고, 거기에 때로는 더 똑똑한 모델 그리고 그 다소 교환 때로는 수 없습니다 당신이 더 큰 더 무거운 모델을 사용해서, 그게 내가 가지 beefier에 무엇을 의미합니다

이 학습 일에서 더 나은 것을 의미하지 않습니다 단지 더 큰 사람들은 더 빨리 본질적으로 일을 배울 수 없습니다 그러나 나는 방법에 대해 조금 더 영리 모델이있는 경우 패턴에 데리러 빠른 수있는, 뭔가를 배운다 아마 상황에 따라 조금 더 잘 할거야 그래서 시스템에 대한 나의 마음에 드는 신화 우리의 일 중 하나 나는 또한의 일부를 차단하고있어 것을 배우는 것은 시간이 오래 걸린다는 것이다

나는 모델을하고 일을 얻고 싶은 경우에, 나는 시간과 시간과 시간을 훈련해야합니다 그리고 그것은 사실이 아닙니다 즉 사람입니다 사람들은 시간이 오래 걸릴 당신은 시간과 시간 동안 사람들을 훈련

기계 학습의 장점 중 하나는 당신이다 그렇게 오래 그들을 훈련 할 필요가 없습니다 많은 시간, 내 말은, 그것은주의로의 당신이 거대한 데이터 세트에 훈련하는 경우, 당신은, 특히 복잡한 모델을 훈련하고 시간이 오래 걸릴 수 있습니다 그러나, 우리는 CS50 최종 프로젝트의 일종을하고있는 주어진 이것은 당신을위한 문제가되지 않습니다 이것은이 프로젝트를 밀어 것이 아닙니다 당신의 이해의 도달의 그것은 실제로 단지 종류의 신화 것들 중 하나입니다 그 기계 학습이 너무 오래 걸립니다

그리고 병렬 신화의 종류는 컴퓨터 비전은 완벽하다 화상의 모든 데이터를 캡처한다 오른쪽 그리고이 병렬 것을 어쩌면 방법은 바로 분명하지 않습니다 그러나 같은 생각이 여기에 존재한다 컴퓨터 비전이이 개념은 어떤 데이터의 완벽한 표현이다 그것은 우리의 이해의 외부로 밀어 본다 그것은 완벽한 표현 인 경우 때문에 우리는 완벽한 표현에서 뭔가를 배울 수 없습니다, 그것은 드리겠습니다 아니다

뿐만 아니라 우리의 손을 던져 포기 수 있습니다 그러나 그것은 사실이 아닙니다 컴퓨터 비전은 조금 주관적이다 나는 내 컴퓨터가 보는 방법을 선택할 수 있습니다 나는 패턴을 집어 들고 얼마나 잘 선택할 수 있습니다, 얼마나 잘 전경과 배경이 무엇인지 구분합니다

당신이 데이터를 선택하려고 할 때 그 모든 것들이 놀이로 온다 그래서 우리는 더 많은 단지, 컴퓨터 비전의 매우 간단한 예제를 사용 당신에게 개방 CV2와 인터페이스하는 방법의 분포 코드의 맛을 제공합니다 그러나 그것은 존재한다 그리고 그것은 내가 특히 생각하는 무언가가있다 이미지 분류에 중요 그러나 우리는이 모든 일을 수행하는 소프트웨어를 선택 할 때, 심지어 그냥 컴퓨터 비전을 수행하는, 기계 학습을 할 수 일반적으로 프로그램으로, 그것은 우리에게 매우 중요 종류의 소프트웨어의 다른 조각 사이의 무역 오프를 볼 수 있습니다

이 프로젝트와 일반적으로 그래서, 나는 Keras 열기 CV로 이동합니다 그러나 후드 아래, Keras는 TensorFlow를 사용합니다 또는 적어도, 나는 그것이 TensorFlow를 사용합니다 당신은 또한 Theano을 사용하게 할 수있다 나는 Theano를 사용하지 않습니다

그것은 약간의 mathier입니다 그것은 내 지적 수준 조금 위였다 내가 생각 TensorFlow하지만 꽤 액세스 할 수있었습니다 나는 회사로 그냥 가지 일반적으로 그것을 좋아하지 나는 그들을 위해 작동하지 않습니다 맹세합니다 그들은 단지 정말 멋지다

그리고이 두 가지가 실제로 같은 혜택을, 내 관점에서 적어도 나는 단지이 모든 것들을 배우는 대학생이었다 다만 일반적으로 컴퓨터 과학을 학습 그래서 내가 아니라, 당신이 프로젝트가 존재하는 것을 알고, 같았다 내 TF를 물었다 그리고 그는 오, OpenCV의처럼 찾아 가서 같은 그 무엇을 볼 수 있었다

나는 기계에 할 수있는 뭔가를 배울처럼 그리고 나는 그에게 물었다 나는 AI를하고 싶어 오 AI가 조금 무서운 소리처럼 그는이었다 그러나 기계 학습도 무섭다 음, 하나를 선택하십시오

그리고 OK처럼, 우리는 기계 학습을 다하겠습니다했다 그리고 당신은 매우 차이가있어 알 수 있습니다 하지만 높은 수준의 인터페이스가 무엇을 의미하는지, 나는, 오픈 소스 생각 그것은 대중에게 열려, 나는 그것을 위해 지불 [들리지 않음]을하지 않았다 대학생 그러나 높은 수준의 인터페이스를 제공하는 무언가이다 내가 가지뿐만 아니라 여기에했던 것을, 제품, 유통 코드 내가 마지막에있을거야, 높은 수준에서 높은 수준의 인터페이스입니다 인터페이스를 제공합니다 그것은 접근 할 수 있다는 점에서 당신은 단지 모델을 구축, 말을해야합니다

그리고 그것은 후드 아래에 모든 것을 처리합니다 그것은 단지 그것이 의미하는 어떤 모델을 구축합니다 당신이 가고 싶다면 후드, 아래에보고하는 난 당신이 프로젝트로이를 구축하는 경우 당신이 할 것을 조언 당신은 무슨 일이 일어나고 있는지 볼 수 있습니다 그렇게하지 당신은 그냥 작업 할 경우에, 그이가하는 일입니다 나는 나의 수학에 한 잘못을 실시, 오, 쓰레기를 앉아서 말할 필요가 없습니다 여기 그래서 내 컴퓨터는 이제 모든 사각형 말한다

그 종류의 짜증나는 것처럼 그리고 어쩌면 그 두 가지 사이의 추적 당신이 사용하고 특히, 매우 어렵습니다 어쩌면 당신이 완전히 이해하지 않는 무언가를하는 알고리즘 당신은 그냥 수학의 많은입니다, 좋아 여기 앉아있어 그게 시그마 생각합니다 그리고 여기 또 다른 편지가있다

그리고 난 이유를 모르겠어 그리고 당신은 내가했던 위키 백과, 그것을 찾아 가고, 그냥 이름이있다 더 이상 수학의 실제 번호가 없습니다 그것은 모든 기호입니다 그리고 읽기가 매우 어려워진다 그리고 거기에서 액세스 할 수 없게됩니다

그리고 어쩌면 당신은 포기 또는 당신은 단지 좌절 그리고 당신은 케이크 한 조각을 먹고 이동합니다 그게 내가 무슨 짓을했는지 그리고 그것은 매우 실망입니다 하지만 소프트웨어의 두 조각을 선택한 주된 이유 그들이 사용할 수 있다고했다

나는 그들을 사용하는 방법을 알아낼 수있다 다소 아이러니 컬하게도 알아내는 방법들을 다운로드하세요 매우 어려웠다 고 나는 그렇게 20 시간을 보냈다 정말하지 않았다 때문에 틀림없이 그였다 시 문서를 읽는 방법을 알고있다 또한 코드를 통해처럼 읽는 방법을 몰랐다 GitHub의 페이지 또는 아무것도 같은합니다

하지만 내가 유일한 사람이 아니에요 것을 알고있다 사실 나는 대략 같은 장소에 대해 728 학생들이 지금 CS50라는 클래스이다 그래서 뭔가가 한 장소에 모여 한 생각 일을 설치하는 쉬운 방법 것과 훨씬 쉽게 소개합니다 그래서이 배포 코드는 무엇입니다 경우에는 분포 곡선을 찾고 당신이 내 이야기의 나머지를 듣고 싶지 않아, 이 강의의 끝으로의입니다

내가 거기에 도착 후이있을거야 당신이 경우에, 놀아 그러니까 기본적으로, 나는 모든 패키지를했다 OpenCV의 작업을 얻기 위해 설치 될 필요가 그들 중 많은이있다 그 하나는 정말 짜증나는 일입니다 Keras 괜찮습니다

당신은 그냥 잘 작동 Keras를 설치 pip3 좋아해요 OpenCV의 끔찍하다 OpenCV의에 대하여 아무것도 없다 난 아주 많이 프로젝트가 존재 함을 감사드립니다 나는 그것을 사용하는 얻을 슈퍼 흥분이있다

그것은 설치하는 엉덩이 단지 고통입니다 내가 젊고 순진 때 또는 적어도 그것은이었다 그리고 그것은 나에게 문서를 읽고 거기에 앉아 매우 힘들었다 하지가 특정 용어가 무엇을 의미하는지 알지 이 일을 설치하는 가상 환경을 사용하는 것이 무엇을 의미합니까? 왜이 필요하다? 나는 내 다운로드 휴식 않았다하지 않으면? 왜 다운로드가 작동하지 않는 이유는 무엇입니까? 주변에 던져 이러한 용어와 모든 것들을있다 그들이 가지고 있기 때문에 당연 나는 아주 무서운 것을 알고있다

그리고 적어도, 그것은 매우 실망입니다 그래서 나는 OK, 난, 말한 일을 결국 무엇을 단지 모든 솔루션을 시도가는 중 하나가 작동, 작동합니다 그래서 하나 개의 지점에서 내 컴퓨터 그것에 OpenCV의 40 개 다른 버전처럼했다 내가 생각하는 모든 프로그래머는 경험의 종류가 있었다 여기서 그들은 단지 사물의 수백을 다운로드했습니다 나는 한 지점에서 소스에서 내장

그리고 멋진 같았다 나는 이것이 무엇을 의미하는지 모르지만 나는 그것을했다 그리고 잘했다 즉 실제로 내 마지막 프로젝트에 사용 결국 사람이었다 당신이 무슨 일을하는지 알지 못한다면 내가 그 일을 권하고 싶지 않다

나는 끔찍하게 그것을 망쳐 그리고 난 그냥 OpenCV의의 누락 절반 것을 깨닫지 못했다 나는 분명히 필요하지 않았다 그러나 나쁜, 나쁜 거래처럼 그래서 결국 우리는 몇 가지 코드를 가지고있는 점에 입수했습니다

당신이 원하는 경우 bitly 링크가있을 수 있습니다 다음은 당신이 그들을 원하는 경우에 실제 슬라이드입니다 당신이 슬라이드에 갈 수 있도록 그들은 그들에 이러한 링크가 다음 링크를 클릭합니다 GitHub의 링크가 내 개인 GitHub의이다 나는하지 않았다 우리는 우리의 실제 이름 때를 사용하기로했다 실현 우리는 학교 GitHubs를 만들었습니다 내 이름은 셀의 강국이 아니다

실제로 닉입니다 그러나 나는 그것을 유지되었다 내 TF는 괜찮습니다 그래서 우리는 그것을 유지 그리고 이것은 bitly 버전, 약간 짧아입니다

내가 가지 조금 얘기를하는 동안 그래서 내가 거기 사람들을 떠날거야 그리고 결국 나는 몇 가지 코드를 끌어 올려서 우리는거야 코딩 일에 도착, 또는 적어도 코드가 무엇을하는지 데모를 제공합니다 내가 발견했습니다 당신이 실제로 사람들 앞에서 물건을 코딩 할 때, 당신은 초당 약 400 개 오타를 확인하십시오 정말 좋은 거래 만이 아니다 그래서 나는 다른 사람들 앞에서 특히 많은 코딩 좋아하지 않는다

그러나 당신은 GitHub의 기본적 것을에서 찾을 수 있습니다 매우 치즈 읽기 나 많은 파일 내가 필요했다 생각으로 나는 많은 그림 이모티콘을 포함했다 나는 일반적으로 그림 이모티콘을 사용하지 마십시오 내 GitHub의에 물건을 쓸 때 나는 또한 자주 사용하지 않습니다 그것은을 가진 유일한 하나입니다

그러나 GitHub의이 그림 이모티콘 등을위한 좋은 인터페이스를 가지고 있습니다 그리고 그 이유는 문제는 내가 알고리즘의 종류와 해결하기 위해 원 이 세미나에 대해이 기계 학습, 컴퓨터 비전 그림 이모티콘을 분류했다 그리고 그것은 매우 광범위한 문제입니다 그리고 나는 그것의 모든 해결되지 않았다 난 사실도 정말 해결되지 않았다

그러나 나는 그 길에 우리를 시작했다 그래서 나는 OK, 그럼 난 이모티콘과 함께 뭔가를하고 싶어했다 그 서늘함의 종류도 가지 dorky 엉덩이의 종류, 때문에 그리고 그 가지, 후자가 아닌 처음 두 날을 맞는다 그래서 나는 결국 내가 당신이 말한 일 우리가 존재의 그림 이모티콘 등 수백 분류하지 않을거야 무엇을 알고있다 우리는 15 개 행복을 찾고 것과 같은 걸릴거야 15 종류 중성 틱 ones– 나는 실제로 those– 13 다음 15을 얻을 생각 화를 내거나 부정적인보고 사람의 종류

우리는 그 세 그룹 클래스를 호출하는 것입니다 우리는 중립있다, 긍정적 인 무언가가있다, 말거야 과 부정이있다 그리고 나는 기계가 나에게 말할 수 있기를 원하는 것은 임의의 이모티콘입니다 나는 긍정적 인 중성 또는 부정적인에서 찾고있다 그리고 그 가지 사소한 것 같다 인간은 그 모든 시간을

그리고 우리는 너무 그것에 대해 매우 주관적입니다 나 그냥 화가 나서 좋아하는 우리는 같은 종류, 우, 그 사람이 그녀가 찾고 있습니다 그는 단지 그에게 공격적인 얼굴처럼 있어요 그는 그냥 차게 자신의 차를 홀짝입니다 당신은 그녀의 신발을 엉망

뭐 그런 우리가 인식하기가 매우 어려울 수 있습니다 그리고 심지어 예에서, 그 완전히 주관적이다 내가 방금 말한 것은 기본적를보고 누구에게 달려 있습니다 이 어려운 문제가된다 어디에 즉, 이 일하러 가야하기에 충분한 데이터를 제공 할 방법이다 그래서 실제로 disservices의 몇했다 이 코드의 당신에게, 사용자

하나, 당신이 잘, 함께 제공되는 기계, 그것은하지 그것을 아주 잘 수행, 작동 않고 훈련을 배우게됩니다 말은 기본적으로 무작위로 추측합니다 그것은이 33 %의 확률로, 그 33 %의 확률로, 나도 몰라, 그것은 관하여, 말할 것이다, 당신이 알 수 있습니다 그 중 33 %의 확률로, 세 가지, 세 가지 범주에서 100 %, 약 33 %가있다 그래서 기계는 그것을 알아내는 아주 좋은 일을하지 않습니다 내가 데모 거라고 하나의 시험 때 그리고 가끔 발견되는 때로는 기계는 실제로 당신을 제공하는 것 그냥 완전히 잘못 얻을 수 있지만, 그 슈퍼 확인 같아요

, 나는 매우 행복을 찾고 이모티콘주고 그것 같았다 나는이 음수 100 % 확신한다 바로 거기에 부정적인 표정 이모티콘 그리고 그 재미있는 것 중 하나의 종류입니다 나는 많은 시간이 때 기계 학습을하고있는 것으로 생각 당신은, 특히 성가신 유아 유아를 훈련하는 것처럼 당신은 그 느낌이 주위에 자체에 정말 위험 또는 아무것도 아니다 그러나 특히 당신을 싫어한다 사실, 당신이있어 어떤 과제 결코 있는지 확인하고 싶어 노력하는 수행 할 수 있습니다

즉 특히, 나는 종류의 기계 학습 작품을 배운 방법 나는이 존재 작업을 할 때처럼, 오, 쓰레기 내가 가르치는 세미나가 있습니다 이 작동되지 않았습니다 그것은 단지 내가 원했던 일을 거부했다 그리고 그것은 매우 실망했다 그러나 뭔가이 유아 비유와 평행선을 많이 공유하는

당신은 유아 모든 시간이 걸릴 것 인 경우 단지처럼 그들은 단지 당신이 그들이하고 싶었던 일을하지 않았다 좋아요, 점점 새로운, 그리고 단지 같은 새로운 유아 가서, 그 여러 가지 방법으로 이상한거야 너무 또한 가지 이상이와있다 그것은 좀 덜 극단적이다 당신은 아무 문제가 기계를 거래 할 수 없습니다 하지만 당신은 내가 당신을 건네 한 기계가 실제로 않는 것을 확인할 수 있습니다 수정할 수있는 몇 가지가 그 안에이 훨씬 더 확인합니다

그리고 방금 복사 한 것을 의미하고 반복해서 같은 층을 붙여하지 않습니다 다시 더 이상 기계를 만들지 만, 오히려 조금 더 영리 할 수 ​​있습니다 그러니까 기본적으로, 우리는 machines– 훈련 또는 때 내가 때 training– 나는 우리를 말한다 나는 기계 모델을 훈련 내 방처럼 외로운 때 나는 I 의미 나는 어떻게 든 일이를 얻을 수있어, 모든 권리를 말하고 있었다 내가 할거야 모르겠어요

아시 경우에, 나는 약 15 이미지를했다 말했다 긍정적 중성 슬픈 그래서 45 개 이미지가 대략 총했다 즉 데이터의 매우 작은 양의 종류입니다 그래서 실제로 code– 일부 기술을 사용 내가 노력하고 내가 가서 때 there– 그들을 지적거야 그것은 내 데이터를 보완 할 수 있습니다 우리는 첫 번째 단계를 수행합니다

우리는 우리의 데이터를 증강 내가하지 않았다 매우 좋은 데이터를 추가했다 내 데이터 수집 내 게으름의 부분적 제품 하지만 지금은 소급, I의 제품은 원 그것은 가르치는 순간이었다, 가르치는 것은 데이터입니다 많은 생각없이의 임의의 종류의 수집 패턴이 포착되고 있었다 무엇인지에 당신이 경우 내가 가지, 두 번째 규칙 내 자신의 종류를 무시했다 난 그냥 게으름 때문에 그리고 네, 그 대부분입니다

난 그냥 데이터의 무리를 선택하고 같은 거기에 그것을 던져했다 그것은 일을 바랍니다 그리고는 잘 작동하지 않습니다 그 전략은 대단히 도움이되지 않습니다 그 하드 그것에 대해 생각하지 않았다 그러나 당신은 최소한 그것에 대해 생각으로이 얻을 수 있습니다

당신이 웃는 얼굴 이모티콘이있는 경우, 예를 들어, 우리가이 경우에 이것에 대해 얘기부터, 그것은 충분히 다른 웃는 얼굴을 찾기 위해 너무 어렵지 않다 일반적인 경우를 포함한다 그것은 대부분 자신의 얼굴의 바닥에 그 웃는 작은 반원입니다 당신은 여전히 ​​작은을 유지 할 수있는 동안으로 그리고 많은 데이터를 포함하는 그 어려운 일이 아니다 당신은 그것에 대해 조금 더 똑똑해야 보다 내가했다 그리고 데이터가 그 GitHub의 페이지에 포함되어 믿습니다

그래서 당신은 거기뿐만 아니라 내 허접스런 수집 된 데이터를 볼 수 있습니다 난 정말이 저작권 문제가 아니에요 바랍니다 누군가가 나를 체포 나타나는지 우리는 알게 되겠지 그래서 우리는 실제로 실제 GitHub의 페이지보고로 전환하는 것입니다 cheesiness이 들어오는 곳이있다

나는 기계의 느낌을했다 나는 그 날 좀 dorky 느끼고 있었다 나는 매일 약간의 dorky 느끼고있다 그리고 나는 쓰레기, 오, 좋아했기 때문에 내가 할 수있는만큼 많은 이모티콘을 포함했다 마찬가지로 당신은 가격 인하에 이모티콘을 포함 할 수 있습니다

그건 괜찮아요 그래서 나는 거기에있는 사람들을 통해 그리고 당신은 당신이 원하는 경우 자신이 읽을 수 있습니다 어쩌면 당신은하지 않습니다 그렇게하지 않으면 나는 저를 비난하지 않는다

바로 여기가 txt이 요구 사항이 있습니다 그리고 그건 당신이 기본적으로 그냥 바로 설치할 수 있습니다 이 전체 프로젝트에 대한 모든 요구 사항 이게 다예요 구글 또는 아무것도를 통해 검색의 어떤 20시간 없습니다

그냥 그 그리고 우리는 우리의 소스 폴더가 있습니다 그리고 원래 좀 골격 코드를 제공하려고 했어요 가지 실제 코드를 보완합니다 나는 시간의 부족 때문에 나는 그 반대 결정했다 그리고 나는 또한 약간의 의미라고 생각했다

그래서 그 대신 우리는 완벽하게 작동 샘플 코드가 있습니다 그리고 나는 조금 밖으로 물건을 분리 한 그냥 쉽게 무슨 일이 일어나고 있는지 이해 할 수 있도록합니다 그리고 바로 여기에 최대, 상단에, 당신이 기본적으로 컴퓨터 비전 폴더가 있습니다 거기에 단 한 가지가있다 그냥 기본적으로 컴퓨터 비전을 제공하는 것입니다 우리의 코드에 속성

그리고 당신은 데이터를 가지고있다 그래서 우리는 짧은 여기에 살펴 보겠습니다 그것은 매우 큰 아니에요 테스트 데이터가 훈련 데이터가있다 그것은 꽤 밖으로 분할합니다

그러나 당신은 기본적으로 pngs 단지 무리하다고 볼 수 있습니다 이 사람은 꽤 슬퍼 발생합니다 그리고 그들은 같은 높이와 너비를 볼 수 있도록 모든립니다입니다 그들은 200 개 픽셀 모든 200입니다

나는 그것을 추천 할 것입니다하지만 당신은 그렇게 할 필요가 없습니다 당신이에서 정상화 할 수있는 것들 중 하나로서 크기가 무엇 때문에 데이터가 다른가요? 그 다루는 기술이있다 당신은 다만 적당한 비율로 축소 할 수 있습니다 당신은 가지의 다양한 종류를 할 수 있습니다 당신이 할 수있는 경우에, 당신은 일에 걸쳐 꽤 일관성있는 데이터를 보존하려면 그것은 중요하지 않습니다

그래서 여부 같은 것은이 크기 또는이 크기는 여전히 슬픈 얼굴의입니다 그것은 여전히 ​​부정적이다 그래서 분류는 그것이 무엇인지 크기에 정말 의존하지 않습니다 그래서 난 내 데이터 같은 크기의 모두를 유지하고 싶어 그래서이 경우에 기계, 오, 같은 것을 201 개 픽셀이 이미지는 그 슬픈이다 400 픽셀입니다 이미지, 그들은 행복하다

그 때문에 그건 정말 불행한 일 우리가 쫓고있는 실제 패턴 근처에도 없습니다 그리고 당신은 심지어 복잡한 예를 이해할 수, 당신은거야 패턴이 문제가있는 인식 할 수 있어야합니다 그리고 어떤 것들하지 않으며, 어떤 사람은 당신이 실제로 도입된다 당신의 모델로 그리고 그 가지 복잡한 소리가 있습니다 하지만 난 그냥이 준 예, 너무 어렵지 않다 이미지의 크기가 실제로하지 않습니다 있는지 만들기 실제로 배우는 것의 기계 학습의 종류로 재생할 수 있습니다

그것은 매우 직관적이다 그리고 이들의 대부분은 같다 그들은 꽤 직관적입니다 이런 종류의 프로젝트, 그것은 복잡한의 종류를 소리에도 불구하고 너무 나쁘지 않다 당신이 만드는 경우 특히 복잡하지입니다 그것은 유사 인간 또는 유아를 좋아합니다

당신은 당신의 젊은 조카, 조카, 딸 등 생각할 수 당신이 아이, 형제, 형제, 작은 사람, 작은 인간의 존재가 있다면, 당신은 그들을 가르치는 방법에 대해 설명합니다 당신이 아이를 가르 칠 수 있다면, 당신은 아마 수 몇 가지주의와 기계를 가르칩니다 그래서이 폴더의 나머지 부분에서, 우리는 ML 있습니다 그것은 바로 여기 주위에 있었다 그것은 단지, 단지 기계 학습 부분입니다

이 모든 기계 학습 부분을 수행한다는 점에서 파일이있다 우리가 그냥 아주 높은 수준의 모델을 가지고하는 나는 클래스를 만들었습니다 그러나 그것은 또한 당신에게 충분히 낮은 수준을 제공합니다 당신을 모델 자체 수리를 할 수 있습니다 그래서 당신이 원하는에 따라 달라집니다 그리고 우리는 그것의 내부 변수의 무리가있는 구성 파일이 있습니다

우리는 약간의 내부를 살펴 수 있습니다 그리고 우리는 우리의 실제 실행 파일이있는 우리가 소프트웨어의 전체 조각을 실행할 수 있습니다 그리고 제가 이전에 사용하던 단지 테스트 이미지입니다 testpng 있습니다 나는 귀여운의 그것의 종류를 떠났다

그래서는 GitHub의에 모든 코드입니다 당신은 그것을, 다운로드 풀 요청을 복제하려면 환영합니다 바람직하게는 이익을 위해 그것을 판매하지 않습니다 당신이 경우에, 그건 정말 멋지다 나는 그것이 작동하는지 그냥 자랑스럽게 생각합니다 그런 것들의 어떤 굉장합니다

그러나 우리는 실제로 여기에 코드를 조금 보여 것입니다 그래서 실제 코드의 디렉토리에 이미입니다 당신이 GitCloned 한 것 인 경우에 그래서, 당신은 좋겠 여기 어딘가에 만난다 그래서 이것은 루트 디렉토리의 실제 종류이다 나는이 지루한 터미널 화면의 종류 알고 하지만 곧 더 흥미로운 얻을 것이다

그래서 여기에 당신의 파일 만 잔뜩있다 볼 수 있습니다 즉, MIT는, 읽기가-나를 말하는 어떤 라이센스 알려 과 같은 몇 가지 여기 캐싱, 소스 파일 및 요구 사항이있다 우리는 소스 때문에 SRC로 갈 것입니다 그리고 우리는 실제로 샘플 디렉토리에 특별히 갈 것입니다 우리가 시작했던 곳 그리고 우리는 돌아왔다 내가 이것을 실행하기를 원한다면 그래서, 나는 기본적으로 네, 오, /run

py 그리고 – 말할 수 있습니다 내가 말했듯이, 사람 앞에서 입력, 당신은 너무 많은 실수를합니다 그리고 이것은 우리의 도움말 화면의 종류를 나타납니다 이는 가능한 한 비 모호하기위한 것입니다 조금 애매한 될 수 있도록 그러나, 나는 전문가는 코더입니다 없습니다 하지만 사용하기 아주 쉽게 할 의도

그래서 출력 파일에 대한 -o있다 그리고이 소프트웨어 물건의 모든 단지 일종이다 특히 흥미로운 것은 아닙니다 당신이 이후에 관심이 있다면, 가서 알려 주시기 바랍니다 그리고 나는 그것에 대해 당신과 얘기 할 수있을 것입니다

그냥이를 실행하기를 원한다면, 그때 우리는, 음, OK, 말할 수있다 내 출력 파일이 세미나가되고 싶어요 그리고 그것을 통해 가고 싶은, 우리는 교육의 한 라운드를 말할거야, 다음 45 분 동안 여기 앉아서 할 너희들하지 않는 한 그리고 나는 또 다른 모델이 이미 존재 하나를로드하지 않습니다 나는 그냥 가지 자신의 일을하고 싶습니다 그리고 정말 할 필요합니다

명령 줄에서, 그게 훈련 할 것이다 그리고 나는 그 말을이는 한 번있을거야 그것을 절대적으로 환상적인 휴식 그러나 TensorFlow 백 엔드를 사용하는 것 있음을 알려줍니다 내가 그것을 건네했던 모든 데이터를 발견했다 그리고 지금 훈련을 시작한다

나는 그것이 종류의 동행입니다 생각하기 때문에 내가 이것을 가져다 이유는 이러한 것들의 각각의 의미를 아주 확실하지 않다 그리고 어떤 종류의 재미 것은 어쨌든 이러한 메트릭의 각을 사용자 정의 할 수 있습니다 그러니까 기본적으로,이 화면을보고하는 경우, 당신이 경우 당신은 멋진 작은 애니메이션의 자신의 종류를 참조하십시오 그러나 이것은 정말 당신에게 훈련 라운드를 통해 얼마나 많은 단계를 말하고있다 그것은이라도 [? 신기원 또는?] 에픽은 일반적으로 실제 훈련이 될 것입니다 이에 라운드

그래서 훈련 내내 내 컴퓨터는 기본적으로 모든 오른쪽 말하고있다 난 당신이 지정하는 데이터의 일부 금액을 제공하고 있습니다 그리고 나는 도대체이게 무슨 뜻인지 알아낼 수있어 나는 그것을 분류 할 수있어 그리고 그것이 무엇을하면 거기에 앉아이며 흠, 그건 고양이처럼 보이는 말했다 즉 새입니다

즉 개입니다 그리고, 또는이 경우에, 그는 중립이다, 즉 부정적, 긍정적입니다 그리고 그 답을 던졌습니다 그리고 그들을 인코딩 somehow– 0, 1, 2, 완전히 합리적인 그리고 그것이 무엇을 그것이 확인, 여기 내 대답은 모든 데이터에 있습니다 말한다 나는 손으로 봤는데

그리고 그것은 답변 본다 그리고 오, 쓰레기, 나는이 일이 하나,이 하나를 놓친 말했다 그래서 몇 가지 마술을 할 수있어 나는 다시 무게 내 번호의 일부를거야 좀 하드 코어 수학 물건을 할거야

그리고 나는 다시 시도거야 그리고는 새로운 교육의 라운드입니다 이제 각 막대 또는 각 행의 오른쪽 방향의 종류를 알 수 있습니다, 이 발 손실과 모음 ACC가있다 그리고 그들은 여기 손실과 ACC에 해당합니다 손실 존재는, 음, 어떤 손실은 실제 알고리즘에 사용되는 메트릭입니다 또는 수학 아래

그리고 ACC는 정확성이나 주어진 모델의 정확성되는 절대적으로 이미지의 어떤 종류를 이야기하려고하는 것을 그 여러 범주와 함께입니다 그리고 당신은이 모델을 빌드 파일 내에서이 모든 것을 지정할 수 있습니다 하지만 지금 우리는 그대로 만 가지 걸릴 것입니다 당신은 예를 들어, 그 정확도 메트릭을 사용할 필요가 없습니다 그 각각의 발 버전은 검증 버전입니다

그들은 여기에, 말하는 것, 모든 권리있어 당신이 전에 본 적이 한 어떻게 당신은에해야합니까? 그리고 그 하나, 그것은 그 가중치를 재조정하지 않습니다 그건 그냥 조금 평가합니다 그것은 당신이 overfitting하지 않을 것을 확인합니다 그래서 던져진 첫 번째 항이었다 날 때 나는 이것이 배우고 시작했다 무엇 그것은 당신의 데이터를 overfit을 의미 하는가 그리고 그것은 직관적의 종류입니다

당신은 너무 많은 피팅하고 있습니다 그리고 당신은 피팅으로이 교육 과정을 생각하면, 당신은 단지 그것을 너무 많이 훈련하고 있습니다 그리고 당신은 유아와 등이 생각할 수 당신이 그것을 제한된 패턴을 너무 많이 주면, 어쩌면이다 당신은 모든 것이 너무나 종류의 것으로, 기계를 말한다 당신은 그것을 가져 모든 데이터 조각을 제공합니다 그리고 그것은 단지 데이터가 아니라 실제 패턴을 기억합니다

사람들은이 모든 시간을 당신은 그들이 그 사실을 기억, 그들에게 화학 사실의 무리를 제공합니다 당신이 그 사실을 그들에게 외삽을 요구하는 경우에, 그들은 아무 생각이 없습니다 이는 특히 예를 들어 공립학교 시스템에서, 매우 일반적인 문제입니다 작은 정치적 잽

그러나 너무 기계에 일어나는 일입니다 그들은 단지 자신의 데이터를 기억 끝날 경우, 예 그들은 적어도 메트릭 손실 정확도의 종류에, 바로 그것을 얻을, 하지만 그들은 바로 검증의 정확성을받지 않습니다 그 물건 때문에 그들은 한 번도 본 적이 없어요 그들은 그것을 기억 수 없었다 그것은 기본적으로 테스트 복용 뒤에 같은 생각입니다 나는 당신에게 데이터를 제공합니다

난 당신이 패턴이 아닌 실제 데이터 내용을 기대합니다 그리고 나는 당신이 전에 본 적이 데이터를 가지고 테스트를 제공 하지만 같은 패턴을 가지고, 당신은 그것을 알아낼 수 있어야합니다 그래서 당신은 볼 수 있습니다 또는 불행하게도 그것은 종류의 다음까지 잠겨있어 하나는, 그러나 우리는 이러한 03S 열로은 거의 동일 대략 것을 말하는 것입니다 당신은 0

32, 035, 038, 038처럼, 그들이 알 수 있습니다 그리고 당신은 그들이 대략 추측하고 알 수 있습니다

나는이 하나가 중립적이라고 말한다면 기계는 기본적으로, 헤이, 말하는 이 하나,이 하나의가 positive– 중립적, 부정적 부정적 양– 난 그렇게 좋은하지 않은 것이 거의 제대로 나는 당신을 건네 모델이 아니라이기 때문에 그것은이다 특히 지적하지 또한 데이터를 아주 잘하거나 수집하지 않습니다 그리고 당신은 심지어 accuracy–을 알 수 있습니다 정말 모든 것을 암기 할 수있는 기회를하지 않았다, 하나님 – 감사합니다 여전히 매우 낮다 그것은 대략 여기에서도 추측입니다

그래서 너무 좋지 않다 그리고, 나에게 물었다 나는 모델을 저장 하시겠습니까 그리고 당신은 기계의 신화에 대한 하나의 나의 점을 알 수 있습니다 그 오랜 시간이 걸리지 않았다 학습 우리는 몇 분 여기를 얘기했다 그리고 그것은 이루어집니다 그것은 지금 훈련입니다

그래서 지금 우리는 컴퓨터 비전 부품의 종류가 내가 함께 해킹했다이 때문에, 다소 성가신이다 하지만 괜찮아요 그것은 지금 일어나고 그래서 우리는 화면의 라이브 피드의 우리의 종류가있다 그리고 이것은 우리가 사물의 사진을 촬영할 수 있습니다 그래서 실제 스크린 샷 소프트웨어가 즉, 즉 이것보다 쉽게 ​​사용할 수 있습니다 하지만 컴퓨터 비전의 아이디어를 소개하는 나를 위해 쉬운 방법이었다 특히

그래서 내가 할 수있는 것은 내가 모든 권리, 말의이 이모티콘을 끌어하도록 할 수있다 나는 그 이모티콘과 I의 사진을 먹고 싶어하기 때문에 내 컴퓨터가 이모티콘이 무엇인지 말해 싶습니다 그것은 긍정, 부정 또는 중립인가? 그리고 구글에 웃는 이모티콘을 말할 수있다 그리고 나는이 라이브를 수행 이유는 내가 당신에게 증명하는 것입니다 단지 기계에 하드 코딩하지 않았다 나는 그것이 올바른받지 않습니다 거라 확신

그러나, 명성을 수행합니다 그래서 우리는이 이모티콘이있다 그리고 당신은 바로 여기 위에 우리의 피드에 팝업 볼 수 있습니다 실제로 나는 시간의 무한한 수를 생각 팝업 당신이 좋아한다면 충분히 가까이 보인다 하지만 이유 나는 피드에 팝업이 내가 실제 공급을 통해 드래그 할 수 있으며 그 사진을 선택했다는 것이다

그리고 그것은 그 사진을 촬영합니다 아, 내가 잘 한 것을 가지고 너무 흥분 해요 즉 점등시킵니다 그래서 당신은 실제 터미널 출력 것을 알 수 있습니다, 그것은 나에게 일이있는에 정확하다고 확률했다 포지티브 또는 네거티브 또는 중성 나는 그것이 바로 정말 높은 확률로 그것을 가지고하는 것이 정말 흥분 해요 당신은 70 %의 확률과 같은 위의 경우 레이블 충분히 좋은 번호를 가지고, 당신은 꽤 흥분해야한다

이 94 %의 확률로 멀리있어 사실, 그것은 아마 추측했다 그것은 유아 나처럼, 그 하나의이 작은 아이처럼입니다 그리고 그들은 올바른 될 일이 그래, 난 그렇게 똑똑처럼 그리고 그들은입니다 이 기계처럼, 정말 위대한 아니다

그러나 신용과에 세미나의 신용이다 우리는 내가 아주 작은 데이터를 처리 한 바보 같은 기계를 가지고 나는 우리 모두의 앞에 사분 등의 총 훈련을했습니다 그리고 그것이 바로 얻었다 물건을 알아낼 수 있었다 이 패턴을 알아 냈다 그리고 그것은 또한 약간 부정적 수도 있다고 말했다

그리고 당신은 공유하는 몇 가지 속성이 있다는 것을 알 수 있습니다 웃는 얼굴과 찡그린 얼굴들 그들은 둘 다 눈이 특히 그림 이모티콘에 꽤 표준입니다 그들은 같은 거친 형상을 갖는다 그들은 같은 색상입니다 그리고 그들은 종류의 미소 또는 빈축 동일한 폭을해야합니까 심지어 서로 다른 방향에서 비록

그래서 기계는 끔찍한 일을하지 않았다 그리고 견과류의 종류입니다 그리고 잘하면 그게 액세스 할 수 있는지 작은 방법 적어도 증명 쉽게 할 수 있습니다 당신은 거기 앉아서 코드로 수리를해야 할 수도 있습니다 하지만 당신은 코드 땜질 거기에 앉아하지 않는 경우 당신은 정말 코딩? 당신이 거기에 앉아 일을 디버깅하지 않는 경우, 당신은 왜 여기? 그래서 디버깅 코딩의 좋은 금액입니다

그리고 이것은 단지 코드의 다른 부분처럼, 심지어 단지 프로그래밍을 시작한 사람에 의해 수행하고 디버깅 할 수 있습니다 당신은 아마도, 몇 시간이 수준에서이 작업을 수행 할 수 있습니다 며칠 당신은 조금 연구하고 말을해야 할 수도 있습니다 아, 쓰레기, 그것은 무엇 overfit을 의미 하는가 그 사람은 고양이와 삼각형에 대해 이야기 미친 친구, 무엇을 말 했는가 잠시 동안? 글쎄, 그건 괜찮아요 이것이 어떻게 작동하는지 때문이다

그러나 내가 말한 경우, 오, API를 사용하는 이동보다 더 어렵지 않다 나를위한 PUT 요청을 통해 일부 정보를 검색 할 수 있습니다 그냥 복잡한 소리로 그러나 그것은 모두 같은 생각입니다 당신은 앉아서 조금 그것을 배울 수있다 그리고이 경우, 당신은 꽤 괜찮은 예제를 가지고있다

그 전 – 그게 그 일한 행운의 종류이라고 강조 gonig하고있다 나는 그것의 매우 자랑스럽게 생각합니다

하지만 여전히 종류의 말도 그래서 우리가 이미 존재하는 모델을 개선하고 싶다고 가정 해 봅시다 그래서 많은 기계를 많이 쓴 나보다 똑똑한 사람들이있다 학습 알고리즘 나는보다 더 지능적인 사람들은, 내가 주장이있다 보다 작 이런 짓을했는지입니다 그래서 사실은 그 사전 교육을받은 모델 중 하나를 포함 내가 생각하기 때문에이 종류의 멋진 데모를하는

그래서 코드에서 실제로 당신이 그 사전 훈련 모델을 끌어 할 수있는 능력을 가지고있다 그것은 셉션 V3라고 나는 그들이 그 전화를 꽤 나쁜 엉덩이 생각합니다 다른 사람의 많은 그런 VGG16 물건 같다 그러나이 하나 인 셉션 V3라고합니다

나는 그 이름의 소리를 좋아한다 그래서 당신은 플래그, 사전 훈련 플래그이 프로그램을 실행할 수 있습니다 그것은 TensorFlow 모델이기 때문에 아직 말을 TensorFlow을 다시 가져옵니다 TensorFlow는 Keras의 기본 기계 학습 소프트웨어 인 또는 적어도 방법 나는 그것을 디자인하는 그것은 여전히이 경우에이없는 경우에도 데이터를로드 우리가 다른 데이터 조각을 찾으려고하기 때문이다

정말 모델을 저장하지 않습니다 그것은 조금 큰입니다 그러나 그렇게 같은 피드를 가져올 것 내 화면의 사진을 찍을 수있다 우리가하려고했던 그리고 기본적으로,이다 우리는 고양이의 사진, 특히이 고양이를 끌어 것입니다 난 정말이 고양이를 좋아한다

그것은 귀여운의 종류입니다 그래서 이것은 이집트 고양이입니다 내 마우스를 걸릴거야 그리고 제가하고 싶은 것은, 나는, 클릭을 통해 끌어거야 나는 그 고양이의 사진을 찍을거야 그리고 내가 할 수있는 것은, 그때 내가 말할 수있는 모든 권리입니다 의 내 컴퓨터는 그것이 말을 살펴 보자

주의 깊게 읽어 줄 테니한다면,이 다섯 개 레이블을 반환합니다 이 액세스 할 수있는 1,000 라벨이 실제로있다 그냥이 다섯 아니에요 난 그냥 상위 5 개를 골랐다 그리고 당신은 그 아래 하나가 동안 알 수 있습니다 가장 정확한 것이 아니다 잘못이 아닌 윈도우 화면,,, 근처에도 안

이 때문에 비율,하지 분수입니다 지금까지 가장 가까운 사람은 약 94 % 또는 동일한 정밀도로했다 내 다른 모델을 가지고있다 그리고 그것은 이집트의 고양이입니다 그리고 그 기계 학습의 강력한 부분 중 하나입니다 빨리 이전보다 더이었다이 모델이다 그리고 그것은 고양이의 단지 임의의 사진을 가지고 나는 94 %의 정확도로 올바른 인터넷을 고른 것이다

즉 너트입니다 난 그냥 무작위로 사진을 찍었 후를 포착하고 그것을 작동합니다 그리고 내가 강조하고 싶은 점은 정말 여기 인정 하듯이, 몇 분에 나는 잠시 동안이 수험 공부의 장점을 했어 당신은 여기 앉아서하는 알고리즘을 구축 할 수 꽤 정확하게 사물을 식별합니다 그래서 당신은 얼굴 인식 소프트웨어 알고리즘을 구축하기를 원한다면 그것은이 있습니다 이 같은 생각입니다

당신은 데이터를 변경합니다 그리고 당신은 당신의 모델을 약간 변경합니다 조금 더 똑똑합니다 특히 직면 것이 더 적합합니다 그러나 그것 뿐이다

그건 정말 여기에만 큰 차이입니다 이 개념이 유행어, 기계 학습, 컴퓨터 비전, 그들은 컴퓨터 과학 초보자로서 당신과 나에게로 접근 할 수있어 그들은 컴퓨터 과학의 년의 무리를 수행 한 사람에게 그대로 어쩌면 컴퓨터 마법사입니다 어쩌면 그들은 그것으로 쿨러 물건을 할 수 있습니다 그들은 API와 다른 약어 무서운 소리가 나는 단어의 모든 종류를 넣을 수 있습니다 그 뒤에 그것은 아래 같은 일입니다

기계가 작동합니다 그것은 모든 단지 결정적으로, 일하고있어 잘하면 당신이 그것을 원하는 방식으로 내가 생각하기 때문에 그래서 우리는 코드를 모든 조금있어 것을 그 가치있는 노력이다 이것은 또한 당신이있어 무엇 이사 확인할 수 있습니다 최악의 방법처럼 이 정당의 같은 느낌 때문에하지만 같은 시간에 이야기하고있다 난 비주얼 스튜디오의 코드를 사용합니다 그리고 난 정말 말도 열린 같은 것을하지 않아도 바랍니다

우리는 단지 그것을 조금 확장 읽기 쉽게 만들 것입니다 그래서 우리는 코드가 있습니다 그리고 이것은 보통 사람들이, 모든 권리와 같은있는 부분이다 지금은 밖으로입니다 우리는 거기에 도착, 우리는 완료됩니다 그리고 당신은 끝내하지 않은 경우

나는 수학이 당신을 멀리 무서워 한 것이라고 생각했을 것이다 그리고, 어떤 수학이 없다는 것을 보여준 이후 나는 당신이 여기 아직도 것으로 기대하고있다 그래서 우리는 꽤 임의의 파일을보고 여기 앉아있어, 그러나 이것은 실제로 ML 모델 파일입니다 그래서이 실제로 당신이나를 알려주는 파일입니다 실제 모델의 모든 속성에서의 코드가 이 모델의 저장 방법을 가지고있는 클래스이다

그것은을 구축하거나 데이터를 예측하는 부분이있다 그것은 모든 일을 가지고 당신은 어쩌면 수 우리는 단지 예제를 보여 무엇을 얻을 필요가있다 그래서 우리는 여기에서보고 제가 가지에 우리의주의를 환기 할 것 바로 근처에 있습니다 이 부분에서 찾고있다 이것은 꽤 많은 방금 본 모델의 대부분이다

이게 다예요 당신은 빈 줄을 계산하지 않으면, 코드의 단 5 줄의 내 마우스는 모든 것을 강조 그래서 아주 간단합니다 그것은 매우 간단합니다 이제, 이러한 용어가 많이 어쩌면 조금 더 복잡하다

맥스 밖으로 드롭 풀링 그리고 당신은 팬케이크처럼 평평 그리고 당신은 무언가의 밀도가 하나님이 무엇을 알고 할 당신은 그 활성화하지만 풀 크기는 여기있다 이 임의의 숫자가있다 나는 그것이 마법 생각합니다 난 이유를 모르겠어 그리고 그것은 매우 매우 빠르게 복잡해진다

그러나 다시, CS50에서와 문제 추천하기 추천, 정말 더 작은 조각으로 그것을 깰 의 코드의 어쩌면 가장 쉬운 부분부터 시작하자 here– 단조롭게 하다 이 인수가 없습니다 그래서 우리가해야 할 일을했을 모두 펼치기를 추가했다 그리고 어쩌면 쉽게 왜 우리는 모델 일을 추가한다

이 모델은 어떻게 작동합니까? 당신은 레이어의 스택 등 생각할 수 있습니다 그리고 당신은 당신의 스택 지향 방법에 따라 입력을 받아, 하지 리터럴 물리적 스택 같이 누적 데이터 구조 당신은 하나의 입력을 삭제하고 또는 당신이 그들을 참을 수있어 하지만 어느 쪽이든 그것은 스택을 통해 것입니다 그리고, 그 첫 번째 레이어는 입력에 소요 그것은 말한다 좋아, 우리는 그와 방울과 마법을 할거야 다음 층으로 그리고 그 같은 일을한다 이 다음 위치에있는 마지막 하나 같은

그리고 마지막 하나는 내가 그것이 무엇인지 말한다 그것은 삼각형입니다 그리고 그것은 당신에게 그 번호를 던졌습니다 그리고이 모든 정말 수행합니다 이 데이터 포인트에 소요 그들과 함께 물건을 수행 수학의 단지 무리입니다

우리가 그들을 추가하는 이유는 그래서입니다 그리고 순서는 우리는 그들이 스택의 순서를 변경 추가 할 수 있습니다 그리고 너무 나쁘지 않다 그러나 우리가이 이상한 단어가, 최대 풀링처럼, 중퇴, 평평 치밀한 그리고 그 당신이 하나 생각으로 이해하기 어려운되지 않습니다

이 인수를하지 않기 때문에 우리는 평평하게 시작하는 것입니다 그러나 거기에서 이동하기 매우 쉬운 것입니다 그래서 평탄화 층을 추가,이 조금 말도 보일 수 있습니다 심지어 불필요하게 보일 수 있습니다 당신이 그림을보고하는 경우 그러나 그림은 데이터의 모든 종류를 캡처 점과, 어쩌면 X 길다 넓은 X, 그리고 어느 정도의 두께 우리는 정말로 유일한 폭과 높이에 대해 걱정할 필요가

그리고 수 아마 어떻게 든 정보의 다른 모든 부분 이 같이 뻗게하지 않고 인코딩 될 수있다 처럼의 그 밖으로 스트레칭 가정 해 봅시다 것은 색상, R, G 및 B입니다 그래서 우리는이 사각형의 종류에 배치의 우리의 이미지 종류의 경우에도, 그것에 깊이의 약 3 층이있다 많은 빨간색 픽셀에 얼마나 첫 번째 계층은 어떻게 녹색 많은, 다음 방법 파란색 많이 그러나 우리는 정말 무엇을 상관하지 않는 경우 또는 우리는 어떻게 든 데이터를 인코딩 할 수 있습니다 다른 방법은? 그런 다음 우리는 사진을 평평하게 할 수 말하자면, 당신 손 두 차원 일 대신의 3 차원 하나

그리고 당신은 동일하지만, 복용이 차원 일을 할 수있는 경우 그리고 라인에 그것을 무너 다시 평평 것이다 그리고이 개념은 정말 어려운 일이 아니다 실제로 우리가 어차피 할 일입니다 이미지를 분석하고 싶었 경우 당신이 정말로 색에 대해 관심이 없었어요, 예를 들어, 당신은 그것을 평평가 흑백으로 만들 수 있습니다 이제 이미지를 평평하게했습니다

그래서이,하지만 그것은 조금 이상하거나 이상하게 말로 수 있습니다 우리가 실제로 너무 익숙하지 않은 일을한다 다음 쉬운 일이 아마 드롭 아웃됩니다 그리고 이것은 우리가 이미 본 적이 뭔가 역할을한다 이것은 기본적으로 overfitting의 역할을한다 그래서 우리는 이전에이 용어에 대해 이야기했습니다

우리는 유아에게 사실의 무리를 가르쳤다 그리고 그 아이가 그 사실을 알고있다 그것은 브라키 오 사우루스가 무엇인지 알고있다 이게 다예요 그래서 지금 우리가 원하는 우리의 모델에해야 할 일 우리의 모델은 그렇게되지 않았는지 확인합니다

그냥 대답은, 다음 대답은, 않을거야 (B)이며, 다음 하나 등등 C 및이다 우리는 우리의 모델이 아니라, 패턴을 픽업하고 싶은 말 그 패턴이 작동하는 방식에 따라, 그것은이 있어야합니다 즉 더 나은 모델이다 그리고이 경우, 우리가 우리가 드롭 아웃을 소개합니다 그리고 당신은뿐만 가끔 그 생각할 수있는 우리는 단지 종류의 무작위로 일부 데이터를 쫓아있다

그것은 가정으로, 50 %의 확률로합니다 분수 그래서 얼마나 많은 데이터를 말하고있다 아닌 확률을 쫓아합니다 내 실수 이것은 실제로의 데이터의 일부분이다 될 것 종류의이 층에서, 주어진 섹션에 떨어졌다 그래서 어떤 레이어 말하는 것은, 같은 모든 권리입니다 우리는 가끔 사람의 단지 종류의거야 데이터의 조각을 선택하지

그리고 우리는 이동 및 다른 일을 할 것입니다 그리고 그 방법으로, 우리는 매일 시간을 설정 같은 데이터를 제공하지 않습니다 우리는 조금 덜을 제공합니다 우리는 여기에 당신이에서 선택받을 데이터의, 모든 권리를 말한다 우리는 실제로 단지 당신이 많은 손을 것입니다

여기 당신은 간다 그리고 그 주위 오는 다음 번에 다른 부분 집합 일 수 있습니다 어쩌면 내가 당신에게이 부분 집합 대신 이전을 손 수 있습니다 그리고 그 방법으로, 우리는도 overfitting을 방지 할 수 있습니다 이제 데이터의 50 %는 꽤 높은 모든 시간을 중퇴하고

그래서 나는 여기에 전투의 종류에 도입했습니다 우리가 경우에 발생합니다 overfitting 분의 몇 배의 뭔가 수백 훈련 그러나 당신은 낮은 무슨 일이 일어나는지 볼 수 있었다 아마 훈련 데이터의 종류에 아주, 아주 좋은거야 그러나 실제 검증이나 테스트 데이터를 아주 나쁜 수 있습니다 그래서 어쩌면 적합하지 않습니다

그러나 당신은 또한 너무 많은이 결코 증가 할 수 없었다 학습 데이터에 잘 도착하고 잘 테스트 데이터는 소송을 따릅니다 그리고 그 중 하나가 적합하지 않습니다 그래서 포기하고 여기에 걸릴 어떤 종류가있다 당신은 그것으로 주위를 혼란에 약간 않아도됩니다 당신이 맞는 볼 그리고 당신은 더 많은 이들 층의 더 적은을 추가 할 수 있습니다

당신은 일해야하는 몇 가지 차원이 있다는 사실을 알게 될 것입니다 예를 들어, 평탄화 층을 제거있어 경우, Keras 그냥 내가 무슨 일이 일어나고 있는지 이해가 안처럼 될 것입니다 그리고 그것은 종류의 당신을 흥분 수 있습니다 당신이 맞는 볼하지만 그 이외의, 당신이 더 많거나 적은 비용으로 주위를 재생할 수 있습니다 중요한 일의 다른 종류의 우리가 최대 풀링 2D로 가기 전에이 조밀하다

그리고 밀도가 약간의 활성화를 가지고있다 당신은 무게의 일부 유통 것으로 조밀 상상한다면 그들이 호출하거나 컴퓨터를 말할 수있는 것입니다 무엇을 이 만드는 결정의 값은, 그래서 당신을 말한다면 당신은 만지는 것을 난로는 100의 값을 가지고 있으며, 당신은 접촉 지상 40 같은 값을 가지고 있으며, 당신은 당신의 자신의 피부가 접촉 0 등의 값이, 당신은 아주 쉽게 알 수 있습니다 어디에서 내 가치 체계가 것입니다 어느 쪽이 더 위험하다 그리고 가치 체계의 종류, 여기 놀이에있다 하지만 활성화는 우리가를 원하는 수행하는 방법을 잘 알려줍니다 어느 정도 사전 체중 가지의 종류 그리고 [들리지] 단지 사람들이 이미지를 사용하는 공통의 하나가 발생합니다

그들의 무리가있다 당신이 그들을 찾아 볼 무료입니다 Keras 그들의 톤과 내장에 온다 소프트 맥스와 같은있다 10H가있다

다른 사람의 모든 종류가있다 그리고 그들은 모든 것을 변화하는 것을 의미한다 그것은 매우 기술이 될 수 있습니다 가끔은 그냥 그들과 함께 놀러와 사람이 더 잘 작동 확인할 수 있습니다 당신은 매번 동안 그들을 교환하고 그것을 시도 할 수 있습니다

어느 작품? 어느하지 않습니다? 그리고 당신은 종종 [들리지 즉 이미지와 특히 잘 작동 찾을 수 있습니다 바로 아래의 수학 때문이다 당신이 수학에 관심이 있다면, 나중에 나에게 이야기 주시기 바랍니다 당신이하지 않으면, 우리는 단지 가지 떠날거야 그것이에게 그 결정의 가치를 알려주는 활성화있다 그리고 그 결정의 시작 값입니다 나중에, 그 자체-가중치를 다시

그것은 오, 그래, 아니, 그 나쁜 결정이었다 말했다 우리는을 rechanging하고 있습니다 그리고 조밀이 레이어에 추가되는 실제 것입니다 즉,이 레이어의 이름입니다 그리고 자신의 조밀 정말 그냥, 말하고 헤이, 우리는 노드 또는 뉴런이 될 것입니다

우리는 특히 그 중 16이 될 것입니다 그리고 우리는 그들 모두 서로 통신 할 수있는 것입니다 그리고 무엇 그건 그냥라고하는 것은 내가 결정을 내릴 경우입니다, 나는 그건 내 주위 모든 사람을 말할거야 결정은 내가 만든 나쁜했다 그 하나를 수행하지 마십시오 그 끔찍한 결정이었다

그것은 당신이 하룻밤 물에 조금 너무 취 경우처럼 그리고 당신은 바로 다음 날 봐, 같은 사람 나쁜 계획을 모든 사람에게 주위를 이동합니다 그렇게하지 마십시오 당신은 결정을하지 마십시오 그 취급의 아주 쉬운 방법 그리고 그 계층에서 당신은 신경 세포의 무리가 모두 서로 이야기합니다

그리고 어떤 사람들의 즉각적인 해결책은 그냥 더 신경을 추가 할 수도 있습니다 때때로 때로는 없습니다 그리고 당신은 훨씬 느린 컴퓨터를 만드는 것을 알 수 있습니다 그래서 항상 트레이드 오프가있다

그리고 우리는 우리의 최대 풀링 2D를 가지고있는 당신이 아래에 무슨 일이 일어나고 있는지 알고 있다면 꽤 직관적으로 지정됩니다 그렇게하지 않으면, 그것은 단지 무엇 퍼지 같다 그래서 우리는 여기에 무슨 끝나는 것을 나는 그것을 풀 크기를 준 것입니다 나는 2 2 말했다 그래서 당신은 당신의 이미지 상상 경우 픽셀의 부분, 네가 기본적으로 사각형처럼 2로 2가 이미지를 가로 질러 슬라이딩 그 화소

그리고 정말 내가 여기서 뭐하고있어 내가 가지 모두 함께 풀링하고있어한다 및 최대를 복용 이게 다예요 그리고 그 최대를 복용하고 아마 것을 말하는거야 일을 결정하는 기능입니다 그리고 이미지에서, 그것은 때때로 경우가 있습니다 특히 이미지의 이런 종류의, 꽤 잘 작동합니다

분 풀링도 있습니다 당신은 최소 걸릴 즉 중요한 사람입니다 즉 특히 관련이있을 경우가 있습니다 당신은 이미지의 부정적인보고있는 어떤 경우? 어쩌면 여기에 적용됩니다

아마하지 않습니다 그래서 그 마음에 계속 뭔가 또한, 저는 믿습니다, 평균 풀링이있다 그것은 Keras의 평균 풀링 호출 할 수 있습니다 그러나, 당신은 단지 생각하는 것과 같은 일을 소요, 그 평균이하고 잘 지내 있다고한다

당신이 적절하다고 생각한다면 풀의 크기를 변경할 수 있습니다 2에 의한 2, 우리는 정말 그래, 말을하지 않기 때문에 여기에 꽤 피팅 이 모든 것은, 당신은 단지 거기에 가장 큰 지점을 가지고가는 경우에, 그게 행복 아닌지 여부를 결정합니다 이게 다예요 그것은 매우 정확하지 않습니다 우리는 멀리 얻을 수 없을 것입니다

그래서 우리는 우리의 데이터 조금 응축하는 데 도움이됩니다 우리는 종류의 단지 우리가보고있는 정보를 가지고 그리고 보풀의 일부를 밖으로 던져 그리고 당신이 몇 번 않습니다 그리고 마지막에 우리는 우리의 출력을 뱉어 있도록 매우 국소 개요 종류의 기계 학습에있다 생각에 잘하면 소개 그것은 구체적으로, CS50에 대한 최종 프로젝트로 액세스 할 수 있는지

그러나 심지어 현실 세계의 종류, CS50의 외부 클래스의 외부, 당신이 주변에 수리를 원하는 경우 그 완전히 당신의 능력에 있습니다 그리고 내 말은 당신하지 CS의 년을했다 사람으로 지금은 과정을 가르치고있다,하지만 사람 모두 시작하거나 더 나쁜 경우 누가 시작했다 나는이의 경험이 시작 내가 갔던 곳이었다 이것은 내가 선택한 방향이었다 그리고 그것은 완전히 접근 할 수 있습니다

당신은 그렇게 할 수 있습니다 그게 당신의 손안에 완전히이다 당신이 모든 관심에 있다면 그래서, 나는 그것을 추구에게 추천 할 것입니다 당신은 어렵다는 것을 확인할 수 있습니다 그것은 실망입니다 점이있다

그러나 당신이 CS에서 어떻게 할 건데 아무것도의 경우입니다 그들이 어려울 것이다 지점이있다, 어디 실망 할 것이다 그래서 나는 포기하지하는 것이 좋습니다 것보다는 생각 것을 그 기본적 권리 경로입니다 당신은 거리를 것입니다 계속해

당신 때문에 수도뿐만 아니라, 당신이 어떤 프로젝트에이 작업을 수행하려고하는 경우, 관심있는 일에 그것을한다 그리고보다 구체적 지시 충고의의 CS50에 대한 최종 프로젝트에서 3 주 동안 당신의 시간을 낭비하지 마십시오 멋진 무언가를 구축 할 수 있습니다 그것은 어려운 그것은 많은 시간을 소요하고는 디버그에 매우 성가신 경우 마지막 가능한 분까지 작동하지 않는 것을있다, 당신은 아마 바로 그 일을하고 있습니다

그게 바로 대해 아마 CS에서 가장 많은 작업이 가능한 마지막 순간에 발생합니다 내가 그것을 가지고, 당신은 같은거야 어디에 그 순간이있다 그리고 당신은 좋은거야 우리의 많은 CS 아직 이유 구호의 의미이며, 우리는 우리가 제작 한 것이 만족되는 느낌을 좋아합니다

혹시 CS 당신을 위해이 아니라고 생각하면 그래서 너무 어렵 기 때문에 모든 사람이하지만 당신을 얻을 것 때문에 또는, 그 100 %가 아닌 경우입니다 기계 학습은 어렵다 컴퓨터 비전은 어렵다 컴퓨터 과학은 어렵다 학습 어렵다

이 모든 것은, 우리는 할 수 있습니다 그래서 나는 그것을 추구 항상 추천 할 것입니다 기계 학습, 컴퓨터에 대한 너희들이 몇 가지 질문은 무엇입니까 시력? 나는 내 마지막처럼 칠 정도 분 그림 나는거야 질문에 엽니 다 확실한 스피커 2 : 당신은 아마 말할 수 있는지 궁금 해서요 최소 및 최대 풀링 풀링하고, 경우 (2) 2를 사용하는 방법에 대한

마찬가지로 100 100처럼 사용하는 거라고 어떤 상황은 무엇인가 또는 [들리지] SPEAKER 1 : 나는 풀까지 모든 이미지에 정말 아니에요, 상상할 수있다 하지만 어쩌면 나는 귀엽다 여기에 고양이를 유지할 수 있습니다 그래서 본 이미지는 픽셀들의 세트 량을 갖는다 그래서 분 풀링을 의미 대 풀링 최대 대 풀링 이유있는 질문 그것은 다른 풀 크기를 가지고 무엇을 의미 하는가 왜 정말 관련이? 그래서 우리는 귀여운 때문에, 특히이 이미지에 대해 이야기 할 것입니다

그리고 나는 갈색 또는 붉은 생각합니다 난 정말 말할 수 없습니다 그러나 이집트의 고양이 그리고 그들은 아름다운이 넓은 눈과 큰 귀처럼 그들은 최고입니다 그리고 기본적으로이 이미지는 픽셀의 수를 설정하고있다

나는 일부 픽셀 수에 그것을 표시하고있어 비록, 그 자체가 이미지가, 안 400 (200)을 수행의 말을 보자 아주 잘하지만 충분히 가까이하지 않습니다 A는 주어진에 인 경우에 그래서 (200)에 의해 (400)는, 다음, 우리는 20 박스 (20)과 같이 말할 것이다 우리는 너무 많은 데이터를 얻을 수 있습니다 의 20에 의해, 즉 귀 일각 (20)를 가정 해 봅시다 글쎄, 난 그 단지 최대를 취할 경우 나는 20의 최대를 할 경우, 실제 (20) (20)에 의해 부분으로 생각할 수 20, 또한,이 귀 전체 팁은 하나 개의 포인트가된다

나는 귀 끝 하나 개의 데이터 포인트가 있습니다 그리고 같은 일 우리는 전체 이미지를 반복한다 그래야이 이미지는 상당히 응축됩니다 가 (200)에 의해 400 인 경우, 물론 당신은 생각할 수 있습니다 지금처럼 적합 할 수 있습니다 (20)의 비율로 감소된다 어쩌면 당신이 정말로 걱정하는 모든 일반적인 모양이다

그것은 고양이가 아니면 손잡이인가? 즉 구축 할 수있는 아주 쉽게 분류합니다 정말 걱정해야하는 것은 좋지 원이 아닌 손잡이, 그것을이다 하지만 어쩌면 문 손잡이의 클래스가 다르다 그것은 거기에서 더 복잡 얻을 수 있습니다 그러나이 경우, 당신은 아마 사용할 것 세부에게 아주 작은 풀을 유지한다

우리는 우리의 이미지를 조금 응축 위해 노력하고 있습니다 우리는 보풀의 일부, 소음의 일부를 제거하기 위해 노력하고 있습니다 마찬가지로 여기에 몇 가지 모피가있다 하지만 정말 실제로 무엇을 그 모피를 중요하지 않습니다 당신은 매우 특별한 기계를 찾고하지 않는 한, 않습니다 분류하는 경우에 당신은 아마보고하지 않을 전체 동물의 사진에서 우리가보고있는 경우 그래서, 그것은, 음, 개 대 고양이 모피의 반점이 여기가 있다면 정말 문제가 않습니다 또는 일부 추가 노이즈가 사진을 찍었 카메라에 의해 포착? 정말

그래서 우리는 그냥 가지 위에 그 평균을 무시할 수 있습니다 아니면 이상 최대 풀링을 사용하고 당신, 말 우리는 우리의 모든 세부 사항을 풀거야 알고, 모든 가장 큰 자세한 내용은 함께 즉,이 경우에 해당 될 수 있습니다 동안,이 그림은 무엇 이었습니까 경우 200 만 픽셀 400 만 화소? 이제 풀 크기는 많이 확장 할 수도 있습니다 우리는 여분의 모든 정보가 필요하지 않습니다 특히이 같은 사진의 경우 우리는 당신이, 우리가 그것을 줄이기 위해거야 알고, 말할 수 같은 백만 배

그리고 지금 당신은 너무 작은 수 있습니다 2로 4를 가지고있다 지금 당신은 기본적으로 그냥 네 개의 픽셀 아래로 두 걸쳐있어 희망 그것은 여전히 ​​고양이입니다 하지만 당신은 그와 함께 주위를 재생할 수 있습니다 그리고 그 사건이 될 수있는 당신이하고자에서 당신도 A 최소 또는 최대 또는 일을하는지 여부를 변경해야 당신이 이미지를 분석하고 방법에 대해 설명합니다 그것은 단지 하나의 이미지를 가지고이 작업을 수행하는 것이 적절하다? 또는 데이터에 하나의 이미지 만 추가 설정 (150) 150처럼 나머지 모든 후 크고입니까? 그럼 당신은 그것을 변경할 수 있습니다

스피커 3 : [들리지] 당신이 경우처럼 같은 , 400 만 화소 긴 같은 말을했다 하나 개의 이미지를했다 아마 사전 처리 한 후 더 나을 당신이 가기 전에 데이터, [들리지] 크기 특정 값 [들리지] 좋아한다 SPEAKER 1 : 예 실제로 샘플 코드가 약간있다 그냥 가져 있었는지 약간의가있다, 화상의 전처리는이다 그것은, 사람들이 거기에 던질 것이다 재미 작은 단어의 또 다른 종류의 당신이 그들을 사용하기 전에 바로 오처럼, 그래, 이미지를 사전에 처리합니다

그리고 그들은 돌아 그냥 무시처럼 그들은 단지 당신에 전부 떨어졌다 사전 처리는 정말 기본적으로 무슨 일이 방금 언급 한 것입니다 당신이 당신의 이미지를 가지고 가지 그들에게 조금을 정상화 할 것입니다 당신은 400 만있어 데이터 세트에서이 아웃 라이어를하고 싶지 않아 2 백만으로 할 때 100 같은에서의 나머지 당신이 그들을 확장, 사람들을 어쩌면 그 크기를 조정하려면 아래 적절한 방법을 사용 그리고 그 방법은 데이터에 따라 변경 될 수 있습니다 어떤 당신은보고 또는 당신이 그것을 수행하는 방법에 따라하고 하지만 그들에 걸쳐 정상화 할 수있는 것은 전처리의 일종 될 것이다

당신이 생각하는 경우 처리 부분이기 때문에 그리고 그것은 전처리라고 당신의 기계 학습 알고리즘으로 던지고, 이 beforehand– 전처리을한다 그 용어가 가지 들어오는 곳 그리고 그입니다 그리고 특히 이미지가 많이 온다 이미지는 사람들에 의해 사용되는 카메라로 촬영 할 수 있기 때문에 사람들이 꽤 확률이다 나는 같은 사진 400 시간이 걸릴 수 있습니다 그것은마다 다를 수 있습니다 그리고 그 사람들이 사진을 찍는 방법에 문제의 종류, 특히이다 실제 시나리오에 어디를 적용하고 살아있는 동물의 사진이나 사람의 얼굴의 어떤 종류에 그런거나하는 것들

당신은 아마 그들이있어 수 있도록 사전 처리에 이미지를 방법을 찾아야 할 것 대략 적당한 크기 및 줄거나 걸 대략 옳은 일을 찾고 어쩌면 사람의 얼굴의 사진은 여기에서 밖으로 모든 방법을 확대한다 어쩌면 다른 모든 사람의 사진이 매우 가까이와 같은 확대 된 그래서 당신은 자신의 얼굴을 가지고있다 하버드 IT는 사용자를 식별하는 데 그 사용합니다 그것은 단지 당신의 얼굴입니다 그래서 그들은 당신을 가지고 모든 이미지를 사전 처리 그들은 당신을 식별 할 수 있습니다 그리고 그 기계 학습에 많이 오는 무언가이다

이 프로젝트의 일부입니다 그리고 나는 시간 중 약 괜찮아 생각하지만, 나는거야 질문에 대한 이후 주위를 어슬렁합니다 그러나 지금까지 실시간 스트리밍이가는대로, 시청 해 주셔서 감사합니다 난 내 자신의 일을하고 캠퍼스의 종류에 수 있습니다 하지만 난 정말 당신이 모든 방법에 걸려 감사 맨 마지막에 이상한 고양이 사진을 통해

그래서 대단히 감사합니다 너희들을 보여 주셔서 감사합니다

How Machine Learning is Changing the @NBA with Computer Vision @SecondSpectrum #DataTalk

– 안녕하세요 Experian의의 주간 데이터 토크에 오신 것을 환영합니다, 똑똑한 사람들의 일부를 특징으로 쇼 데이터 과학에서 작업 오늘 우리는 제나 호수와 이야기 된 것을 기쁘게 생각합니다 누가 컴퓨터와 비전 엔지니어 이상의 두 번째 스펙트럼에서

제나는 과학 학위의 그녀의 석사 학위를 취득 카네기 멜론 대학에서 컴퓨터 비전에 및 컴퓨터 과학 학사 과학의 정도 웨스트 버지니아 대학의 생체 인식 시스템이다 제나는, 우리의 쇼 오늘의 참여 해주셔서 너무 감사합니다 – 초대해 주셔서 감사합니다 – 내가 제나 궁금해, 나는 항상 우리의 손님에게 그들의 여행에 대해 조금 공유 할 수 있습니다 데이터 과학으로 당신을 이끌어 무엇을 특히 컴퓨터 비전? – 음, 나를 위해 내가 정말 있었다 힘든 시간을 선택

나는 코드를 작성하는 사랑 과 어디 플래시 내장 간단한 소프트웨어를 작성 내 전공 중 하나로서 생체 인식 시스템이기 때문에, 실제로 이미지 프로세싱을 많이 할 수 있었다 내가 졸업 할 때 다음, 나는 충분히 운이 좋았다 나는 매우 지원을 가진 회사와 함께 작동하도록 보스 정말 많은 컴퓨터 비전으로 나를 밀어 그 많은 데이터 처리 기술하고 있었다 로 이끄는 정말 좋은 경험 내 석사 학위를 받고 – 그게 최고입니다 고등학교에있을 때, 당신은 항상 수학에 정말 관심 과 과학? 그것은 거의 초점이 되었습니까? (웃음) – 네 내 고등학교에서 수학 한 사회의 설립자 (웃음) 나는 역사에 끔찍 했어요

– 그것은 좀 조금 절단있어, 제나, 하지만 난 당신의 입술을 읽으려고합니다 (웃음) 당신이 정말로 정말로 즐겼다 ​​것처럼 소리 수학 및 고등학교 과학 당신은시 또는 인문학에 대해 뭔가를했다? – 나는 역사에서 정말 나쁜입니다 – 오, 역사, 좋아 참조, 나는 반대했다

내가 읽고 사랑하고 내가 글을 사랑하고 내가 고등학교 때 나는 수학에서 떨어져 있었다 (웃음) 나는 정반대였다 내가 대학에 갔을 때, 나는 영어를 전공했다 나는 멀리 엔지니어링에서 머물렀다 나는 하나 개의 컴퓨터 과학 클래스처럼했다

이 같은 1999 년에 다시, 그래서 그것은 같았다 C ++ 기본 시각 및 나는 지금 누구를위한 큰 존경을 가지고 컴퓨터 과학 (웃음) 그 하나 개의 클래스 후 제나, 컴퓨터 비전 요즘 정말 뜨거운 주제입니다 난 그냥 구글 렌즈에 대해 읽고 있었다 지금은 사람들이 사진을 찍을 수 있도록 허용 객체와 AI의 식별 할 수있을 것입니다 어떤 객체 것은 꽃의 종류와 같은 것입니다 일어나고있는 정말 멋진 일이 많이있다 컴퓨터 비전이다 내가 당신이하고있는 일에 대해 좋아하는 것은 당신은 컴퓨터 비전을 사용하여 정말 활성있어 스포츠 분석에 도움이됩니다

당신이 주식의 종류 수 있을지 궁금하네요 어떻게 도움이있어 컴퓨터에 대해 조금 농구와 NBA를 이해합니다 – 네, 잘 실제로 정말 흥미 롭군요 그것은 단지 (궁시렁)입니다 우리는 다른 이미지의 무리에 걸릴 그리고 우리는 선수들에게 시도하고 볼이 착용 플레이어의 끝에서 여기하면 농구의 3D의 모든 프레임에 대해 다음 우리가 할 수있는 완전히 별도의 팀을 보유하고 있습니다 또한보고 가서이 무엇을 의미합니까라고? 농구 여기 때 그것은 무엇을 의미 하는가 어쩌면 반대 팀은 가까운 거리에 있습니다

우리는 공격 또는 수비가 있습니까 그 일이야? 그리고 그것은 매우 흥미로운 일이, 정말 이것은 일반적으로 행해졌 무언가 때문에 매우 수동 방식으로, 사람들은 다시 시계를 것입니다, 재 시계, 다시 시계 – 시계 다시 있다 당신은 사물 이러한 유형의 작업을 수행하려는 경우 방식에 매우 편리합니다 전체 경기를 시청하지 마세요, 여기 당신이 원하는 소개 및 비트 당신은 어떤 의견을 듣고 있습니까? – 네, 몇 가지 의견을 듣고 있어요

나는 일부 오디오 문제가 있습니다 당신이 말하는 된 원인 나는 '아웃 얻어 먹게 느낌 (웃음) 뭔가 정말 매력적이었고, 난 그 지금 비트와 조각을 잡기 나는 당신이했다 말을 듣지 않았다 무엇 과거에, 그것은 항상 어떻게 어떻게 다시 관찰 같은 비디오 영상을 계속해서 또 다시 확실히 영화를 보았다, '나는 스포츠에 참여 적이 없습니다 원인 그래서 나는 단지 그것을 어떤 건지 상상 탈의실 내부 있지만 (웃음) 그래서 나는 그들의 팀과 감독의 영화를 볼 때 또 다시 연극을 다시보고, 이제 컴퓨터를 가르침으로써 그 과정을 돕는 것 선수들 사이의 관계를 이해하고, 공, 무슨 일 이죠? – 정확히 우리는 선물 어쩌면 당신은

이 선수가 얼마나 말했다 이러한 다른 사람들과이 위치에, 당신은 할 수 매와 매보고 에있다, 대신 당신은 말할 수 나는이 사람이 방어적인 움직임을보고 싶다 내가보고 싶은 것은 법원에이 사람이다 가장 효과적인 및지도에서, 법원에이 선수의 말 그는 오른쪽보다 왼쪽으로 성공적인 이상이다 아니면 그가 함께 작동하는 경우 더 성공적이다 이 사람이나 그 사람 그것은 매우 흥미로운 종류의 이 코치에 대한 더 많은 데이터를 노출시키는 방법 그들도 더 자세히 이해하기 위해 무슨 일이야 – 네, 그래서 실제로 그것을이다 당신이 검토하고있는 데이터의 일부는 방법입니다 플레이어는 다른 플레이어와 상호 작용? – 모든 플레이어가이다 음, 우리는 알고있다 볼이 어디 3D의 모든 프레임에, 우리는 알고있다

우리의 출력 부족 그래서 우리는 말할 수있다 우리가 주석을 달 수 있습니다 여기에 좌표는 그 위에, 우리는 심지어을 당길 수 이런 일을 정확한 타임 스탬프, 그런 다음 쿼리와 함께 그 넣어 말할 수 있습니다 이것은이 내 심층적이며, 무슨 일이 일어나고있다 게임의 분석 그리고 정말 우리가해야 할 무엇을하려고 수 있습니다 코치는 가능한 한 빨리이 작업을 수행 할 수 있습니다 그냥 전원을 켜고 말을 할 수 있다면 우리는 그것을 사랑 아, 정말 흥미로운 것을, 나는 그것에 대해 생각하지 않았다 그냥 다시 볼을 NBA 시즌, 1000 경기 시즌이 있습니다

나는 부여, 의미, 그건 모든 팀하지만 때때로 당신은 어떻게 당신의 팀의 작품을 이해할 수있다 또는 상대 그것은 단지를에 인간에 대한 데이터 만 많이 있어요 수동에 걸릴 – 네, 의심의 여지가, 그리고 내가 당신의 웹 사이트에서 읽을 생각하지 그 그것은 지금 NBA 팀의 세 번째 당신이 작업하고 있었다? – 우리는 실제로와 독점 계약을 체결 추적을위한 전체 NBA, 통계의 종류 당신은 볼 것이다 어쩌면 판타지 농구 사이트 또는 다른 사이트에, 그 우리에 의해 생성 된 것 – 오, 좋아, 아주 좋아 방법은 아주 멋진

– 또한, 우리는 소프트웨어를 코치하고있다 팀의 실제에 가입 뿐만 아니라 해당 소프트웨어의 프리미엄 수준입니다 – 그게 최고입니다 깊은 학습을 위해, 기계 학습, 당신은 훈련 많은 데이터를 필요로하고 내가 가지였다 농구 어떤 유형의 데이터에 대한 호기심 당신과 분석 당기는 것입니다 – 우리는 그 사실에 매우 운이 있었다 우리는 우리 자신의 카메라를 가지고, 그래서 우리는 우리가 원하는 것을 수집 할 수 있습니다 그러나, 우리는 동일한 데이터에 문제가 모든 사람들이 있습니다

라벨, 라벨, 라벨, 라벨 당신은 아무것도를 양성하려는 경우, 당신은 거기에 무슨 일이 일어나고 있는지 알 필요가있다 그것은 데이터의 엄청난 금액을 가지고 훌륭합니다, 하지만 하루의 끝에, 우리는 할 수 있어야합니다 그것의 의미를, 그리고 완전히 비효율적하기 말, 오 인간에 대한, 모든 단일 프레임 레이블을 모든 단일 플레이어, 공 그건 그냥 영원히 걸릴 것 그래서 당신은 정말 좋은 라인을 걸어야한다 나는, 기계 학습에서 거의 모든 사람을 생각 컴퓨터 비전은 지금 당장해야 이해하는 것입니다 나는 효과적인 방법으로 모델을 학습 할 수있는 방법 어떤 데이터가 어떤 데이터 또는으로 표현하기 위해 가장 중요하다 당신은 또한 표현하기를 원하기 때문에 효과적으로 일반적인 경우뿐만 아니라 가장자리의 경우

– 지금, 우리의 의견 중 하나는 막 들어왔다 왜 초점은 NBA에 있고 그 때문이다 농구는 우리가있어 시작됩니다 NBA에 대한 실제 흥분하지만, 분명히, 바로 당신이 농구를 넘어 팽창을하고있는 일? – 예 MLS의 일부 축구 팀 작업, 그래서 매우 흥분되고, 그리고 것 그것은 차이를보고 정말 흥미 롭군요 스포츠한다 그냥 농구 같은 매우 간단한 일, 당신은 실내에서 재생할 수 있습니다 MLS, 모든 야외 그래서 갑자기 지금 우리는 모든 것을 같이가 그것은 우리가 실내에서 더 이상 실험실 없다 날씨, 당신은 하루의 시간 이동을합니다

당신은 그냥 그렇게 다른 얼마나 상상할 수있다 하지만, 갑자기 당신은 그뿐만 아니라 사람들의 매우 다른 수 당신은 필드를 추적해야합니다 그것은 우리 그냥 아주 재미, 흥미 진진한 시간이다 – 네, 의심 할 여지없이, 그것은 정말 멋지다 없습니다 너희들은 축구의 분석, 국가 하키 리그을한다

이 양의 단지 놀라운 비디오 영상 너희들은 분석해야 당신이 당기는해야 센서 데이터 – 우리는 주로 프로 농구 (NBA)와 함께 작동 우리는뿐만 아니라 일부 MLS를합니까 그리고 그것은 때문에 때로는 정말 흥미 롭군요 나는 사람들과 얘기하고, 그들이 말하는 당신은 볼 수 있습니까? 나는, 물론, 같은했다 네,하지만 (웃음) 나는 매우 다른 방식으로 생각 그것을보고 (웃음) 누군가보다 – 그래, 내가 상상 그건 정말 재미 있어야합니다 당신과 함께 슈퍼 볼을보고 앉아, 당신은 아마 게임을 시청하고 있기 때문에 완전히 다른 방식이다 (웃음) – 그래, 그래

– 나는 모델의 정렬 대해 궁금 당신은 당신이 만들거나 모델 작동합니까 당신은 농구 선수를 식별 할 어떻게 그들이 수행하는거야? – 네, 그래서 우리는 다른 모델의 번호가 않습니다 물론 당신은 선수에 대한 모델이 필요합니다 우리는 다른 것을, 스포츠 매우 운이 좋다 야생에서, 사람들은 함께 유니폼을 착용 면들 자신의 그들에 이름은 서로 다른 색상과 번호입니다 그러나 그 자체가 자신의 문제를 가지고있다 당신이 상상할 수있는 동일한 두 가지가있는 경우 법원에 숫자, 즉 약간 다릅니다

또는 당신은 무엇을 가지 같은 모습 몇 가지 숫자가 있다면? 그것은, 그것은 누군가를 위해 열심히 우리를 위해 어렵다 컴퓨터뿐만 아니라 우리가보고있는 공을 모델 그리고,이 모든에서, 정말 하나 흥미로운 점을 생각한다 당신이 사람처럼 기분이 운동이 작업을 수행, 아무도 알 수없는 것입니다은 하프 타임에 당신은 잘 말 우리는 우리가이 있지만 대해 이야기 할 수 바랍니다, 통계, 그들은 또 다른 30 분 걸릴거야 그래서, 그것은 실용적 일 필요가있다 괜찮아 말을, 나는 이해할 수있다 어디이 개별 사용자의 각, 나는 그들이 누군지 알고 나는 볼이 어디 있는지 그것은 효율적인 방법으로 그렇게 할 것이다 실제로 소비 될 수 있도록 과에 법원 떨어져 두 사람에 의해 사용

아마 스포츠 방송 또는 어쩌면이다 , 당신은 그냥 집에 앉아있는 당신은 사람 아 같은거야 판타지 농구 시간 그것은 정말 열심히 도전하지만, 정말 흥분 하나 같은 시간에 – 그것은 코치 정말 흥분해야합니다 에서 뽑아 훨씬 더 많은 데이터를합니다 그들은 법원에보고있는 단지보다, 또는 그들이에있어 어디든지 – 내 생각 엔 우리가 사용하도록 설정하는 것입니다 자신의 작업의 일부입니다 자신의 작업의 재미있는 부분은 앉아서보고되지 동일 영상 릴 네번 자신의 흥미 진진한 것은 내가이 일이 벌어지고 참조, 아 – ​​하이다

아, 우리가 지금이 변경합니까, 또는 우리가이 개선 않습니다, 또는 나는이 선수 볼, 그는이 정말 열심히 촬영을하고있어 그리고 그는 시간의 일부를 성공입니다 그리고 어쩌면 다른 플레이어가, 그는 바로, 하루 종일 모든 정말 쉽게 사람을합니까? 어느 하나의 더 나은? 숫자들, 그리고 모든 시간, 그는 낫다 이 봐, 그 자격을 가지 지금 우리 팀에 더 중요한 무엇인지 또는 미래입니다 – 내가 제나 좀 궁금 해서요, 당신은 환상 농구를 재생? (웃음) – 바로 이거 야

– 당신이 지배 할 것 같은 느낌 (웃음) – 우리는 사무실에서 어떤 사람이 그것에 대해 매우 심각 브래킷은 매우 강렬하다 (웃음) – 당신에 대해 조금 공유 할 수 다른 방법이 NBA 코치 및 팀 실시간으로 데이터를 사용할 수있는, 하기 전, 후, 또는 게임 중? – 네, 그래서 (중얼 중얼) 나는 어떤 팀이 난거야 얼굴 매우 어려운 팀이야 그것은 목과 목이었다있다 당신은 플레이 오프에 대해 생각할 수있는, 그들은 어떻게 전략을 세울거야? 그래서, 당신이 할 수있는 한 가지는 당신이 준비 할 수있다 강점과 자신의 팀의 재능, 뿐만 아니라 팀으로서, 그리고 항상 볼 것이다 이전에 본 적이 게임, 우리가 붕괴 곳 오이입니다 이 곳에 우리가 정말 성공하고 그것은 정말 흥미로운 일이 다만 전략 수준

하지만 당신은 그보다 더 깊은 보면, 우리는 오른쪽 거래 및 자유 계약으로 얘기 할 수 있습니다 나는 많은 것들을 오프 시즌에서 일어난 알고 다음은이와 NBA와의 그들은 말을 장소에 도구를 가지고 나는이 내 팀이 무엇을 알고 그러나 이것은, 우리 팀이 무엇을 필요로하는지입니다 누가 그에있어 중요시하는 점은 무엇입니까? 나는, 그건 그냥 정말 재미있는 것 같아요 내가 비밀리에 희망 무언가가 있다는 것입니다 이런 일들은 누군가가 앉아 일이 발생할 때, , 컴퓨터를 가지고 우리의 소프트웨어를 쳐다 보면서 말했다 그건 좋은 사이트, 당신은 알고 있어요? 그게 정말 멋진 것 같아요 또 다른 정말 멋진 응용 프로그램 그것은 우리가 작업중인 선두에 가지입니다 우리가보고있는있다 가져 사람들에게 우리가하고 계획하는지, 이것은, 레코딩에 대해 이야기하고있다 스티브 발머에 의해 우리는 우리 모두가 서로 다른 요구 사항이 모두 다르다 우리는 스포츠를 볼 때

내가 운동을 확대 할 수있는 방법이 있나요 당신을 위해 그것을 더 즐겁게 이상합니다 방법이있다 그래서 우리는 모든 다른 방법으로보고있다 우리가 (궁시렁)이보기를 사용자 정의 할 수있는 방법 경험 아마 당신은 정말 당신의 친구를 감동 할 당신의 환상 농구 리그한다 우리는 우리 물건의 일부를 보여줄 수있는 방법이 있나요 당신과 당신이 말할 수있는에, 나는 새로운 오늘 뭔가를 배웠습니다 또는, 말하는 방법이 이? 그게 정말 흥미로운 것 같아요 지금 우리는 어쩌면 일주일 전에 시작하고 있습니다

– 네, 고급형이고 난 그냥 해요 미래에 대해 생각하는 방법 바로 작년에 우리는보고있다 가상 현실과 도약과 범위, 미래의 가능성이 스포츠 경기 관람 우리가 코트에있을 수있는 가상 현실, 가능한 데이터로 오버레이 다음 경기를보고 너희들은 우리가하고있는 플레이어를 통해 제공하는 관심, 그건 그냥 경이로운 것 실시간으로 그에 액세스 할 수 있습니다 이것은 사람을 위해 아주 아주 흥분되는 사람은 스포츠 팬, 또는 가상 현실로, 때문에 너희들이 실시간으로 제공하는 데이터 단지 매혹적인 확실히 도움이 될거야 그들의 결정을 내릴로 코치와 팀을 향상시킬 수 있습니다 의 일부를 무엇 나는 약 좀 궁금 해서요 당신이 지금주의 가장 큰 도전 컴퓨터 비전에서 일하는 사람들을 위해? – 내가 컴퓨터 비전에서 생각, 우리는 항상이 저주를 당신은 너무 많은 것들을 볼 수에 대한, 하지만, 우리가 천천히 앉을 수있는 및 우리는 지금 일어나는 모든 것을 볼 수 있었다 우리는이 정말 흥미로 올 수 분석 그러나 우리는 그것을 4 주를 기다릴 것입니다 그것은 당신이 좋아하고 있다면 당신이 필요로하는 무슨 있다면 다음 20 년 폭풍의 예측 당신은 사주를 절약 할 수 있습니다 그러나 나는 우리가이 모든으로 실행하고 생각 실제 성능 장벽

우리는 때문에,이 편리하게 이용할 수 있도록 어떻게 이 데이터에 올 때 나는 모든 것을 생각 그것에 유효 기간이있다 기업의 경우, 당신은 주식 거래와 작업을 같이한다면, 당신은 곧 무슨 일이 일어나고 있는지 알고 싶어 당신은 무슨 일이 일어나고 있는지 알고 싶지 않아 이 일어난 후 나는 군대에 대한 IED의 감지와 함께 작동하는 데 사용됩니다 아무도 그들이 IED를 달려 알고 싶어 그들이 그것을 통해 실행 한 원인 분 전, '포인트입니다 그래서, 정말 흥미 롭군요, 어떻게 할 성능의 균형을 어떻게 정확성을 균형 않습니다

즉 일반적으로 당신이를 재생해야하는 트레이드 오프의 정말 정말 빨리 당신에게 무언가를 줄 수있는, 하지만 결과는 충분하고 뭔가 우리는 걱정? 그래서 나는, 컴퓨터 비전에 전반적인 생각 그건 정말 뭔가 태클과 내가이야 정말에 갔을 때 좋아했다 큰 컴퓨터 비전 컨퍼런스, CVPR, 실제로 일부 연구자을 보았다 당신은 거의 모든면에서 볼 수 있습니다 당신이 컴퓨터를 다루는 산업의 이제 GPU의 것을 함께오고있다 이러한 종류의 최적화 그런 처리 기술 및 일 당신은 진정한 변화가있다 볼 수 있습니다 전체 업계, 학계에서 좋아 말할 것 그 무슨 경우 가능하지 지금 가능하다 우리가 어떻게해야합니까? 당신은 알아? – 네 그것은 모든 성장을 그냥 놀라워 즉, 컴퓨터 비전에서 일어나고

내가 원래 컴퓨터 비전에 대해 생각하면, 나는 자동차에 대해 생각했다 나는 내가 그것에 대해 듣고 난생 처음 생각 구글은 자기 차를 운전 개발과 어떻게 컴퓨터 비전은 자동차 탐색을 돕고 있었다 및 인식하는 것은하는 도로에 나무 조각이나 종이 가방이다? 컴퓨터 비전에 많은 교칙이있다, 하지만 그것은 지금과 관련되고 어떻게보고 정말 멋지다 더 나은 결정을 내릴, 팀에 도움이 스포츠에 도움이 그래서 나는 일에 의해 단지 아주, 아주 감동 것을 당신은 일을하고 있습니다 또한, 당신은 문제의 일부에 대한 호기심 공유 컴퓨터 비전 가장 인상적인 일부 응용 프로그램은 무엇입니까 당신은 컴퓨터 비전으로 보았으므로 그리고 어디 향했다 일을 볼 수 있습니까? – 그건 큰 문제는 물론 자, 내가 여기서하는 일은 매우 멋지다 하지만 그 이외의 다른 일이 있습니다 단지 워 나는 전에 그것에 대해 생각하지 않은, 같았다

현실을 직시, 모든 사람들이 자기 운전 차에 일하고, 모두가 VR에 일하고 그리고 그것은 모두 아주 멋지다 하지만 실제로 같은 몇 가지를 내가 본 아주 새로운 것, 나는 무엇을 기다릴 같이 있었어? (웃음) 내가 CMU에있을 때, 나는 충분히 운이 좋았다 조명 및 이미징 연구소에서 작동하는, 거기에, 그들은 스마트 헤드 라이트에 노력하고 있습니다 당신이 운전 할 수 상상한다면 모든 시간에 당신의 높은 빔과, 누군가를 멀게에 대해 걱정하지 그래서, 그들은 해제 할 수 있습니다 상기 헤드 라이트 부분 등 그것은 두 차선에서 멀게하지 않습니다 난 그냥 그 멋진 일이라고 생각 누가, 항상 눈이있어 동해안에서 자랐 나는, 그건 그냥 좋은 줄 알았는데 나는 오 좋아요 같았다

그들이 해제 할 수있는 일이있다 이러한 픽셀 영역의 광 여기서 비 또는 눈에서 반사가 많이있다, 당신은 상상할 수 있는가? – 아 – 그게 생각했다 흥미 및 신규 애플리케이션 내가 최근에 본 적이 그 컴퓨터 비전의 생각 실제로 MIT에서 나오는, 그들은했다 당신의 얼굴 색상의 미묘한 변화 당신은 거의 인간의 눈으로 볼 수있는 일반 웹캠 비디오에서 당신의 심장 박동 – 뭐? – 예 – 그건 미친 짓이야

– 네, 너무 이상해 그들은거야 전화 접속 당신은 실제로 그것을 볼 수 있습니다, 화이트 레드, 화이트 단지 빨간색 사람의 얼굴, 빨강, 흰색, 그것은 이상한 일이지만, 그것을 작동합니다 – 와우 – 내가 학교에있을 때 나는 같았다 나는 이것이 진짜 작동하는지 확인해야 그래서 나는 (웃음) 자신을 그것을 코딩 그것으로 주위를했다 그것은처럼, 그런 것들 중 하나입니다 그것은 이해가되지해야하지만, 그것은 않습니다 그것은 너무 재미있다

정말 흥미로운 한 가지를 말해야한다 좋은 컴퓨터 비전의 이브 기계는 우리가 가지고 학습 나는 개인적으로, 나는 컴퓨터 비전의 사람입니다 나는 점과 사각형을 살 이미지 물건의 상자와 분할 경계, 그러나 나는 말하는 최초의 하나가 될 것입니다 내 출력은 무시 무시한 보인다 그것은 끔찍한 (웃음) 외모 그것은 많은 양의 데이터가, 당신이 나의 하나님 오 생각, 우리는 규모의 수주 증가하고 당신이 보는 무엇을, 좋아 일반적으로, 예를 들어 농구 말 우리는이 사람의 이런 말을 사용하고 있습니다 저기, 다음 공 그것은 우리가 걱정하는 전부입니다

갑자기 지금 우리는 모든 단일 프레임이, 모든 싱글 플레이어 우리가 그것을 사용할 수 있습니다 그래서 우리는이를 증류 어떻게, 그래서 나는 그 같은 생각, 나는 영원히 감사 훌륭한 사용자 경험을 사람들 그리고 창조적 인 사람과 전체 스택 엔지니어 누가 실제로 매일 이것에 대해 생각합니다 때문에 나는 정말 인상적입니다 생각합니다 당신은 나의 점과 이러한 출력을 어떻게 그리고 당신은 그들이 그렇게 많은 사람들이 그것을 사용할 수 있도록 난 그냥 항상 그런 종류의에 감동하고 있습니다

– 와우, 잘 당신이있어 무엇을 매우 인상적 에 걸쳐 데이터를 얻기 위해 수행 할 수 그 다양한 과학자들은 좀 더 의미있는 도움이됩니다 그러나 당신을 위해, 당신처럼뿐만 아니라, 모델을 생성하고 중요한 것을 찾는 부분 뿐만 아니라 당신은 또한 잘 이해하고 있어야합니다 게임과 그래서 작업이 매력이며, 발전이 일어나고보고 매우 매우 멋진 당신의 공간이다 내가 알아 원, 데이터 과학자의 많이있다 우리 사회에서 즉, 컴퓨터 비전에 점점보고있다 에 대해 생각하는 사람들도 있습니다, 그들은 지금 학생들이 고등학교 또는 대학에서 현재입니다 그들은 학위를 추구해에 대해 생각하고 데이터 과학이다 당신이 그들에 대한 어떤 조언이 있다면 궁금 해서요

– 예 나는 조언이 비트를 가질 수 내가로부터 입수 한, 오, 감사합니다 알렉스을 주셔서 감사합니다 나는 사람들을위한 조언의 비트를 가지고 내 교수로부터받은으니 과거에 내 상사뿐만 아니라 우선은 호기심이 유지된다 나는 기본적으로 묻는에 의해 컴퓨터 비전에있어 이봐, 당신은 내가 그와 함께 재생할 수 있습니다, 거기에 mathed했습니다 잠시 동안? 또한, GP 프로그래밍에있어 이는 범용 GP 프로그램입니다

나는 기본적으로 말함으로써 그에있어, 당신은 당신이 볼 왼쪽에있는 그 사람을 알고있다 내가 그 일을 시작하면 될까요 있다는거야? 그리고 그들은 확실히, 오, 그래 좋아했다, 왜 안 호기심이있어 당신이 생각하는 것들에 자신을 가져 오기 흥미 진진하고 재미있다 그리고 둘째로,이 정말하고있다 어려운 일이 나는 대부분의 사람들이 투쟁이라고 생각합니다 많은 것들을 시도하고 대부분의 시간을 실패 준비합니다

당신은 기계 학습에있어 여부 또는 소프트웨어 공학, 인생의 대부분의 것들, 당신은, 30 일 (10), (20)을하려고합니다 40, 50 시간, 당신은 실패합니다 그러나, 당신이 말하는 그 한 시간이있을거야 오이 실제로 좋아요, 작동합니다 그래서 실패하는 것을 두려워하지 않습니다 그것은 완전히 정상 및 내가 이야기 한 매우 운이 있었어요 컴퓨터 비전에서 유명한 선수 중 일부 내가 CMU에서, 그리고 그 같은 일 동안 그들은 말했다 나는 모든 시간을 실패했지만 아무도 그것을 기억하지 않습니다

그들은 단지, 실제로 성공 시대를 기억합니다 나는 그 조언의 큰 조금 걸릴 것 같아요 아주 쉽게 때문에 그것에 대해 자신을 이길 수 있습니다 – 그래, 그 사랑, 그 멋진 조언이다 나는 약간의 에코를들을 수 있습니다 마지막 질문, 토론의 많은 거기에있는 약, 단지 데이터 과학에 점점 사람을위한 경우, 어떤 프로그램이 처음 배우는 지금은 파이썬이처럼 간주됩니다보고 있어요 언어를 배울 수 있습니다

당신은 어떤 조언이 있다면 궁금 해서요 사람들을 위해 단지로 시작하는 언어의 파괴? – 나는 개인적 관심사 뭔가 갈 것입니다 거 당신이 학습을 계속 것 것은, 그것을 할 아침에 일어나 경우는, 헤이 말 나는 임베디드 시스템에 매우 관심이 있습니다 나는 정말 멋지다 생각합니다 나는 그 사람들 중 하나 있어요 난 지금, C ++의 언덕에 거 실행 해요? 내가처럼 단지거야,이 굉장합니다! 하지만 당신처럼 사람이 있다면, 이봐, 나는이 책을 가지고 그들은 이야기 내가 배우고 싶은이 정말 멋진 라이브러리 컴퓨터 비전이나 기계 학습을 수행하는 방법, 사용 이동합니다

그것은 일부 오래된 언어이든 방금 생각은 정말 펑키하고 이상한 당신은 배우고 사랑 해요 여부는 새롭고 신선한 뭔가 여기 사무실에서, 사람들은 L에 정말 당신은 당신이 그것에 대해 흥분하는 경우, 그것을 배울 이동 알고있다 로 갈 잘못된 언어가 있기 때문에, 정말 없습니다 당신은 하나 개의 언어 배우면 비밀은있다 그것은 다른 언어를 배우는 것은 매우 쉽다

당신이 배운 때 그리고, 정말 쉽게 세 번째 내용으로 이동합니다 그래서 당신 관심사에 시간을 투자합니다 당신은 정말 민감한 경우 나는 C ++과 파이썬 원하는, 또는 내가 원하는 자바와 C, 몇 가지 예를 들어, 하나 이동 당신은 내가이있는 작업을 원하는 말할 것 그들은 무엇을 원하는 것입니다 하지만 그건 보조 관심사입니다, 말할 것입니다 먼저 흥분 무엇을 함께 할 것입니다

– 그 사랑 알렉스, 화면에 그것을 넣어 "당신이 그것에 대해 흥분이 있다면, 그것을 배울 이동합니다" 그 조언을 사랑 해요 제나, 당신의 시간 오늘 주셔서 정말 감사합니다 어디 모든 사람들이 당신에 대해 더 많은 정보를 얻을 수 있습니까? – 오, 당신이 링크드 인에 나를 찾을 수 있습니다

그것은 사이트에 연결되어 있습니다 또한, 두 번째 스펙트럼에 대해 자세히 알아 보려면 특히 인턴, 그래서 너희들이하는 경우 기계 학습 또는 컴퓨터에 대한 흥분, 그것을위한 사이트 – 당신에게 너무 굉장 감사 드리며 있는지 확인합니다 정보 섹션에 링크를 넣어 YouTube 동영상뿐만 아니라에서 페이스 북의 라이브 비디오의 코멘트 섹션 제나는, 시간을내어 주셔서 너무 감사합니다 우리와 함께 이야기하고 통찰력을 공유 컴퓨터 비전에 대한 우리와 함께 나는 시청 모두 감사드립니다, 당신의 마음에, 당신의 의견, 우리 모두 다음 주에 얘기하자

제나는 다시 한번 감사드립니다 – 그것은 큰있었습니다 당신에게 너무 많은 마이크를 감사드립니다 – 좋아,주의하십시오 – 감사