SAS Demo | Deep Learning with Python (DLPy) and SAS Viya for Computer Vision

안녕하세요, 저는 Susan Kahler이고 인공 지능과 기계 학습에 대한 책임이 있습니다 SAS에서

이 비디오에서는 SAS Deep Learning Python API 또는 DLPy에 대해 간략하게 설명합니다 이 시리즈는 DLPy가 지원하는 최신 컴퓨터 비전 모델에 중점을 둘 것입니다 DLPy를 통해 Python에 익숙한 데이터 과학자는 딥 러닝을 활용할 수 있습니다 SAS Viya의 컴퓨터 비전 기능 설명의 링크를 사용하여 주제로 직접 이동하십시오

첫 번째 섹션에서는 DLPy와 함께 Functional API를 활용하여 빌드하는 방법을 살펴 봅니다 ResNet 모델을 포함한 기능 추출을위한 복잡한 모델 다음으로 축구를 추적하기 위해 U-Net 모델을 사용하여 이미지 세분화를 수행하는 방법을 볼 수 있습니다 선수 그런 다음 DLPY가 VGG16을 백본으로 사용하여 Faster R-CNN을 사용하여 객체 감지를 지원하는 방법을 살펴 보겠습니다 회로망

스위칭 기어, DLPy가 어떻게 MobileNet 및 ShuffleNet을 지원하고 성능을 비교하는지 살펴 보겠습니다 ResNet50 모델이있는 모델 중 하나입니다 마지막으로 훈련과 추론 모두에서 멀티 태스킹 학습이 수행되는 방법을 살펴 보겠습니다 제품 권장 사항에 대해서는 소매 도메인에서 추론을 위해 Python 용 이벤트 스트림 처리 패키지 인 SAS ESPPy를 사용합니다 DLPy에는 Python 3 이상 및 SAS Viya 34가 필요합니다

또한 Analytics 전송을위한 SAS 스크립팅 래퍼 또는 SWAT 패키지가 필요합니다 DLPy는 python-dlpy 디렉토리의 SAS 소프트웨어 용 GitHub에서 사용할 수 있습니다 이 비디오에 실린 Jupyter 노트북도 해당 위치에 있습니다 DLPy의 최신 컴퓨터 비전 기능에 대해 배우고 즐기시기 바랍니다 스스로를 위해

안녕하세요, 저는 SAS의 데이터 과학자 인 Wenyu이며 딥 러닝과 컴퓨터에 중점을 둡니다 비전 API 이 비디오에서는 고급 Python API, Python을 사용한 SAS Deep Learning 또는 (DLPy) 이 비디오의 목적은 SAS에서 기능적 API를 활용하는 방법을 보여주는 것입니다 복잡한 모델을 만들기위한 DLPy 보다 유연한 방법을 제공하기 때문에 Functional API에 중점을두고 있습니다

Keras Functional API와 매우 유사한 복잡한 모델을 구현하십시오 Sequential API는 공유 모델을 만들 수 없다는 점에서 제한적입니다 레이어 또는 여러 입력 또는 출력이 있습니다 입력 및 출력이 여러 개인 모델이 Functional API를 사용하는 좋은 예입니다 간단한 6 단계로 SAS DLPy를 사용하여 모델을 생성 해 봅시다

텐서를 반환하는 Input ()에 의해 두 개의 텐서 (회색조 이미지와 RGB 이미지)를 정의합니다 목적 그런 다음 그레이 스케일 이미지가 두 개의 컨볼 루션 브랜치에 공급됩니다 이 모델에는 또 다른 입력 컬러 이미지가 있습니다 그런 다음 이미지의 특징을 추출하기 위해 컨벌루션 연산이 사용됩니다

세 개의 텐서가 연결되고 OutputLayer_1에서 분류를 계산하는 데 사용됩니다 손실 또한 모델은 OutputLayer_2를 통해 감독됩니다 그런 다음 정의 된 입력 텐서 및 출력 텐서를 Model () 함수에 전달합니다 마지막으로 compile ()을 호출하여 네트워크를 컴파일합니다

여기서는 모델의 요약과 네트워크 그래프를 보여줍니다 레이어 연결 이 다음 모델에서는 ResNet 유사 모델을 작성하는 방법을 고려하십시오 이 작업에서는 돌고래 또는 기린을 포함하는지 여부에 따라 이미지를 분류합니다 먼저 각각의 직후에 배치 정규화를 채택하는 회선 블록을 정의합니다

회선 다음으로, 나머지 블록 내에서 바로 가기 연결을 사용하여 입력 기능을 연결합니다 컨볼 루션의 출력에 4 개의 누적 잔차 블록이 있으며 네트워크는 전체 평균 풀링으로 끝납니다 다음은 4 개의 잔차 블록이 순차적으로 누적되고 전체 평균이 표시되는 모델의 그래프입니다 풀링

모델이 빌드되면 ImageTable API에 의해 데이터가로드되고 모델을 학습 할 수 있습니다 순차적 인 모델처럼 SAS DLPy API를 사용하면 사전 훈련 된 여러 출력 모델을보다 쉽게 ​​정의 할 수 있습니다 기능 추출기로서의 백본 다음 경우에는 가중치와 함께 ResNet18 모델을로드합니다 다음으로로드 된 모델을 기능 모델로 변환하고 원래 작업 계층을 삭제합니다 이를 위해 to_functional_model ()을 사용하고 stop_layers를 지정합니다

그래프 이동을 중지하는 레이어 즉, stop_layers와 stop_layers가 뒤에 오는 모든 레이어가 제거됩니다 기능적 모델 그런 다음 OutputLayer와 Keypoints Layer라는 두 가지 새로운 작업 계층을 추가합니다 그래프 하단에서 새로 추가 된 두 개의 레이어를 볼 수 있습니다

이 비디오에서는 DLPy를 사용하여 여러 입력 및 출력을 가진 모델을 만든 다음 ResNet과 유사한 모델이며 마지막으로 순차 모델을 기능 모델로 변환했습니다 시청 해 주셔서 감사합니다 안녕하세요, 저는 Maggie Du이고 SAS의 기계 학습 개발자이며 딥 러닝 및 컴퓨터 비전 API 이 비디오에서는 DLPy라고하는 SAS 고급 딥 러닝 Python API를 사용하여 게임에서 축구 선수를 추적하는 이미지 분할 문제를 해결하는 방법을 보여줍니다 각 플레이어에 대한 통계를 제공합니다

코치에 의한 경기 후 분석과 같은 여러 목적으로 통계를 사용할 수 있습니다 팬들에게 증강 게임 시청 경험을 제공합니다 이미지 분할은 이미지를 의미 적으로 의미있는 부분으로 분할하려고 시도합니다 각 부분을 사전 정의 된 레이블 중 하나로 분류합니다 따라서 픽셀 수준에서 이미지를 이해하는 새로운 방법입니다

예를 들어이 이미지에는 개, 고양이 및 배경의 세 가지 클래스가 있습니다 따라서 우리는 각 픽셀에 어떤 클래스가 속하는지를 나타내는 특정 색상을 부여합니다 전반적으로 각 객체의 정확한 경계를 얻을 수 있습니다 시작하자 필요한 모듈을로드 한 후 데이터 세트를로드하려고합니다

우리는 축구 경기의 이미지를 예로 들어 170 이미지가 포함 된 모두 256 * 256으로 조정되었습니다 다음은 원시 이미지와 해당 주석의 시각화입니다 이미지에는 축구 선수, 축구 공 및 배경의 세 가지 다른 객체가 있습니다 따라서 주석 이미지에는 세 가지 색상이 포함됩니다 그런 다음 데이터 세트를 학습 데이터, 유효성 검사 데이터 및 테스트 데이터로 무작위로 나눕니다

다음으로 SAS DLPy를 사용하여 U-Net 모델을 구축하려고합니다 이 대칭 모델은 인코딩과 디코딩의 두 부분으로 볼 수 있습니다 기능 크기가 가장 작은 레이어 인 병목 현상 레이어로 분할됩니다 인코딩 부분에서 풀링 레이어를 사용하여 다운 샘플링을 수행하여 기능을 추출합니다 디코딩에서 입력 컨볼 루션 레이어를 사용하여 입력 이미지에서 업 샘플링 학습 된 정보를 재구성하는 부분

또한 텐서를 직접 결합하는 4 개의 연결 레이어를 모델에 추가했습니다 두 개의 다른 레이어에서 이전의 특정 정보를 쉽게 상속받을 수 있습니다 층 SAS DLPy는 사전 정의 된 U-Net 모델을로드하는 기능을 제공합니다 인코딩을위한 4 개의 풀링 계층 및 디코딩을위한 4 개의 전치 컨볼 루션 계층

축구 경기 데이터 모델에는 3 천 4 백만 개가 넘는 매개 변수가 포함되어 있습니다 SAS DLPy API를 사용하여 계층별로 고유 한 U-Net 모델을 만들 수도 있습니다 병목 현상 레이어의 크기 및 컨볼 루션 수와 같은 기능을 쉽게 결정할 수 있습니다 두 풀링 레이어 사이에 원하는 레이어 아키텍처가 구축되면 교육 데이터를 사용하여 모델을 교육하고 유효성을 검사 할 수 있습니다 검증 데이터 사용

교육이 완료된 후 테스트 데이터를 사용하여 모델의 성능을 테스트 할 수 있습니다 새로운 이미지를 수행합니다 스코어링 메트릭을 확인하거나 예측을 직접 시각화 할 수 있습니다 이 예에서 잘못된 분류 비율은 056 %로 65,536 픽셀 중 약 360 픽셀 만 잘못 레이블이 지정됩니다 두 번째 방법은 간단합니다

여기에 원시 이미지, 주석 및 예측을 나란히 놓고 모델의 성능을 확인하기 위해 모든 것을 쉽게 비교할 수 있습니다 첫 번째 열에는 원시 이미지가 표시되고 가운데 열에는 실제 이미지가 표시됩니다 세 번째 열의 이미지는 예측에서 얻습니다 마지막 두 열 사이에는 약간의 차이 만 있습니다 이는 U-Net 모델을 의미합니다

이 데이터에 매우 효과적이었습니다 이 비디오에서는 SAS DLPy를 사용하여 이미지 세분화 모델을 신속하게 구축하고 이 모델에 대한 교육 및 스코어링 방법 SAS DLPy에는 훨씬 더 많은 기능이 포함되어 있으므로 향후 사용 사례 시청 해 주셔서 감사합니다! 안녕하세요, 제 이름은 Xindian Long이고 컴퓨터 비전을위한 딥 러닝 알고리즘을 개발합니다 YOLO, Faster R-CNN, Mask R-CNN 등 SAS Deep Learning for Python (또는 DLPy)은 고급 Python과 함께 제공됩니다 사용자가 이러한 기능을 사용할 수 있도록하는 API

현재 그림 1과 같이 주로 물체 감지 방법에는 두 가지 유형이 있습니다 첫 번째 방법은 단일 단계 방법입니다 이 유형의 방법에서 경계 상자 지역화 및 객체 분류는 하나에서 수행됩니다 단계 YOLO, SSD와 같은 알고리즘이이 범주에 속합니다

두 번째 방법은 다단계 방법입니다 여기에는 두 가지 단계가 있습니다 첫 번째 단계에서 지역 제안 네트워크는 관심있는 직사각형 지역을 찾는 것입니다 객체를 포함 할 가능성이 높은 (또는 ROI) 두 번째 단계에서는 추가 회귀 및 분류를 수행하여 실제로 해당 지역에 개체가 있으며, 그렇다면 범주와 정확한 위치 그리고 모양입니다 Faster R-CNN, R-FCN과 같은 알고리즘이이 범주에 속합니다

첫 번째 범주의 알고리즘은 일반적으로 두 번째 범주의 알고리즘보다 빠릅니다 예를 들어 실시간 성능이 필요한 응용 프로그램이있는 경우 YOLO는 아마도 좋은 선택 Faster R-CNN과 같은 두 번째 범주의 알고리즘은 일반적으로 더 정확합니다 “Faster R-CNN”이라는 이름이 언급 된 다른 알고리즘보다 더 빠르게 실행되는 것은 아닙니다 이리

R-CNN 및 Fast R-CNN 알고리즘보다 이전 버전보다 훨씬 빠릅니다 그림 2는 앵커 박스의 중요한 개념을 보여줍니다 그들은 객체에 사용됩니다 YOLO와 Faster R-CNN의 탐지 알고리즘 이 개념을 이해하는 것이 매우 중요합니다 앵커 상자는 이미지의 여러 위치에있는 추상 상자이며 일반적으로 그리드 패턴

사전 정의 된 모양으로 사전 설정된 개수의 경계 상자를 예측하는 데 사용됩니다 각 위치에서 앵커 상자는 예측 된 위치의 초기 값으로 사용됩니다 모양에 따라 개체 크기 / 모양에 대한 사전 지식이 포함되어 있습니다 그림 2의 이미지에서이 한 위치에 많은 앵커 박스가 있음을 알 수 있습니다 상자마다 모양이 다른 물체를 감지합니다

예를 들어이 이미지에서 빨간색 앵커 상자는 사람을 감지하는 상자입니다 물론 최종적으로 감지 된 물체 모양은 원래 물체와 약간 다를 수 있습니다 알고리즘이 최적화하기 때문에 앵커 박스의 모양 그림 3은 Faster R-CNN 네트워크 아키텍처를 보여줍니다 DLPy를 사용하면 계층별로 구축 할 필요가 없습니다 알고리즘 이해를 돕기 위해 그것에 대해 이야기하고 있습니다

그것의 첫 번째 부분은 백본 네트워크입니다 백본 네트워크에는 일반적으로 많은 회선 레이어와 풀링 레이어가 포함되어 있습니다 입력 이미지에서 기능 맵을 추출합니다 널리 사용되는 백본 네트워크에는 VGG16, ShuffleNet 또는 ResNet 등이 있습니다 응용 프로그램 및 요구 사항에 따라 선택할 수 있습니다

지역 제안 네트워크는 백본 네트워크를 따릅니다 지역 제안 네트워크는 많은 제안 된 관심 지역을 출력합니다 개체를 포함 할 가능성이 높은 창입니다 지역 제안 네트워크는 지역 이전에 두 개의 특수한 컨볼 루션 레이어로 구성됩니다 제안서 계층

지역 제안서 레이어에 대해 사용자가 지정해야하는 중요한 매개 변수는 앵커 박스는 제안 될 수있는 형태의 범위를 대략 결정합니다 그 후에는 ROI 풀링 레이어입니다 관심 영역을 백본 네트워크 출력 인 페더 맵에 매핑합니다 창 내부의 픽셀 값을 추출하고 다른 크기의 하위 이미지를 형성합니다 ROI 풀링 레이어는 모든 하위 이미지의 크기를 같은 크기로 조정합니다

이것은 기능 맵의 모든 채널에 대해 수행됩니다 따라서 각 ROI마다 3D 데이터 배열을 얻습니다이를 텐서라고합니다 ROI 풀링 레이어의 출력에는 제안 된 각 영역마다 하나씩 많은 텐서가 포함됩니다 관심의

네트워크의 마지막 부분은 각 텐서와 ROI에서 독립적으로 작동하며 하나를 만듭니다 각 ROI에 대한 결정 세트 먼저, 두 개의 완전 연결된 레이어가 있으며 분류간에 공유됩니다 그리고 경계 상자 회귀 그런 다음 분류 헤더와 경계 상자 회귀 헤더가 있으며 각 헤더 앞에 하나의 완전히 연결된 레이어로 각각

우리 시스템에서 분류 헤더와 바운딩 박스 회귀 헤더는 모두 FastRCNN 계층에서 구현됩니다 빠른 R-CNN 네트워크 아키텍처에 대한 간략한 소개와 알고리즘의 방법 공장 이제 노트북을 볼 수 있습니다 먼저 CAS 서버에 연결합니다 조치 세트를로드하십시오

그리고 CAS 라이브러리를 빌드하십시오 그런 다음 DLPy 함수를 호출하여 앞에서 설명한 모델 아키텍처를 빌드해야합니다 Faster_RCNN 그런 다음 데이터 세트를로드하고 훈련 세트와 데이터 세트로 분할합니다 여기서 데이터 셋과 라벨을 그래픽으로 시각화하고 이미지와 경계를 볼 수 있습니다 상자 및 레이블

네트워크 교육을 위해 사전 훈련 된 가중치를로드하고 대상 열을 정의한 다음 가중치를 계속 최적화하려면 fit 함수를 호출하십시오 그런 다음 predict 함수를 호출하여 객체 위치와 범주를 예측할 수 있습니다 마지막으로 탐지 결과를 시각화 할 수 있습니다 이미지에서 감지 된 개체 주위에 상자가 그려져 있음을 알 수 있습니다 객체 카테고리 자신감뿐만 아니라 보여줍니다

이미지에서 감지 된 양을보십시오 이것이 데모의 끝입니다 DLPy와이 예제를 사용해보십시오 시청 해 주셔서 감사합니다! 안녕하세요, Guixian Lin입니다 저는 SAS의 컴퓨터 비전 딥 러닝 개발자입니다

여기에 DLPy로 알려진 SAS 고급 딥 러닝 Python API를 사용하여 가벼우면서도 강력한 컨볼 루션 뉴럴 네트워크를 쉽게 구축하고 훈련 할 수 있습니다 이미지 분류 문제에 대한 (또는 CNN) 이 예에서는 의류를 분류합니다 VGG16 및 ResNet50과 같은 인기있는 CNN은 이미지 분류에 널리 사용되었습니다 뛰어난 정확성을위한 작업 그러나 자원이 제한된 모바일 및 에지 장치의 경우 이러한 CNN은 종종 너무 유용하게 큰

얼굴 인식 및 자율 주행 차와 같은 실시간 애플리케이션에는 충분히 빠르지 않습니다 다음으로 세 가지 효율적인 CNN 인 MobilenetV1, ShufflenetV1 및 MobileNetV2를 소개합니다 이 인기 CNN보다 훨씬 작지만 정확도는 비슷합니다 CNN의 핵심 구성 요소는 컨볼 루션 레이어라는 것을 알고 있습니다 효율적인 MobileNet 및 ShuffleNet의 기본 아이디어는 표준 컨볼 루션을 대체하는 것입니다

가벼운 컨볼 루션 그림 21은 표준 컨벌루션과 깊이 분리형의 차이점을 보여줍니다 깊이 컨벌루션과 포인트 컨벌루션으로 구성된 컨벌루션 맨 윗줄에서 각 블록은 컨벌루션 필터를 나타내며 총 c2 필터가 있습니다

각 컨볼 루션 필터는 공간 정보를 필터링하고 채널 정보를 결합합니다 한 번의 단계로 입력 기능 이를 위해서는 각 컨볼 루션 필터의 깊이가 입력 피처의 깊이와 일치해야합니다 여기서 깊이는 c1입니다 레이어가 깊어 질수록 피쳐 맵의 깊이가 더 커지는 경우가 종종 있습니다

이러한 인기있는 CNN이 매우 큰 이유입니다 두 번째 행은 깊이 컨벌루션이 공간 정보를 채널별로 필터링 함을 보여줍니다 즉, 각 깊이 방향 컨볼 루션의 깊이는 레이어의 깊이에 관계없이 항상 1입니다 입니다 깊이 컨볼 루션은 입력 채널 만 필터링하므로 출력을 결합해야합니다

유용한 기능을 생성하는 기능 이것은 커널과의 표준 컨볼 루션 인 포인트 컨벌루션으로 수행 할 수 있습니다 1 회 1 회 표준 컨벌루션을 깊이 컨벌루션으로 교체 한 다음 점별 컨볼 루션에서 유사한 방식으로 피쳐와 패턴을 추출 할 수 있지만 모델 크기는 극적으로 감소했습니다 그림 22는 그룹 컨볼 루션을 설명합니다

채널을 여러 그룹으로 나누고 각각의 표준 컨볼 루션을 적용합니다 그룹 예를 들어 g 개의 그룹이있는 경우 모델 크기를 1 / g의 차수로 줄일 수 있습니다 그림 23은 MobileNetV1, ResNet50, ShuffleNetV1 및 MobileNetV2의 빌딩 블록을 보여줍니다

MobileNetV1의 경우 아키텍처는 VGG와 유사합니다 VGG의 표준 컨벌루션을 경량 깊이 컨볼 루션으로 대체합니다 포인트 컨벌루션이 뒤 따른다 ResNet은 종종 ResNet 블록으로 인해 VGG보다 성능이 우수하기 때문에 ShuffleNetV1 MobileNetV2는이 아이디어를 빌 렸습니다 둘 다 ResNet 블록의 표준 컨벌루션을 깊이 컨벌루션으로 대체하여 모델 크기

ShuffleNetV1은 포인트 컨벌루션을 그룹 컨볼 루션으로 대체하여 모델 크기 이제 경량 컨볼 루션이 더 작은 모델을 빌드하는 데 유용하다는 것을 이해합니다 및 ShuffleNet 다음으로 의류 소매 제품 데이터에 대한 성능을 보여 드리겠습니다 먼저 데이터 세트를로드하고 일부 이미지를 표시합니다

여기에는 6 개의 수업이 있으며 약 2,100 개의 이미지가 있습니다 다음으로, 우리는 훈련과 평가를 위해 무작위로 데이터를 훈련과 테스트로 나누었습니다 다른 CNN SAS DLPy는 다양한 사전 구축 네트워크 아키텍처를 제공합니다 매우 효과적입니다

여기서는 CNN을 구축하는 데 사용할 것입니다 MobileNetV1 아키텍처의 경우 다음과 같은 기본 매개 변수를 지정합니다 클래스 수 입력 이미지를 정규화하기위한 오프셋 및 스케일로 분류 될 수있다 또한 임의 뒤집기와 자르기를 사용하여 입력 이미지를 보강합니다 MobileNetV1 모델에는 축소 매개 변수 인 alpha가있어 출력 채널 수 옵티 마이저를 설정 한 후 모델을 학습 할 준비가되었습니다

훈련 로그는 많은 유용한 정보를 알려줍니다 여기에서 모델 매개 변수의 수가 8 백만임을 알 수 있습니다 대상에는 6 개의 클래스가 있습니다 훈련 손실과 오류로 반복 기록을 그릴 수 있습니다

16 오류 후 훈련 오류가 감소하고 수렴 함을 보여줍니다 최종 교육 오류는 약 54 %입니다 다음으로 테스트 데이터에서 모델 성능을 평가합니다 MobileNetV1 모델의 오류율은 5

3 %입니다 좋아요! 올바른 예측과 잘못된 예측을 통해 모델을 확인함으로써, 모델이 패턴을 배우고 합리적인 예측을한다는 것을 알 수 있습니다 다음으로 비슷한 단계를 따라 다른 CNN (ShuffleNetV1, MobileNetV2, 및 ResNet50 자세한 내용은 노트북을 참조하십시오 이 모델의 테스트 오류는 다음과 같이 요약됩니다

탁자 이 3 가지 경량 모델은 일반 모델보다 매개 변수가 훨씬 적습니다 ResNet50은이 소매 데이터의 정확성을 향상시킵니다 이 비디오에서 SAS DLPy를 사용하면 이러한 작은 크기를 빠르게 구축하고 훈련 할 수 있습니다 그러나 효율적인 CNN

앞으로의 작업에 이러한 모델을 적용 해 볼 수 있기를 바랍니다 시청 해 주셔서 감사합니다! 안녕하세요 제 이름은 웨인 톰슨입니다 저는 SAS의 데이터 과학자이며 딥 러닝과 함께 일할 수있는 특권이 있습니다 R & D 팀 컴퓨터 용 Python 및 DLPy 및 SAS Viya를 사용한 딥 러닝을위한 비디오 시리즈입니다

시력 이 특정 비디오에서는 패션에 태그를 지정하기 위해 멀티 태스킹 딥 러닝 모델을 훈련하고 싶습니다 품목 이제 기계 학습에서 종종 이미지를 가져 와서 레이블을 지정하고 단일 이미지를 만듭니다 옷의 종류를 분류하는 것과 같이지도 학습을 통해 하나의 작업을 분류합니다 드레스인가요? 티셔츠인가요? 벨트인가요? 그리고 색상과 같은 다른 의미 속성이 있고 입력 데이터에 레이블을 지정하면 색상을 분류하기 위해 회선 신경망과 같은 다른 것을 훈련하십시오

종종 고려해야 할 장점과 장점 중 하나는 단일 모델을 훈련시키는 것입니다 이 두 가지 과제를 동시에 동시에 배우는 것입니다 이를 유용한 정보를 활용하는 패러다임 인 멀티 태스킹 학습이라고합니다 전체적인 일반화를 향상시키기 위해 여러 관련 작업에서 즉, 모델이 더 잘 맞는 경향이 있습니다 한 작업에 대한 정보가 다른 작업을 예측하는 데 신뢰성을 부여 할 수 있기 때문에 좋습니다

단일 모델이 있으므로 두 모델을 사용하는 것보다 배포가 훨씬 쉽습니다 또는 더 많은 모델 따라서보다 쉽게 ​​관리하고 생산할 수 있습니다 시작하기 전에 멀티 태스킹 학습은 매우 강력합니다 자율 주행 차와 같은 많은 응용 분야에 사용됩니다

영어로 된 문서 모음이 있다고 가정 해 봅시다 프랑스어, 독일어 및 이탈리아어로 번역하고 싶습니다 거기에는 동시에 훈련하는 세 가지 작업이 있습니다 이제이 예에서는 이미 CAS 세션을 시작했습니다 DLPy를로드했으며 CAS 서버에 연결했습니다

가장 먼저 보여 드리고 싶은 것은 디스크에서 이미지를로드하고로드하는 방법입니다 이 예제에서는 하위 디렉토리에서 읽은 후 레이블을 재귀 적으로 가져옵니다 따라서 실제로 디스크에서 데이터를로드하여 메모리로 읽어들입니다 서브 디렉토리에서 레이블을 당기십시오 다음으로하는 일은 간단한 빈도 수이며 데이터가 상당히 균형을 이루고 있음을 알 수 있습니다 모든 작업에서 332 개에서 386 개의 관측치가 있습니다

이런 종류의 균형을 가질 필요는 없으며 분명히 콜스 나 메이 시즈, 우리는 더 많은 관측을 할 것이지만 이것은 간단한 데모입니다 이제 멀티 태스킹 딥 러닝을 수행하는 데있어 가장 까다로운 부분 중 하나는 작업 레이블 자체 이제 내가하고있는 첫 번째 일은 Pandas 데이터 프레임을 사용하고 getDummies를 단순히 이진 지표를 만듭니다 딥 러닝 패키지에는 정말 강력한 것이 있습니다 SAS 함수 컴파일러입니다

이를 사용하여 자신의 손실 함수를 찾을 수 있습니다 여기에서는 계산 된 vars를 사용하여 조건부로 추가 작업을 조건부로 정의하고 있습니다 여성, 의복의 조화는 무엇이며, 나는 그것을 다른 사람들과 다시 합류합니다 데이터 여기 간단한 머리를보고 몇 가지 관찰 만 살펴보면 이제 9 개의 총 작업이 동시에 진행되고 있음을 알 수 있습니다

여자를위한 것이 든 아니든 자, 여기에 이미지를 보여 드리는 예가 있습니다 그들이 어떻게 생겼는지 딥 러닝의 많은 머신 러닝 문제와 마찬가지로 데이터 크기도 조정합니다 200×200으로 설정하고 CAS 서버의 모든 작업자 노드에서 데이터를 섞습니다 여기서 20 %의 샘플을 작성하고 있음을 명심하십시오 이것은 홀드 아웃 데이터 세트 테스트이며, 나머지 80 %의 데이터를 사용하여 학습합니다

에 모델 이제이 시점에서 직접 비순환 그래픽 인 기본 아키텍처를 정의하겠습니다 네트워크를 위해 그리고 DL Plot을 사용하여이를 수행하고 있습니다 입력 레이어, 컨볼 루션 레이어, 배치 규범 풀링 및 밀집 레이어가 있습니다

그러나이 네트워크 플롯을 보면 기본적으로 하나의 아키텍처가 있음을 알 수 있습니다 그리고 그 아키텍처는 우리가 시도하는 모든 결과 작업과 공유됩니다 예측하십시오 모든 작업에 대해 동일한 네트워크를 가질 필요는 없습니다 이것은 기본 예이며 여기에서 실제로 잘 작동합니다 예측하려는 각 작업에 대해 서로 다른 네트워크 아키텍처를 가질 수 있습니다

아키텍처를 정의한 후 모델을 학습하려고합니다 이 예에서는 운동량과 같은 매우 기본적인 최적화 방법을 사용하고 있습니다 60 개의 EPICS를하고 있는데 훈련 옵션을 정의하고 싶습니다 이제 partition이 0 인 곳을 사용하고 있습니다 그것은 훈련 데이터의 80 % 만 가져올 것입니다

모델 무게 등 나중에 득점을 할 수 있습니다 GPU에서도 이것을 훈련하고 있습니다 딥 러닝의 곱셈 특성으로 인해 네트워크를 더 빨리 훈련시킬 수 있습니다 모델과 더 빠른 실험

다양한 최적화 방법을 시도해보고 궁극적으로 최상의 모델을 얻을 수 있습니다 더 빠르게 여기에 약간의 출력이 있지만, 내가 시도한 것은 이것을 이것에 요약합니다 반복 플롯 우리가 60 번의 EPICS를했다는 것을 기억하십시오 약 13 ~ 14 개의 EPICS 어딘가에서 쇠퇴와 상실과 시대를보고 있습니다

모델이 실제로 안정화 된 것 같습니다 나는 실제로 그것을 자랑스럽게 생각합니다 좋아 보인다 테스트 데이터와 비교하여 먼저 확인하겠습니다 이 모델은 훈련을 위해 개발되었습니다 이제 데이터의 20 %를 부분 집합 화하겠습니다

훈련에서 절약 한 모델 가중치를 사용하여 해당 데이터의 점수를 매길 것입니다 그리고 여기서 볼 수 있듯이 모든 작업에 대해 평균 제곱 오차가 매우 낮습니다 좀 더 세분화되고 실제로 혼동 행렬과 같은 것을보고 모델이 테스트 데이터에 얼마나 잘 맞는지 그런데이 예측값 p_는 테스트 데이터에 대한 예측값을 나타냅니다 내가 훈련 한 모델에 나는 판다에서 약간의 일을한다 파이썬을 DLPy와 똑바로 혼합하는 것이 좋습니다

그리고 9 가지 작업 각각에 대한 분류 행렬 인 혼동 행렬을 얻습니다 행은 실제 값을 나타내고 열은 예상 값을 나타냅니다 벗어난 대각선에서, 우리가 잘못한 곳입니다 여기에 검은 색은 4 개, 파란색은 4 개, 빨간색은 1 개, 우리는 다른 수업을 살펴보고 정말 잘하고 있습니다 마지막으로, SAS에서 딥 러닝의 비밀 소스 조각 중 하나는 ASTORE

여기에서 실제로 모델을 이진 파일에 저장하여 배치 스코어링을 수행 할 수 있습니다 스트리밍 분석을 사용하여 점수를 매기거나 다른 모델과의 작업을 위해 모델을 ONNX로 가져 오기 PyTorch 및 TensorFlow와 같은 패키지 여기에이 작업을 완료하고 모델을 저장했으며 다음 비디오에서는 실제로 스트리밍 분석을 사용하여이 모델의 점수를 매기는 방법을 살펴 보겠습니다 결론적으로, 멀티 태스킹 딥 러닝은 실제로 여러 개를보고 예측할 수있게합니다 동시에 작업

DLPy를 사용하면 간단합니다 다음 비디오에서 to기를 기대합니다 Python 및 SAS Viya Computer Vision Series를 사용한 딥 러닝에 오신 것을 환영합니다 제 이름은 웨인 톰슨입니다 저는 SAS의 데이터 과학자이며 SAS Deep과 함께 일합니다

학습 R & D 팀 이 비디오에서는 DLPy의 자매 인 ESPPy를 사용하여 멀티 태스킹을하고 싶습니다 딥 러닝 모델 이제 이미 멀티 태스킹 딥 러닝 모델을 훈련했습니다 이미지를 모아서 9 가지 작업을 예측하고 동시에 수행 할 수있는 모델을 개발했습니다

이 예제에서하고 싶은 것은 ESPPy를 사용하는 것입니다 또한 SAS 이벤트 스트림 처리 창에 연결할 수 있습니다 프로젝트를 구축하고 창과 상호 작용하며 모델을 배포합니다 SAS Event Stream Processing은 정말 멋집니다 여기에는 클러스터링에서 시계열 분석에 이르는 여러 스트리밍 작업이 포함됩니다

감정 분석 또는 공동 필터링과 같은 작업도 수행 할 수 있습니다 하지만이 데모에서는 이미지 처리 창과 온라인 창을 사용하겠습니다 딥 러닝 멀티 태스킹 모델을 배포 할 수 있습니다 이제 가장 먼저해야 할 일은 실제로 프로젝트를 만드는 것입니다 이 멀티 태스크를 호출하고 실제로이 셀을 실행하겠습니다

그리고 다음으로하고 싶은 것은 프로세스 흐름이나 관로 실제로 이미지를 읽으려면 소스 창이 필요합니다 우리가 일부 교육에서했던 것처럼 모델을 훈련 할 때마다 일반적으로 이미지 따라서 점수를 매길 때 20에서 20으로 크기를 조정하고 이미지 처리를 사용하겠습니다 그렇게하는 창

다음은 모델을 가져와야한다는 것입니다 모델을 학습하고 ASTORE로 저장 했으므로 모델 리더가 있습니다 그것을 읽을 수있는 창 그리고 실시간으로 점수를 생성하는 득점 창이 있습니다 그리고 보면, 프로젝트는 다음과 같습니다

나는 데이터를 읽고 이미지를 표준화하고 점수를 생성합니다 그런 다음 실제로 프로젝트를로드하고 몇 개의 출력 테이블을 설정하겠습니다 여기에 쓸 것입니다 이제 첫 번째 노트북을 사용하여 실제로 노트북을 정의하기 때문에 별도의 노트북이 있습니다 ESP 프로젝트

이 책에서는 간단히 게시하고 점수 매기기 프로세스를 시작하겠습니다 그래서 저는 팔고이 모든 것을 실행합니다 실제로 모델의 점수를 매 깁니다 다시 여기로 돌아가서 이제 이벤트 스트림 처리 엔진을 사용하겠습니다 득점

실제로 예측 확률과 함께 태그가 지정되고 라벨이 지정된 이미지가 표시되는 것을 볼 수 있습니다 작동하는 예제를 제공하는 작은 세트입니다 수면 시간은 03입니다 이벤트 스트림 처리 엔진은 실제로 초당 최대 50 프레임을 수행 할 수 있습니다

시원한 이 데모에서는 이미 멀티 태스킹 학습을 위해 개발 된 모델을 검색을 용이하게하기 위해 스트리밍 분석을 사용하여 배포 할 수있었습니다 콜이나 메이시 같은 사람 교육용 DLPy와 함께 ESPPy를 사용하면 실제로 쉽게 수행 할 수 있습니다

The Computer as Collaborator: Machine Learning and Creative Practice | Loop

안녕하세요 공동 작업자 인 컴퓨터에 오신 것을 환영합니다

기계 학습 및 크리에이티브 프랙티스, 저는 Marijke Jorritsma이고 오늘의 패널을 검토 할 것입니다 오늘 우리는 내가 믿는 것의 최전방에있는 패널리스트 중 한 명을 우리와 함께 할 수있어서 행운입니다 음악 제작의 새로운 패러다임 우리의 기본 가정에 도전하는 것 기술이 창의적 과정에서 수행해야하거나 수행 할 수있는 역할에 대해 설명합니다 오늘 우리에게 합류하면 멀티미디어 아티스트, 창의적인 기술자 및 음악가 Lucky Dragons가 될 것입니다

개념적인 아방가르드 듀오 YACHT 그리고 현재 개발하고 있으며 의미를 학습하고있는 Google Magenta 팀 창조적 인 프로세스를 지원하는 기계 학습 도구를 만드는 것 그래서 우리는 오늘 한 시간 밖에 안 남았습니다 그리고 이것은 여러분 중 많은 사람들이 저와 함께 매우 흥분되는 큰 주제입니다 이 새로운 기술이 음악 제작자 및 광고 소재로 우리에게 제공 할 수있는 것을 배우는 데 있습니다

따라서 우리가 조직 한 방식은이 그룹들 각각이 프레젠테이션을 할 것입니다 그러면 우리는 각 그룹의 구성원들이 패널 토론을하기 위해 우리를 대표하게 할 것입니다 1 시간 밖에 없으므로이 세션에서 Q & A 시간을 가질 수는 없지만 이후에는 연극을 직접 떠나서 복도에있는 사람들과 만나고 싶다면, 그들에게 직접 질문 할 수 있습니다 그래서 우리는 럭키 드래곤즈를 무대로 불러서 시작할 것입니다 그래서 제 이름은 루크입니다

– 난 사라 라라 그리고 우리는 당신과 함께 여기에 있기 위해 너무나 흥분되고 영광입니다 그래, 그냥 우리가 가서 우리가 이것에 대해 적극적으로 배우고 있기 때문에 이것의 일부가되는 것처럼, 우리는 어떤 느낌이 든다 우리는 생산적인 아마추어 같은 공간에 있습니다 그 일에 대해 사랑하고 열정적 인 사람입니다

그들은 기계 학습과 관련하여 막 배우기 시작했습니다 그리고 계속 마음에 두어야 할 것은 생각하는 것과 같은 것으로 들어가는 것이 어렵지 않다는 것입니다 당신은 지능형 기계 또는 듣는 법을 알고있는 기계를 생각해냅니다 그것은 실제로 우리가 이미하는 모든 것입니다 우리는 기계를 사용하여 우리가 감지 할 수있는 것을 확장하고, 우리가 듣고 볼 수있는 방법, 그리고 프로세스와 우리 자신의 편견을 새로운 방식으로 바라 볼 수 있습니다

그래서 우리는 단지 그것을 볼 순간이있는 곳을 볼 수 있으며, 우리 앞에 펼쳐진 모든 것을 볼 수 있습니다 그리고 저는 이것이 우리가 정말로 이끌어 낸 행동이라고 생각합니다 생각의 과정과 당신 앞에서 펼쳐지는 모든 가능성을보기 위해, 당신이 일하는 동안 당신의 마음에 그 가능성의 공간을 유지하십시오 그래서 나는 이것이 기대의 공간이며 다음 행동이 무엇인지 생각하고 있다고 생각합니다 아니면 우리에게도 정말로 중요한 것은 우리가 듣는 방식에 대해 생각하는 것입니다

그리고 우리의 귀와 우리의 관심이 경청되는 방법입니다 시력과 소리가 어떻게 다르게 작동하는지, 그리고 소리가 특별한 경우가 될 수있는 방법을 분별하려고합니다 듣기의 측면에서 우리가 인간으로하는 모든 작업의 ​​복잡성 : 소리 신호를 분리하는 방식 신호 자체, 언어가 차지하는 공간에 관한 정보를 전달할 수 있습니다 듣기의 이러한 모든 측면은 실제로

우리에게는 이전 관행에서 나옵니다 우리는 종종 Gertrude Stein의 반복에 대한 생각으로 되돌아갑니다 나는이 모든 것을 염두에 두어야 할 중요한 결과는 인간을 보존하는 것이라고 생각한다

또는 음악과 예술, 또는 어떤 종류의 상호 작용에 대해서 인간이 더 철저히 조사 할 수 있습니다 우리가 그것에 대해 알고있는 것과 우리가 서로를 향하여 행동하는 방식을 실제로 압축하고 있기 때문에 그리고 우리가 어떻게 살아가고 있는지 그래서 1935 년의 Gertrude Stein 강의, 초상화와 반복, 그녀는 기본적으로 삶을 압축하는 방법과 그것을 설명하는 방법에 대해 이야기합니다 그녀는 그렇게하기 위해 반복을 사용할 수 없다고 말했습니다 살아 있기 위해서는 반복하지 않는 것이 좋습니다

그것은 당신이 끊임없이 주장하거나 강조하고 있음을 의미합니다 그리고 이것은 내가 표현에 대해 생각하는 것입니다 그것은 활력을 가지고 있다는 것입니다 반복하는 것이 아니라 끊임없이 스스로를 주장하고 스스로를 주장하고 있습니다 그래서 무언가를 묘사하고, 그것의 삶에서 벗어나기 위해서, 반복하는 것입니다

반복은 인간이 정말로 나쁘다는 것을 발견합니다 우리가 행동이나 제스처를 반복 할 때, 시간이 지남에 무언가가 형성된다는 것은 항상 일종의 차이점을 가지고 있습니다 진정한 반복이 아니기 때문에 스타 인 (Stein)이 말한 강조점이 언제나 변했습니다 그리고 그녀의 "천재성"에 대한 정의는 말하는 동안 듣는 것입니다 그래서 그것은 우리가 또한 가지고있는 것입니다

기계 학습의 측면에서 생각 해왔다 인간이 듣는 동안 어떻게 반응합니까? 듣기도하면서 공연합니까? 그리고 그것은 뮤지션들이 할 훈련을받은 것입니다 듣는 동안 연주하도록 훈련 받았다 – 나는 음악가뿐만 아니라 살아있는 사람도 말할 것입니다 그래, 어떤 인간이든

어떤 의식적 존재 – 살아있는 상태 야 동시에 듣고 말할 때 누군가 살아 있는지 알 수 있습니다 그리고 우리가 디자인 한 시스템에서 우리가 사용하는 알고리즘에서 살아 있다는 것의 그 품질을 포착 할 수 있다면, 우리는 음악에있어서 가장 중요한 것이 무엇인지 생각하고 있습니다 그러나 나는 명심해야 할 또 하나 중요한 점은, 이것은 이미 우리가 사용하는 도구에 내장되어 있으며,이 모든 것에 주목해야 할 역할입니다

그리고 이것은 우리의 마음이 반복에 어려움을 겪는 방식에 관한 것입니다 우리의 기억으로 돌아가서, 일들을 예기하고, 그래서이 역방향주의를 기울이십시오 이해를 발전시키는 데 정말로 중요합니다 그래서 우리는 다이애나 도이치 (Diana Deutsch)의 실험에 기초한 일련의 녹음을 만들었습니다 UC, 샌디에고

그리고 그녀는 청각 환상을 연구합니다 그래서 그녀는 소리의 공간을 연구합니다 거기에는 일종의인지 적 미끄러짐이 있습니다 그리고 흥미로운 점은 착시에 대한 것입니다 무수한 착시 현상이 있지만 청각 적 착각에 대해서는 단지 40-50 정도 밖에 알려져 있지 않습니다

청각 환상, 그리고 대부분은 지난 20 년 동안 도이치에 의해 발견되었습니다 그래서 그들은 새로운 발견들입니다 그리고 그것은 또한 나는 소리가 특수한 경우이고, 소리가 이미지와 다르다는 것을 지적하기 위해이를 지적합니다 그러나이 실험에서, 피실험자는 매우 빠른 간격으로 반복되는 인간의 목소리로 말한 음절을 듣습니다 왼쪽과 오른쪽을 교대로 반복합니다 그리고 그가 신호를 유지하더라도 피실험자는 다른 음절과 문장 및 문장을 생성하기 시작합니다 마치 마음이 실제로 반복을 가질 수없는 것처럼 말입니다

사운드 신호를 처리하려면 인간 피험자는 해석과 언어의 차이와 층을 삽입 할 것이다 그래서 우리는이 일련의 녹음을 제작 한 다음 다른 청취자가 녹음을 듣게했습니다 청취자에게 고유 한 청취자로 생성 된 단어를 기록하십시오 처음부터 조금만 들으 십시다 그리고 당신은 당신의 마음을 표류하게 할 수 있습니다

반복되는 패턴을 듣고, 어떤 사람들은 음악으로, 어떤 것은 언어로 듣습니다 우리에게 이것은 기계에 의해 생산되는 무언가에 대한 흥미로운 사례 연구이지만, 우리는 청취자로서 그것을 완성합니다 그래서 당신은 그것을 듣기 위해 어떤 언어를 만들었기를 바랍니다 때때로 우리가 그 일을 생방송으로 수행 할 때 때로는 사람들이 공연 후에 나에게 와서 이렇게 말합니다 어떻게 그런 거짓 언어를 사용할 수 있습니까? 여기에 아이들이 있습니다

그리고 실제로 그것은 모두 청취자에 의해 생성됩니다 그래서 그것은 모두 당신의 상상력입니다 그러나 청취자 측에서 일어나는 야생과 미끄러짐은 무언가다고 생각합니다 이것이 우리가 사용하고있는 도구에 어떻게 암호화되어 있는지에 대해 정말 흥미 롭습니다 그래서 우리는 다양한 형태의 청취를 나타내는 역사적인 방법을 살펴 보는 것이 가치가 있다고 생각했습니다

그래서 이것은 Pierre Schaeffer의 'Musical Objects에 관한 논문'입니다 그래서 Pierre Schaeffer는 처음으로 일종의 절단 테이프로 샘플링 기술을 사용한 최초의 제품

– 테이프 음악, 초기 사운드 콜라주, 음악 콘서트 그래서 기본적으로 그는이 4 가지 모드를 함께 접는 것에 대한이 매우 포괄적 인 아이디어를 가지고 있습니다 항상 주기적으로 작동합니다 그리고 그 아이디어가 다른 청취 방식이 있는데, 청취, 이해,인지, 청각으로 정의했습니다 그리고 이것들은 순차적으로 또는 많은 차별화로 발생하지 않는다는 것입니다 그들은 한 가지 종류의 청취 또는 다른 것에 대한 강조 또는 강조와 동시에 발생합니다 그리고 저는 그것이 정말로 오늘날까지 계속되고 있다는 것을 알게됩니다

듣기는 듣기와 혼합되고, 듣기는 줄어 듭니다 소리의 품질에 대한 이해는 소리의 언어 적 파싱과 동시에 발생합니다 그리고 저는 또한 그것이 정말로 관련성이 높은 부분은 어떤 종류의 듣기가 배워지고, 그래서 당신은 소리의 분야에서 기호와 언어를 해석하는 법을 배울 수 있습니다 누군가의 목소리 나 특정한 구조를 듣고 있습니다 그러나 당신은 또한 종류의 de-learn 것을 할 수있다

원시, 주관적 인식에이 관심으로 돌아가는 것처럼 예를 들어, 고속 도로 옆에 살고 시간이 지남에 따라 그 소리를 듣지 않는 것을 배우면 이런 종류의 감정적 인 학습, 나는 흥미로운 극성이라고 생각한다 그래서 예, 이것이 피에르 쉐퍼 (Pierre Schaeffer)의 생애주기입니다 나는 그것을 사용하는 것을 일종의 척도로 사용하는 것이 흥미롭다 고 생각했습니다 그런데 이런 형태의 것이 우리가 사용하는 것입니다

어떻게 함께 작동합니까? – 그리고 그들은 어떻게 기계를 가르 칠까요? 이 미묘하게 다른 작업을 동시에 수행 할 수 있습니다 – 비슷한 것을 묘사하는 또 다른 아름다운 방법이라고 생각합니다 Pauline Oliveros의 "깊은 경청"아이디어입니다 이 글로벌하고 구체적인 듣기 항상 동시에 일어나야하고 콘서트가 서로 이루어져야합니다 그리고 그들은 동시에 일어납니다

그러나 당신은 당신의 시선을 이동시킴으로써이 지형의 소리를 통해 순항합니다 그리고 여러면에서 연습은 배운 것입니다 그것은 반드시 자동적 인 것은 아닙니다 Maryanne Amacher의 듣기 모델입니다 음악과 사운드를 구성하는 대신 그녀는 그녀의 작품을 "청중을 구성하는 것"으로 생각했다

– 때로는 매우 문자적인 것인데, 그녀는 일할거야 이런 종류의 톤 패턴을 생성하기 위해 매우 높은 볼륨으로 그리고 나서 그녀가 알아 차린 신체 반응, 귀에있어 생성 된 이러한 공진 주파수를 갖는 자동 음향 학적 물리적 응답 말 그대로 귀에 – 외부 신호로는 아무 일도하지 않습니다 또는인지 적 그것은 단지 당신이 이벤트를 가지고 뭔가, 당신은 달팽이관 응답을 가지고 그리고 나서 신경 학적 반응을 보입니다

그리고 이것들을 만들기 위해 모두 협력하고 있습니다 소리의 지각과 이해 – 그리고 나는 귀에 대한 그녀의 관계를 생각해 우리와 거의 비슷하게 협력자로서의 컴퓨터에 그녀의 실험에서 그녀는 거의 그녀가 소리를 감지하는 방식에 대해 생각을 외현 화하는 방식

거의 외계인의 품질이 있습니다 비록 그들이 모두 자기 자신의 귀에 속한다고 느끼더라도, 그녀가 공부하고있는 소리에 그리고 그녀의 음악이 녹음에 실제로 존재하지 않는다는 것을 알아 두는 것이 중요합니다 몇 곡이 녹음되어 있습니다 그러나 일반적으로 음악은 생동감 있고 특정 공간에서 경험 될 수 있도록 고안되었습니다

그래서 그녀는 할 것입니다 사운드는 벽을 통해 또는 거리를두고 또는 시간의 경과에 따라들을 수 있도록 의도 된 것입니다 그리고 육체적 인 위치에서 청취 경험을 접지하는 이런 종류의 신체, 신체, 당신 자신의 경험을 가지고 있다면, 나는 이것에서 벗어날만한 가치가있는 것이라고 생각합니다 그래서 마침내 우리는이 작품을 보게 될 것입니다 공연, 함께 걷고있는 성가대 한센 댐은 북쪽 산 페르난도 계곡에서 2 마일 길이의 길입니다

그리고 그 생각은 청중과 가수들이 함께 섞이도 록 합창단을 넓혀주는 것이 었습니다 이 접근 방식의 일부는 점수를 사용하는 일종의 공연 전통에서 왔습니다 텍스트 지침을 사용합니다 우리가 정보를 압축하는 방법 인 점수를 생각할 때, 이것은 압축 된 형태로,이 복잡한 형태의 엔티티로 디코딩되고 펼쳐집니다 따라서 우리의 마음에서 이것은 디지털 프로세스와 매우 관련이 있습니다

우리의 작업을 생성하는 이러한 텍스트 점수의 알고리즘 모델의 종류 그러나 우리가 기계 학습이나 기계 지능이라고 부르는 것을 위해 거기에 인간의 구성 요소가 무엇을 훈련에 포함 결정, 평가, 거기에 많은 그리고 그것에 내장 된 물론, 우리 자신의 편견과 자신의 방법입니다

자네가 재귀 과정인데 당신은 당신이이 모델들을 가지고 일할 때 당신의 편견이 명백하게 드러나는 것을 보게됩니다 그래서 우리는 매우 아날로그적인 것, 여러분이 얻을 수있는 아날로그의 것의 예를 공유하고 싶었습니다 그것은 공연이기 때문에 조금씩 보게되는 것은 각 가수가 그들 자신의 독특한 부분을 가지고 있다는 것입니다 그리고 그것은 함께 일하는 모든 사람들에게 분열되어 있습니다 그리고 각각의 가수들에게는 그들이 갈 수있는 다른 모드가 있습니다

그들은 다른 이들에게 그들의 노래를 가르 칠 수 있습니다 이것은 통화 및 응답에서 일종의 일이 전환 과정의 일종입니다 조화를 향하여 움직이기 때문에, 부르심과 응답에서, 한 마디로 일제히, 그리고이 과정에서 그들은 거의 일종의 그들의 두 곡 사이를 보간한다

그래서 우리는 누군가가 자신의 스타일, 취향, 공연 방법, 거의 명상적인 신체의 존재에 대한 그들의 감각을 알아 내고 그것을 다른 누군가와 공유하는 방법을 알아 내고, 컴퓨터로하는 방법에 대해 많이 생각하고 있다고 생각합니다 이것은 The Spreading Ground이며 Pacoima의 Hansen Dam에서 공연됩니다 먼저 다른 사람들이이 문제에 관해 더 많이 이야기하도록 설정했기 때문에 나는 먼저 나가는 것이 정말 기쁩니다 그래, 더 자세히 얘기 해봐 고맙습니다

그러나 모두 노래의 즐거움과 함께 노래하는 즐거움을 모두 볼 수 있기를 바랍니다 고맙습니다 그럼 다음에 YACHT가 프리젠 테이션에 참여하게 할거야 좋아요 그래서 우리는 요트입니다

우리는 트리오, 슬랩스틱 등입니다 우리의 작업에 익숙하지 않은 사람들을 위해 YACHT는 2002 년에 설립되었습니다 그것은 오레곤 주 포틀랜드에서 본 표지판의 이름을 따서 지어졌습니다 그 말했다 : 젊은 미국 도전 첨단 기술 우리는이 사업이 무엇을했는지 알지 못합니다

사업이라면, 그것은 일종의 사전 인터넷 이었기 때문에 우리는 확실하지 않습니다 그것은 좋은 생각 같았다 우리는 많은 다른 화신을 통해 그리고 그 제휴에도 불구하고 약어를 유지했습니다 사치스러운 자본주의, 우리는 그것이 분명히 말하고 싶은 것을 좋아하기 때문에, 우리는 계속해서 대화 속에 있어야한다는 생각 우리가 Luddites라는 의미가 아니라, 분명히 우리가 여기 있다는 것을 의미합니다 우리가 사용하고있는 도구에 대해 수동적이되고 싶지 않고 머물고 싶다는 의미에서 그들과의 관계를 지속적으로 염두에두고 도구 사용을 추진 우리 도구가 작업 결과물을 명시 적으로 형성하도록합니다

우리는 코더가 아니라고 말함으로써 이것을 서언하고 싶습니다 기술에 대한 우리의 관계와 예술 제작의 맥락은 언제나 바깥 쪽을 바라 보았습니다 우리는 도구를 사용하고, 도구를 사용하며, 도구를 의도 된 매개 변수 이상으로 옆으로 사용한다고 믿습니다 그 과정에서 어떤 흥미로운 것들이 흔들리는 지 확인하십시오 그리고 이것은 기술 권력의 더 큰 통합 이전에하기가 훨씬 쉬웠다는 것을 인정했다

고급 기술 지식없이 두건을 보는 것이 더 힘들었습니다 그러나 우리는 우리의 주된 주요 지시어가 우리가 가능한 한 많이하고 싶다는 태도와 관계없이 우리가 Buckminster Fuller를 많이 읽음으로써 얻은 것입니다 분산 된 펑크 커뮤니티의 일종에서 그 글과 우리 자신의 양육 사이의 유추를 그려야한다 태평양 북서부에 우리는 몇 가지 프로젝트를 제공하기 위해 기계 학습 실험에 대해 이야기하기 전에 생각했습니다 그게 당신에게 우리가 누구이며 우리의 가치가 무엇인지에 대한 감각을 줄 것입니다

그래서 우리는 한때 웹 응용 프로그램을 제작하여 팩스로 독점적으로 앨범 표지를 발표했습니다 Fed-Ex 및 Office Depot에서와 같이 인근의 팩스 기기를 식별 한 그것을 직접 그들에게 보냈다 우리는 사운드를 통해 이미지를 전송하는 아이디어를 좋아했습니다 우리 마음 속에서, 또는 그렇게되어야한다 그리고 휴면 기술을 활성화하는이 개념,이 잠재 된 공간, 방금 사용하려고하는 팩스 기계 중 또한 사용 가능한 항목을 보여주는 방법입니다

그리고 우리가 다음 단계로 너무 빨리 넘어갈 때 낭비되는 것을 설명합니다 이것은 우리가 일반적으로 배포 메커니즘에 망할 것에 관심이 있다는 것을 말해줍니다 우리는 한 번 EP를 2 장 세트로 발표했습니다 하나는 EP를 포함하고 하나는 명확하고 재생 불가능한 디스크입니다 모든 음악으로 인코딩되었지만 CD 제조 공장에서 제조를 중단하게했습니다 반사 호일이 적용되기 전에 그것은 재생 가능하게 만든다

기존 생태계 내에서 고유 한 취약성과 기회를 악용하는 것과 동일한 주제로, 우리는 최근이 엄청나게 작은 프로젝트를 만들었지 만, ICE Abolish라는 노래를 발표했습니다 그게 바로 제가 노래를 할 수있는 법적 최소값 인 1 분 동안 계속해서 "얼음을 버리십시오"라고 말하는 것입니다 디지털 배포 플랫폼 및 Spotify를 통해 노래로 자격을 얻으십시오 따라서 이것은 가상 피켓과 같습니다 누군가가 파괴적인 행동으로 플레이리스트에 추가 할 수있는 것입니다

우리는 방금 4 년짜리 프로젝트를 마무리했습니다이 프로젝트의 일부 사람들은 실제로 참여했습니다 The Triforium이라고 불리는 다운타운 LA의 공공 미술 휴면 조각을 재 활성화하기 위해, 원래는 빛과 소리를 동기화하도록 설계된 6 층 60 톤 콘크리트 구조물입니다 Polyphonoptics라는 새로운 예술 형식으로 우리는이 놀라운 학제 간 팀과 함께 일했습니다 코더와 아티스트, 음악가가 수십 년 동안 오프라인 상태였던 조명을 되찾기 위해 원래의 프로그램 소프트웨어를 8 비트 종이 테이프에서 구출하기 위해, 다시 음악적 입력에 반응하도록하십시오

우리는 이것을 다시 공유했습니다 구식 기술과 신기술이 공존 할 때 일어날 수있는 일과 실제로 생각할 때 일어날 수있는 일 가능한 한 사물을 가능한 한 많이 사용하는 법 그래서 우리는 몇 년 전에 기계 학습과 창의력에 관심을 갖게되었습니다 우리 모두가 가지고있는 똑같은 이유로 우리는 모든 사람들과 어리 석다 공개적으로 사용할 수있는 도구이지만 우리는 우리에게 효과가 있었던 방법의 특성을 당신과 함께 나눌 수 있다고 생각했습니다

성공적인 결과를내는 측면에서 YACHT의 성공의 척도가됩니다 우리는 금속 기계 음악을 여기에서 만들려고 노력하지 않고 있습니다 우리는 대중 음악과 음악을 만들고 싶어합니다 우리의 이름을 쓰십시오 완전히 새로운 프로세스를 사용한다면 우리와 같은 결과를 만들어 내야합니다

우리와 같은 느낌이 들고 앞으로 나아갈 것, 또는 적어도 흥미로운 단계를 옆에서 느끼십시오 그래서 Magenta의 MusicVAE 모델을 사용하여 잠재 공간 보간법을 사용할 수있었습니다 다시 카탈로그에서 다른 멜로디 사이의 통로를 만들 수 있습니다 그래서 이것은 예전과 같습니다 – 어쩌면 다른 모습일지도 몰라, 잠깐 들려 줄거야

그래서 이런 방식으로 작업하기 위해, 우리는 처음에 음악의 전체 카탈로그를 MIDI로 주석 처리해야했습니다 그래서 우리는베이스, 기타, 보컬 멜로디, 드럼 패턴을 분리했습니다 그리고 나서 우리는 그 멜로디의 페어링을 가져 와서 그것을 MusicVAE 모델로 보냈습니다 다른 온도에서 그리고 때로는 커다란 시간을 만들어서 우리가 통과 할 수 있고 노래를 작곡 할 수있는 16 바 패턴 모음 그래서 멜로디로 시작하자

그래서 이것은 하나의 보컬 멜로디입니다 그래서 이것은 2 개의 오래된 노래 사이의 보간에서 생성 된 여러 시퀀스 중 하나였습니다 : "홀로그램"과 "나는 죽을 때까지 너와 섹스하고 싶어" 왜 물러서서 얘기하고 싶니? 일반적으로 많은 아티스트가 어떤 종류의 재료로 작업 할 때 단호하고 빠른 규칙을 설정하는 것을 좋아하지만, 이 자료는 명백하게 좋은 것으로 보입니다 우리는 항상 자기 부과로 최선을 다했습니다 또는 외부, 즉 금전적 제약이있다

그래서 우리는 우리가 생각하는 규칙들을 만들어 냈고 우리가 수정하도록 허락했습니다 이런 종류의 결과물은 우리에게 친숙한 느낌을줍니다 예를 들어, 우리가 할 수없는 일들, 어떤 음을 추가 할 수없는 것, 하모니를 추가 할 수없는 것, 우리는 무엇이든 잼하거나 즉흥 화하거나 해석 할 수 없다

근본적으로 우리는 창조적 일 수 없습니다 따라서 첨가제 변경은 없으며 감산 적 또는 중첩 적입니다 그래,하지만 우리가 방금 연주 한 멜로디 같은 어떤 악기에도 멜로디를 지정할 수있다 나는 그것이 보컬 멜로디라고 말했다 그래서 우리는 단지 임의적으로, 또는 임의적으로는 아니지만, 우리의 마음 속에는 그것이 그렇게 될 것이라고 결정했습니다

그래서 우리는 그렇게 할 수있었습니다 그래서 나는 키보드 라인이나베이스 라인이나 보컬 라인을 줄 것이다 그리고 우리가하는 노래에 나오는 모든 것을 그 노래의 핵심으로 바꿀 수 있습니다 그리고 우리는 그것을 구조화 할 수 있습니다, 우리는 그것을자를 수 있습니다 우리는 기본적으로 모든 출력물을 가진 콜라주를 할 수 있습니다

무언가를 노래 크기의 조각으로 만들면 될 것입니다 그래서 그 규칙 집합 안에서 우리는 기본적으로이 방에있는 모든 사람들에게 동일한 결과물, 결과물 집합, 우리는 모두 완전히 다른 곡을 만들 것입니다 이것은 모든 종류의 요점입니다 이제 우리는 멜로디를 생성하면서 우리가 한 일을 당신에게 할 것입니다 우리는 그것이 보컬 라인이 될 것이라고 결정했습니다

그리고 그것은 이렇게 들린다 따라서 이런 종류의 자료로 작업 할 때 가장 흥미롭고 도전적인 부분 중 하나는 실제로이를 수행하는 것입니다 육체적으로, 그것이 생성하는 멜로디가 몸에 아주 최소 관계가 있기 때문에, 또는 적어도 역사적으로 예쁜 펑크 록 (punk-rock) 작전의 역량에 대해서는, 좋아, 나는 훌륭한 가수가 아니고, 거장 가수도 아니고, 내 두려움 중 하나는 나는이 멜로디를 부를 수 없을 것 같았습니다 '왜냐하면 그들은 매우 믿을 수 없을 정도로 정밀하기 때문에 변이의 여지가 없습니다 그리고 단순한 것처럼 들리는 것조차도 실제로 우리 자신의 실제 구현 된 패턴 밖에 있습니다

그래, 드럼 패턴 중 일부 그래서 우리는 멜로디뿐만 아니라 드럼 패턴으로이 작업을 수행했습니다 그런 다음 때로는 드럼 패턴을 코드 패턴으로 조바꿈합니다 이 모델은 우리가 작업을 시작할 당시 화음을 내지 않았기 때문에 그러나 종이 위에서 보았을 때 드럼 파트를 연주하는 것은 간단하고 심지어 바보 같거나 어리석은 소리를냅니다 믿어지지 않는 정도로 놀기 위해 끝내었다, 아마 2 개의 막대기가 나에게 30 분을 배우는 데 가져 갔던 채우기와 같다 연주하는 데 익숙한 드럼 연주의 팔레트에 없었기 때문입니다

그것은 당신이 당신의 성과가 당신이 내부에서 가지고있는 이전 습관과 발목에서 오는 것임을 깨닫게합니다 또는 문화적으로 자신의 음악적 육성을 기반으로하는 경향이 있습니다 그것은 당신이 좀 더 명확하게 자신을 볼 수 있습니다 그리고이 소재로 작업하면서 멜로디가 실제로 우리에게 더 잘 연주하도록 가르쳐 준 사례가 많이있었습니다 또는 우리가 다른 방식으로 연주하는 것을 상상할 수도있었습니다

– 가사에 대해 이야기 해 봅시다 그래서 방금 들었던 노래의 가사 또는 방금 들었던 노래의 단편 실제로는 과학 기술자이자 시인 인 로스 굿윈 (Ross Goodwin)과의 공동 작업의 산물입니다 우리가 그와 함께 일하기 시작했을 때, 누가 무료 에이전트 였지만 지금은 구글에 의해 부딪혔다 따라서 모델을 만들려면 약 4 백만 단어의 가사 226 MB의 코퍼스를 만들었습니다

그리고 그것은 우리가 우리의 영향이라고 생각하는 모든 것, 밴드를 밴드로 만드는 스튜, 우리 자신의 등 카탈로그처럼, 지리적으로 자라는 우리 주변의 음악, 부모님의 음악, 친구들의 밴드, 우리의 영향력이라고 생각되는 모든 것들 4 백만 단어가 엄청난 양의 자료이기 때문에 결과는 이것이었다 이 문서는 실제로 모델에서 출력되는 하나의 연속 블록입니다 Ross는 우리가 Divas이기 때문에 하나의 Matrix 프린터 용지에 인쇄 한 것을 재미있게 만들었습니다 좋아 보인다 그러나 Magenta 모델이 생성하는 출력과 같이이 재질에 대한 믿을 수없는 풍부한 요소가 있습니다

때로는 구조적 응집력을 가지고있는 예기치 않은 단어의 연속과 같습니다 그러나 2 개 3 개의 어구 후에 붕괴되는 그리고 그것은 그것에 대해 가장 흥미 진진하고 획기적인 것들 중 하나입니다 그것이 언어를 통해 어떻게 꼬이는 지와 시계를 정렬하는 것입니다 그리고 가사를 만들기 위해, 우리는 본질적으로 우리가 흥미 있다고 생각하는 텍스트 줄을 어겼습니다

이러한 생성 된 MIDI 멜로디의 뒷면에는 물론 관계가 없습니다 어쨌든 인간의 언어 나 내부 언어의 내부 역학이나 종지부에 곡물에 대해 일종의 음절을 뽑아내는 것과 같은 재미있는 의미 론적 도전에 이르기까지, 이상하게 보인 방식으로 노래를 부른 다음 사람들이들을 때 이 전체 노래 또는 우리가 만드는이 자료로 생성 된 다른 음악 그것들은 끊임없이 일을 잘못 듣고 몽드 그린을들을 것입니다 언어가 정상적으로 깨지는 방식이 아닙니다 그리고 정상적으로 글을 쓰는 사람으로 말하기 가사는 의미와 감각과 리듬 감각으로 이런 방식으로 생성적인 가사를 만들어 내면 정말 확실한 가능성을 열어주었습니다

그 말은 단지 소리 일뿐입니다 그래서 많은 사람들이 대중 음악을 쓰는 방법입니다 그들은 단지 멜로디 수학의 관점에서 그것에 대해 생각합니다 그게 누구의 것입니까? – 맥스 마틴 응, 맥스 머튼은 멜로디 수학에 대해 이걸 가지고있어

이러한 음절은이 음표와 함께 훌륭하게 들립니다 그것이 무엇을 의미하는지는 중요하지 않습니다 그건 내가 노래를 쓰는 방법이 아니야 우리는 노래를 쓴다 그래서 그것은 정말로 당신이 말을 소리로 경험하도록 강요합니다

우리는 소리가 난 후에 의미의 가능성을 받아 들일 수있었습니다 그리고 사운드를 뛰어 넘는 가사에는 정말 흥미로운 품질이 있습니다 모든 스펙트럼에서 시각적 인 것, 의미의 가장자리에있는 것 등이 있습니다 그리고 어딘가에있는 것처럼 보이는 문구가 다시 생겨서 붕괴됩니다 그리고 나서 내가 결코 쓰지 않았던이 정말로 강한 이미지가 있습니다

예를 들어, "침대에서 개처럼 머리에 느낄 수 있습니다" 아름다운 이미지와 매우 생생한 그러나 당신이 노래를 쓸 때 당신이 정상적으로 뛰어 넘을 것은 아닙니다 그래서 OK, 면책 조항, 그것은 우리에게 새로운 음악을 연주하는 것을 완전히 두려워하게합니다 특히이 과정에서, 그러나 우리 과정을 공유하는 정신으로 – 특히이 관객에게

그러니 그걸 명심하십시오 우리는 당신에게 전체 노래를 연주 할 것입니다, 이것은 거칠고 unmastered 믹스입니다 우리도 그걸 부딪 칠 수 있을까요? – 조명을 어둡게 할 수 있을까요? 그것은 놀라운 일입니다 왜냐하면 그것은 당신과 너무 흡사하게 들리며, 그 무엇과도 거리가 멀어 요 사람들은 알고리즘으로 음악을 만드는 것에 대해 생각할 때를 생각합니다

그들은 네가 버튼과 뭔가를 밀 것이라고 생각해 – 네, 패널을 위해 그것을 구하십시오 OK, 우리는 계속 나아갈 것이다 고맙습니다 고마워, 너희들

그래, 미안해, 나는 노력하고있어 이건 너무 무서운거야 Google Magenta 팀의 회원입니다

우리는 Adam과 Jesse가 우리와 함께하도록했습니다 누가 다른 도구를 개발했는지에 대해 이야기 할 사람 이런 종류의 탐험을 할 수 있습니다 너희들이 여기에서 가져 가게 해줄거야 그래서, 저는 제시입니다 그리고 이것은 아담입니다

그리고 이전의 연사가 몇 가지를 소개하는 것을 보니 환상적이었습니다 'cos 많은 것은 우리가하는 일의이면에있는 일종의 동기입니다 그래서 우리는 Magenta 팀에 있습니다 우리가 누구인지를 잊어 버린 경우를 대비 한 그림 그러나 이것은 정말로 무엇입니까? 우린 아주 운 좋은 위치에있어

우리가 연구하는 것을 선택할 수있는 많은 여지가있는 곳에서 우리는 무엇보다 먼저 우리는 기계 학습 연구 그룹입니다 그래서 우리는 새로운 유형의 알고리즘을 연구합니다

예술과 음악 그리고 이러한 유형의 것들을 만들 수있는 생성 적 모델 근데 왜 여기 있니? 우리는 보통 학술회의에 참석하고 있습니다 그래서 우리는 왜 Loop에 있습니까? 그리고 우리를 다른 그룹과 차별화시키는 것은 우리가 기계 학습에만 관심이 없다는 것입니다 기계 학습을 위해서 우리는 당신이 인간을 고리에 붙이면 어떤 일이 일어나는지에 정말로 관심이 있습니다 창조적 인 과정을 가질 수 있고, 창조적 인 과정의 일부가 될 수있는 모델을 만들기위한 도구를 갖도록하십시오 실제로 작동하는 것과 그렇지 않은 것, 실제로 사람들을 창의적으로 돕는 측면에서

그리고 그 일환으로, 우리는 이러한 기계 학습 도구를 많이 만들고, 우리가하는 모든 일이 오픈 소스입니다 우리의 모든 연구는 완전히 열려 있습니다 그리고 우리가이 모든 것을하는 이유는 우리가 정말로 이 영역을 함께 탐험하기 위해 함께 일하는 개발자와 제작자의 공동체입니다 그래서 우리가하는 모든 일이 오픈 소스라는 것이 중요한 이유입니다 그래서 잠시 동안 진짜 콘크리트를 입을거야

하지만 제시가 철학적으로 나올거야 그러나 Magenta Studio를 발표하는 것이 가장 큰 이유 중 하나입니다 그리고 이것은 우리가 지금 몇 달 동안 작업해온 것입니다 Max의 Ableton 플러그인 세트는 여러 모델의 기능을 자랑합니다 그리고 지금 우리는 4 가지 플러그인을 가지고 있습니다

당신은 그 링크에서 무료로 다운로드 할 수 있습니다 모든 것이 오픈 소스와 모든 것입니다 그리고 우리는 시간이 지남에 따라 더 많이 추가 할 것입니다 Google 및 Magenta 외부의 사람들도이 문제에 기여할 것으로 기대하고 있습니다 몇 분 전에 들었던 것처럼 몇 년 전에 모델을 사용하는 것은 그리 쉽지 않았습니다

이것은 실제로 이전에 보았던 것보다 앞서 큰 일입니다 하지만 이전에는 PyPI 패키지를 설치하고 GPU를 설정했는지 확인해야했지만, 이것은 얻을 수있는 몇 가지 MIDI 파일을 생성하기 위해 실행하는 명령 줄입니다 검색해야 할 임시 디렉토리에 덤프됩니다 그래서 우리는 이것이 올바른 해결책이 아니라는 것을 알았지 만 컴퓨터 과학자들에게 이것은 대단한 것이 었습니다 우리가 일반적으로 사용하는 것입니다

그래서 우리는 좀 더 유용한 인터페이스를 개발하기 위해 노력하고 있습니다 그 결과 중 하나는 NSynth Super, 우리는 Creative Lab에서이 작업을했으며 실제 하드웨어 합성기입니다 우리 모델 중 하나를 사용하여 4 가지 악기의 사운드 사이에서 변형 할 수 있습니다 그곳에 모퉁이를두고 제어 할 수 있습니다 그리고 우리는이 모든 것을 설명하기 위해 GitHub에있는 자신과 많은 사람들이 우리를 그것에 데려다 실제로 만들었습니다

그것으로 음악을 만들었습니다 그것은 우리 목표 였기 때문에 위대했습니다 그리고 전에 이걸 듣지 않았다면 그 링크를 확인해야합니다 이러한 유형의 모델에 대한 문제 중 하나는 연구가 진행될 때입니다 우리는 이것을 훨씬 뛰어 넘었고, 그것은 우리에게 오래 된 물건이었습니다

이 모든 작업을 수행하기 위해 우리가 개발중인 모델의 모든 것에 대해 이와 같은 것을 시작해야합니다 우리가 반복하고 싶은 속도는 확장 성이 없었습니다 그래서 최근에 우리는 올해 우리는 Magenta / js를 출시했습니다이 Magenta / js는 웹 브라우저에 이러한 모델의 힘을 가져 오는 JavaScript 프레임 워크입니다 우리는 세계 각국의 크리에이티브 코더들도 소싱하고 있습니다

다양한 유형의 악기로 연주 할 수있는 독창적 인 인터페이스를 개발했습니다 그들은 단지이 모델의 힘을 두드리며 꿈꿨다 그리고 이것에 대해 정말 멋진 점은 Max가 최근에 Nodejs에 대한 지원을 추가하고 나면, 이제 Magenta / js를 Ableton에 가져올 수 있습니다 이것이 Magenta Studio의 힘입니다

우리는 제시가 철학적으로 생각한 후에 조금 더 이야기 할 것입니다 얼마나 많은 사람들이 인공 지능에 대해 들어 봤습니까? 이 분야에는 많은 과장성이 있으며, 모든 것을 완전히 바꿀 것입니다 많은 과장과 과장이 있지만, 그것은 사실에 해를 끼친다 실제로 기계 학습 분야에서 일어나고있는 흥미로운 것들이 있습니다 실제로 실용적이고 유용하고 흥미로운 것들입니다

그래서 우리가 기계로 음악을 만들 때 그것은 기본적으로 알고리즘 음악입니다 우리는 우리의 프로세스를 돕기 위해 알고리즘을 사용하고 있으며 이는 새로운 것이 아닙니다 당신이 응접실에 간다면, 당신이 18 세기에 당신의 응접실에 있다면, 하나가 그렇듯이, 당신은 뮤지컬 주사위로 놀 것입니다, 여기서 주사위를 굴려서 조각을 만들 것입니다이 주사위는 "프로그래머"에 의해 구성 될 것입니다 작곡가, 실제로 작은 멜로디 스 니펫을 쓰고 사용자는 주사위를 굴려 새로운 곡을 만들 것입니다

그리고 이것은 오래된 예이지만 많은 절차 적 및 기계 학습 세대에 대한 매우 좋은 비유입니다 오늘날 우리가하는 시스템 그리고 매우 높은 수준의 개요에서, 우리는 절차 생성을 할 때 그것은 많은 전문 지식에 의존합니다 당신이 마음에 생각이 있다면 사람이 상황에 와야합니다 좋아,이 핵심 구조가있을거야이 리듬 패턴이있을거야

당신은 정말로 사용자가 프로그램을 사용하여 음악을 생성 할 수있는 모든 것을 프로그램으로 인코딩해야합니다 그리고 기계 학습이 실제로하는 것은 그것이 우리가 그 규칙들을 풀 수있게 해줍니다 그 모든 전문 지식을 알고, 밑에있는 구조가 무엇인지 알아 내야 만한다는 것, 왜냐하면 우리는 이러한 일련의 알고리즘에서 많은 데이터를 사용하여 구조의 일부를 발견 할 수 있기 때문입니다 우리가 그것을 생각할 수 없다면 그것은 숨겨져있었습니다 그래서 프로그래머는 이런 상황에 처하게됩니다

당신은 가능한 프로그램의 영역을 가지고 있고 음악 세트가 주어지면 음악을 생성하기 위해 주어진 프로그램을 선택하도록 프로그램을 훈련시킬 수 있습니다 그래서 주사위를 유추하는 것은 비슷합니다 작곡가가 주사위의 모든면을 쓰는 대신에 당신이 관심을 가졌던 특정 작곡가에게서 작곡을하고 그 다음 알고리즘을 얻었습니다 그 스타일을 가장 잘 에뮬레이션 할 수 있도록 주사위의 측면에 무엇이 있어야하는지 결정했습니다 놀람의 두 가지 요소가 있습니다 하나는 주사위 역할을 할 때 실제로 일어나는 일입니다 그러나 다른 하나는 이러한 알고리즘이 실제로 배우는 구조가 무엇인지에 대한 구조적 의미 론적 문제에 더 가깝습니다

그리고 당신이 훈련하고있는 실제 데이터에 상대적으로 불가지론 적이기 때문에, 그래서 모든 사람들이 여러 가지 분야에 그것을 적용 할 수 있기 때문에 많은 사람들이 과장된 이야기를 나눕니다 그 중 일부는 실제로 실용적인 의미에서 유용합니다 예를 들어, 물체 탐지 또는 이미지 암 탐지 그리고 이런 종류의 것들 그러나 우리가 예술가이기 때문에 당신도 그것으로 정말 재미있게 할 수 있습니다 그리고, 내가 좋아하는 것처럼,이 소름 끼치는 얼굴의 이미지는 섞여 있습니다

방법에 대한 규칙을 작성하는 방법을 알지 못합니다 이 모든 것들이 가짜 얼굴 인 것을 만들어냅니다이 사람들은 존재하지 않습니다 이것은 사진 부스에서 가져 와서 예술 프로젝트의 일부분이었던 데이터입니다 그래서 사람들은 사진을 찍는 것을 알고있었습니다

그리고 모델은 공통점을 학습합니다 사람들의 얼굴들 사이에서 그리고 우리는이 학습 된 공간에서 움직입니다 현실적이고 비현실적인 것들을하지만 비현실적인 방식은 여전히 ​​매력적이고 흥미 롭습니다 그래서 그 많은 예제들이 있습니다,하지만 우리는 그것을 구체적으로 그리고 추상적으로 말하고 싶지 않습니다 음악에 대한 의미는 무엇입니까? 우리는 몇 가지 사례 연구를 진행할 것입니다

우리가 지금 발표하고있는 플러그인과 함께 그래서 우리가 먼저 Groovae라고 부르는 것에 대해서 이야기 할 것입니다 그리고 이것은 하나의 인간화된 플러그인과 같습니다 당신이 양자화 된 드럼 비트를 가지고 있고 그것을 느끼기를 원하기 전에 당신이 사용해 왔던 것입니다 실제 드러머가 그것을 연주하고 약간의 느낌을 추가합니다

그래서 이들은 일반적으로 임의의 속도와 오프셋을 무작위로 추출하거나 꽤 정적 인 그루브 템플릿을 적용하여 음악 전체 여기서 우리가하는 일은 실제로 기계 학습을 사용하여 그 변화를 실제로 배우는 것입니다 그래서 우리는 많은 전문 드럼 연주자들을 데리고 미디 드럼 킷에서 연주하게하고 그 출력을 취했습니다 그런 다음 시퀀서에서 나오는 것처럼 보이게하기 위해 그것을 양자화했습니다 우리는 다른 방향으로 되돌아 가도록 신경 네트워크를 훈련 시켰습니다

그래서 양자화 된 비트 우리가 두 가지 데이터를 모두 가지고 있기 때문에 사람이 실제로 그것을 어떻게 연주 할 것인지를 파악할 수 있습니다 이제는 양자화 된 드럼 비트를 넣고이 모델을 사용하여 다른 방향으로 되돌릴 수 있습니다 그리고 통계적으로 여러 가지 옵션을 본질적으로보기 위해 몇 번 샘플링 할 수 있기 때문에 좋은 점이 있습니다 이제 이것이 실제로 Ableton에서 어떻게 작동하는지 봅시다 Groovae 플러그인을 엽니 다

당신은 당신의 양자화 된 드럼 비트를 얻습니다, 그래서 그것은 좋지만 꽤 딱딱합니다 여기서 Generate 버튼을 누를 수 있습니다 이제 Groovae 버전이 있습니다 그래서 그것은 동일한 기본 박자입니다 그러나 이제 여러분은 바닥에 적용된 속도가 있음을 볼 수 있습니다

좀 펑키 한 저음을 추가하여 조금만 설정해 둡니다 그러나 속도가 적용되고, 일부 오프셋, 그런 다음 소리가 얼마나 다른지들을 수 있도록 원본으로 다시 전환 할 수 있습니다 따라서 이것은 다시 사용할 수있는 플러그인 중 하나입니다 – 네, 때로는 그곳에있을 때까지 무엇이 빠졌는지 모릅니다 그래서 또 다른 일반적인 경우는 아이디어의 좋은 시작입니다

그러나 당신은 그것을 계속하는 다른 방법을 생각하고 싶다 테마를 개발할 수있는 방법은 무엇입니까? 이것이 바로이 플러그인이하는 것입니다 그리고 우리가이 모델들을 훈련시키는 방법 똑같은 방식으로 당신이 직접 해보려고합니다 당신이이 전체 시퀀스를 가지고 있다고 상상해보십시오 그러나 우리는 그것의 모델 부분만을 보여줍니다

그래서 이것은 약간의 멜로디입니다, 그리고 우리는 다음, 확률 론적으로 일어날 다음 일은 무엇인가 그리고 나서 그것은 예측을합니다 그리고 나서 여러분이 예측 한 모든 것들이 주어집니다 발생하게 될 다음 일은 무엇인가? 많은 교육 데이터와 수백만 개의 멜로디로이 작업을 수행하면 할 수있는 일은 기본적으로 그러한 예측을 할 수 있으려면 키 및 리듬 패턴과 같은 것에 대해 배울 필요가 있습니다 그래서 여기에 원래 멜로디가있는 예가 있습니다

그리고 멜로디 모드를 선택하고 트랙을 선택하고 클립을 선택합니다 만들고 싶은 변형 수를 선택할 수 있으며 막대를 3 개 추가하면 생성을 클릭합니다 그런 다음 바로 거기에 추가합니다 따라서 원래의 생각은 많이 유지하지만 변형을 볼 수 있습니다 원본과 동일한 키로 유지됩니다

그리고 이것은 단지 초기 제안 일뿐입니다 우리는 그 이후로 많은 연구를 해왔으며, 이것은 고전 음악에 대한 교육을받은 예일뿐입니다 추가 보너스로 오디오 자체는 전에 언급 한 것처럼 신경 합성기로 만들어집니다 피아노 녹음이지만 실제로는 신경망으로 재생하고 있습니다 시간의 이익을 위해, 우리는 거기에 남겨 둘 것입니다

그러나 당신은 그것이 일종의 초기 종자가 주어 졌음을 볼 수 있습니다 고전적인 멜로디와 많은 제스처를 유지했다 비록 장기적인 구조가 실제로 몇 분이나 그와 같은 과정에서 발전하지는 못했습니다 또 다른 일반적인 상황은 시작하기가 가장 힘든 일입니다 어디서부터 시작해야합니까? 때로는 작가의 블록이 있습니다

따라서 Generate 함수는이 함수를 사용하여 그냥 멜로디 나 드럼을 만들어달라고 부탁하십시오 따라서이 경우 멜로디는 모노 포닉을 의미하므로 실제로베이스 라인을 만들었습니다 그러나 그것은 다른 키에있을 것입니다 '우리가 특정 키에 있다고 조건을 정하지 않았기 때문입니다 여기 리듬감이 있네

어쩌면 조금 더 고전적 일 것입니다 그런 다음베이스 라인으로 돌아갑니다 그리고 우리는 드럼 비트를 추가 할 수도 있습니다 그래서 우리는 드럼 비트를 생성합니다 그럼, 곧 라디오에 나오지는 않을거야

하지만 네가 시작한 곳보다 훨씬 더 많을거야 그것을 가져다가 조정할 수있는 영감을 줄 수 있고 그것을 자신의 것으로 만들 수 있습니다 알았어, 우리가 마지막으로 이야기 할 내용은 당신이 들었던 MusicVAE 알고리즘을 사용하는 보간 (Interpolate)이다 그리고 여기에있는 아이디어는 다른 입력 사이에서 보간하거나 변형하는 것입니다 그리고 우리가 이것에 대해 어떻게 생각하는지에 대한 간단한 개요입니다

예를 들어, 2 개의 멜로디를 가져와이 2 개의 멜로디의 음을 함께 믹싱하는 대신, 일반적으로 소리가 좋지는 않습니다 그래서 우리는 우리를 Attribute Space라고 부르는 것에 매핑합니다 또는 그 멜로디의 다른 중요한 자질의 학습 된 표현의 일종 인 잠복 공간 그리고 그것들은 우리가 함께 섞은 것입니다, 그리고 우리는 그것을 노트의 공간으로 다시 매핑합니다 그래서 제가 잠시 후에 보여 드릴 것입니다

시작하기 우리는이 2 개의 점들로 표현 된 2 개의 멜로디를 취할 것이고, 그 공간에 그들을 맵핑하고, 그런 다음 우리는 애트리뷰트 공간에서, 각 단계에서 나오는 것을 들으십시오 그리고 눈에 띄는 것은 아주 부드러운 전환입니다

그리고 그 사이의 포인트는 실제 멜로디처럼 들리지만, 사물의 혼합처럼 들리지는 않습니다 첫 번째 멜로디가 있습니다 그리고 여기에 우리가 끝내고 싶어하는 것이 있습니다 좋아, 우리가 해냈어 그래서이 예제는 정말로 좋았습니다

'음악 자체가 음악처럼 들리기 때문에, Interpolate라는 새로운 Ableton 플러그인에서 이것을 실험해볼 수 있습니다 여기에 실제로 표시 할 예제는 실제로 드럼 비트를 사용하여 수행합니다 우리는 드럼 비트 2 개를 취한 다음 중간 정도의 중간 지점을 얻을 것입니다 이제 우리가 처음 시작할 2 개의 드럼 비트를 들어 봅시다 그리고 두 번째

그리고 우리는 여기서 생성 할 것입니다 그리고 실제로는 첫 번째의 재 해석을 출력 할 것입니다 그래서 그것이 바로 이것입니다 그리고 지금 그것은 중간 지점에 올 것입니다 그래서이 모델은 당신이 처음에 넣은 것에 기초하여 훈련 받고 있습니까? 좋은 질문

이들은 실제로 미리 훈련 된 모델입니다 그러나 우리가 사용하고있는이 유형의 모델은 사전 교육을 받았습니다 애트리뷰트 스페이스 (Attribute Space) 그래서 당신이 음악을 줄 때마다 미리 배운 애트리뷰트 스페이스 그리고 그 혼합을하고 그것을 다시 매핑 그래서 그 시점에서 모든 모델이 열려 있습니다

우리는이 파이썬 코드와 모든 것을 자신의 모델을 훈련하는 데 사용할 수 있지만 큰 오픈 우리가 정말로 관심을 갖고있는 기계 학습 질문은 어떻게 이들을 더 적응력있게 만드는가하는 것입니다 바로 앞에 당신과 당신의 컴퓨터에서 직접 배우고 자신의 명확하게하기 위해, 우리는 이들을 훈련시키고, 우리는 많은 전문화 된 하드웨어와 많은 데이터를 사용합니다 대부분의 사람들은 일반적으로 가지고 있지 않으므로 모델을 만드는 법을 배우려고합니다

최종 사용자가 여전히 appliable입니다 나는 우리가 어떻게 시간을 보내고 있는지 알고 싶다 – 질문 있네 나는 이것이 1까지 실제로 간다라고 생각한다 우리는 몇 분 밖에 안 남았고, 나는 이것이 4 시간 동안의 긴 토론이어야한다고 생각합니다

다른 그룹의 대표를 무대에 다시 데려 오지 마시고 그냥 나는 5 백만의 질문을한다 나는 관객들도 그렇게 생각한다

좋습니다, 그래서 우리는 창조적 인 예술가 양쪽 모두의 관점에서 여기에서 정말 재미있는 프리젠 테이션을했습니다 당신이 음악을 만드는이 새로운 패러다임을 어떻게 다루는 지 알게됩니다 그리고 기술적 인면에서 우리는 기계 학습에 정말로 손을 대었습니다 그리고 아마 많은 사람들이 자신의 프로세스에 이것을 통합하는 방법을 생각하기를 원할 것입니다 나는 당신이 생각하는 것이 창조적 인 측면에서나 창조적 인 측면에서든 근본적인 개념이라고 생각하는지 궁금합니다

이 새로운 도구에 근본적으로 받아 들인 것은 무엇입니까? 그리고 기계 학습 측면에서 사람들이 근본적으로 이해할 필요가있는 것, 아날로그 악기를 연주 한 전자 음악에 누군가를 소개한다면, 나는 모듈성 또는 신호 흐름, 이러한 종류의 사상을 소개 할 수 있습니다 또는 당신이 비선형 적으로 만들 수있는 아이디어, 이런 종류의 것들 그래서 내가 궁금한데 당신 모두, 당신은 우리의 관객이 필요하다고 생각하는 것 같은, 그들이 어떻게이 주제에 접근 할 수 있는지 오 세상에, 정말 큰 질문입니다

– 글쎄, 내말은, 당신은 전체 답을 가질 필요는 없다는 것입니다 하지만 그것은 이미 당신 안에 있습니다 당신은 그것을하고 있습니다 그래서 저는 구겨진 종이 조각이 2 개의 볼을 가지고있는 것을 보여주는 다이어그램을 좋아합니다 그리고 2 개의 공이있는이 평평한 종이

그게 바로 그게 사실이었습니다 – 나는 잠복 공간에 대해서 생각할 수 있다고 생각한다 네가 좋아하기 때문에 예술적 측면에서 매우 흥미로운 무언가이다 좋습니다, 우리가 생각한 모든 것은 우리에게 호소력을 발휘하는 기능입니다 우리가 듣고있는 것에서 우리가 인식 한 것이 지금은 모든 것을 포착하는 공간입니다 MIDI와 같은 방식으로, 복잡한 것으로 표현하는 방법으로 수년 동안 훌륭했습니다

음악을 듣는 경험으로, 그저 빠져있는 것이 많았습니다 그래서 나는 우리가 매우 손실이 많은 압축 세계에 살고 있다는 것을 이해하는이 아이디어를 생각합니다 그리고 갑자기 우리는 물건이 어떻게 압축되고 있는지와 더 많은 상호 작용을하고 있습니다 그리고, 그렇습니다 압축은 우리의 경험과 우리가 사물을 묘사하는 방식 사이의 관계입니다

또는 우리가 그들을 사용하는 방식 따라서이 모듈성이지만 의미 론적 모듈성과 같습니다 그렇다면 근본적인 개념이 당신이 가지고있는 가정에 의문을 가질 준비가되어 있다고 말할 수 있겠습니까? 전에 통제 할 수 없었던 것? 또는 어쩌면 내가 이것을 도울 수 있을지도 모른다 흥미로운 점은 우리가 기술하고있는 많은 시스템 너는 전에 할 수 있었다 음악과 컴퓨터를 공부하는 데 많은 시간을 할애했다면 비슷한 일을하는 몇 가지 규칙을 생각해 낼 수 있습니다 당신은 할 수있는 속성을 가질 수 있습니다 속성 공간에서 돌아 다니며 물건을 가져라

이 알고리즘이 흥미로운 이유는 데이터에서 데이터를 습득하도록 설정할 수 있으므로 데이터 속성에서 항목을 추출 할 수 있습니다 당신이 정상적으로 기대할 수있는 것들이 있습니다

그러나 그것은 또한 반영의 측면에서 도움이 될 수 있습니다 너가 너의 자신의 음악을 위해 그것을 사용한다면, 알다시피, 일종의 학습, 오, 나는 우리가 이것을 깨달았다 이전에는 없었던 우리 음악에 대한 전체 스레드 그게 실제로 더 많이 들어가기를 기대했던 것입니다 그것은 마치

– 당신의 과정을 더 반영 하는가? 프로세스가 더 미러되기 나는 그것이 실제로 민주주의 화의이 종류를 가지고 있다고 생각한다 데이터 세트가 너무 크기 때문에, 당신과 당신의 협력자와 일하는 것이 아니라, 뒷주머니에 음악의 전체 역사

그래서 당신은 세대 간으로 스트레칭을 할 수 있습니다 그리고 잘하면 크로스 컨츄리 할뿐만 아니라, 비록 데이터 세트가 여전히 그 부서에서 제한되어 있다는 것을 알고 있습니다 그러나 나는 자신의 작품에 단순한 패턴이 아니라 나타나는 패턴을 보는 것이 매력적이라고 ​​생각합니다 그러나 더 큰 것으로 예를 들어, 우리가 가지고있는 텍스트 모음 온도가 정말로 낮을 때 분명히 많은 반복을 볼 수 있습니다

사랑, 섹스, 죽음, 싫어하는 것, 싫어하는 것, 싫어하는 것, 그것은 "나는 당신을 원해"라는 문구의 300 개 인스턴스 전체 페이지와 같습니다 또는 : "나는 당신의 뇌를 원해"이것은 가장 무서운 것입니다 또는, 나는 너를 필요로한다, 나는 너를, 인간 감정과 친밀의이 깊은 밑바닥이 올리는 올린다

온도가 낮을 ​​때, 그리고 높을 때 더 이상한 것이 보입니다 이것들은 적절한 이름과 물건을 만들어 냈습니다 그래서 저는 그것이 인류에게 거울처럼 느껴지는데, 개인 작가에게는 그다지 거울이 아닙니다 그것은 저의 다음 질문으로 이어집니다 그것은 당신의 경험에서 나온 것입니다

그리고 나는 예술가들과의 작업에서 추측합니다 기계 학습은 우리에게 일종의 정렬을 제공합니까? 우리의 창조적 인 프로세스를 발전시킵니다 당신이 배우고 있거나 변화하고있는 것이 그게 무엇이 유익 했는가? 나는 당신이 일을하는 매 순간마다 얼마나 많은 선택권이 있는지 볼 수 있다고 생각합니다 우리가 가지고있는 우리의 작은 macgyvered 시스템에는, 우리가 정한 많은 규칙들이있다 우리가 여기서하려고하는 것에 대한 정신 속에 일관된 결과물을 만들기 위해서입니다

그러나 그것이 제한적이라고 느낄 때조차도, 가장 작은 것에서 여전히 무한한 선택의 여지가 있습니다 생산, 성능, 배치, 패턴 및 구조, 특히 구조, '그 모델이 붕괴되는 곳인 것 같아 그러나 그곳에는 엄청난 양의 선택이 있습니다 모든면에서, 그리고 어떻게하면 쉽게 개인의 선택에 따라 한 순간에서 다음 시간으로 늪에 빠져드릴 수 있습니다 그러나 당신이이 외적인 것들을 많이 제거 할 때 당신은 세부 사항으로 자유롭게됩니다

당신이 도전 받고있는 보컬 작업을하고있을 때 느끼셨습니까? 또는 다른 방식으로 예술가로서의 자신을 발견하는 것 – 너머 – 어떤 방식으로? 다시 말하지만, 나는 거장 가수가 아니에요, 나는 종종 농담을 할 것입니다 나는 똑같은 것을 5 번 노래 할 것입니다 나는 5 대 걸릴 것 같고 모두 다르다

그러나 그것은 당신이 소리에 레이저를 강요합니다 특히 단어가 의미를 잃고 단어를 가사로 나누기 시작하면 익숙하지 않은 이상한 일을하십시오 나는 우리 모두가 그렇게 말할 수있는 것처럼 느낀다 뜻밖의 방법으로 우리에게 도전했다 나는 이전에 당신이 전체의 반영에 관해 말하고 있었던 것을 생각해 내고 싶었다

그리고 저는 이것이이 도구들이 현재 어디에 있느냐와 함께 정말로 중요하다고 생각합니다 그것은 중요합니다 정말 그것을 개인화하는 것을 두려워하지 않습니다

그것의 의미를 취하고 있기 때문에, 그것은이 큰 코퍼스에 대해 훈련 받았고, 그것은 영감과 사물을위한 것입니다 그러나 실제로 그것을 적응 가능하게 만들려면 지금 그 부분을 스스로해야합니다 그리고 나는 이것이 미래에 이러한 알고리즘이 바뀔 흥미로운 방법이라고 생각합니다 그러나 그들은 지금 거기에 있지 않습니다 나는 그 한계를 좋아한다

나는 모델이 완전히 형성된 팝송을 뱉어 내지 못한다는 것을 의미한다 예술가가 의미하는 것의 경제적 파급 효과를 넘어, 실제적인 도구가이 특정한 한 가지를 실제로 잘하는 곳에서 일어나는 대화, 나는 여전히 내가 잘하는 것에 능하다 흥미로운 패턴을 찾아내어 배열 할 수있다 그것으로부터 구조를 만드십시오 '왜냐하면 예술 제작은 많은 시간이기 때문입니다

우리는 이것에 대해 조금 이야기했습니다 프리젠 테이션은 지각을 조사하고 도구를 사용하여 듣기를 범주화하는 것이 무엇을 의미하는지 생각해보십시오 – 일종의 호기심이 있다고 생각합니다 너도 알다시피, 이건 좋은거야, 이건 나쁘다 그 종류는 지금 조금 열렸습니다

그리고 당신이 알고 있을지 모르는 다른 과정들이 있습니다, 여러분이 가지고있는 편견들처럼, 너만의 맛은 연주 될지도 모른다 그리고 그것은 재미 있습니다

이 질문은, 오, 내가 다른 데이터로 그것을 훈련시킬 수 있겠 니? '왜냐하면 너는 너는 항상 그곳에있는 것들을 바깥으로 밀고 싶다 그러나 나는이 모델들이 매우 견고하다는 점이 흥미 롭다고 생각합니다

너는 그들을 깰 수 없다, 너는 깨뜨릴 수 없다 내 말은, 나는 그것이 부서 졌다고 생각하지 않는다 나는 그것이 좋다고 생각한다

나는 그들이 그것을 모두 고칠 수있게하는 것이 실제로 어렵다고 생각한다 그들은 단지 영구적 인 상태에 있습니다 부서지기가 흥미 롭습니다 이것은 제가 추진하려고하는 개념입니다, 컴퓨터 억양에 대한이 생각은, 그것은 시각 자료, 표기법 자료와 같이 그 생성 된 자료입니다 그들은 모두이 이상한 것을 가지고 있습니다

그것은 미적으로 정말 흥미 롭습니다 그리고 모델이 모두 더 정교해질 것이라는 점에서 매우 유한합니다 매우 빨리, 우리가 예상 한 것보다 훨씬 빠릅니다 그리고 그것은 사라질 것이고, 이상한 것들이 사라질 것이고, 우리는 완전히 향수를 느끼게 될 것입니다 사람들이 비닐과 테이프 그리고 아날로그를 향한 향수를 불러 일으키고 있습니다

한 번에 두 가지 이상을 할 수 있다는 것도이 점입니다 좋아, 완전하게 형성된 팝송을 만들기 위해 당신은이 모든 다른 길을 동시에 할 수 있어야합니다 이러한 어려운 결정을 내리지 만 인간이 실제로 잘 수행 할 수있는 것입니다 사람들이이 알고리즘을 디자인 할 때 일반적으로 흥미로운 점은 거친 모서리 일뿐입니다 그들은 뭔가를 최적화하려고합니다

하지만 여기서 우리는 실제로 어떤 것에 대한 측정 기준을 갖고 있지 않습니다 최적화를 위해 노력하고 있습니다 '누군가를 위해 얼마나 유용했는지 최적화하고 싶기 때문입니다 그리고 그것은 당신, 당신, 그리고 당신에게 달랐습니다 그것은 개인적인 것이므로 끊임없이 변화하는 목표입니다

따라서 학문적 견지에서 어떤 유형의 모델을보다 융통성있게 사용할 수 있는지 묻습니다 당신은 실제로 실제로 그것을 해결할 수있는 관점에서 다른 수학을 조사합니다 실수를 저질렀을 때 그것은 데이터로부터 배우기 때문에 실수의 유형은 그것이 무엇이든간에 더 근거가 있습니다

그래서 NSynth는 매우 독특한 사운드 품질을 가지고 있습니다 즉, 매우 압축되었습니다 피치가 위아래로 변하고, 파형을 아주 잘 그리지 못하기 때문에 여분의 고조파가 있습니다 그러나 좋은 점은 유물 유형과 매우 다른 점입니다 다른 합성 알고리즘을 사용하게 될 것입니다

왜냐하면 그것들은 데이터 그 자체에 기반을두고 있기 때문입니다 그래서 많은 사람들이 정말로 그 물건을 좋아합니다 우리는 더 나은 알고리즘을 만들었습니다 2016 NSynth 스타일이 필요합니다 – 전적으로

나는 너에게 말할 생각이 아니었지만 우리는 처음에 NSynth가 들리는 방식을 싫어했다 마치 음질이 좋지 않은 것처럼 들립니다 하지만 당신은 그것을 자신의 심미로 인식합니다 그리고 그것은 믿을 수 없게됩니다 – 원래 만들어진 TB 303과 같습니다

교향곡 같은 소리를 바꾸려면 사람들이 쓰레기라고 생각했습니다 그러나 당신은 당신의 인식을 재조정하고 다르게 듣기 만하면됩니다 그래서 저는 불행히도 우리가 막 끝날 것이라고 생각합니다 나도 알아, 그건 비웃는 소리 야 그러나 시작하고 싶은 사람들을 위해 이것으로 사람들이 모를 수도있는 두 가지 자원이 무엇입니까? 서로 다른 관점에서

죄송 해요 플러그 플러그 : 'gco/magenta/studio' 우리는 접근성을 높이기 위해 노력했습니다

우리는 정말로 피드백을 좋아할 것입니다 우리에게는 토론 그룹과 모든 것이 있습니다 그래서 사람들이 말하기를 좋아할 것입니다 이봐, 나도하고 싶었어이게 나에게 효과가 있었어

– 너희들이 정말로 찾고있는 것처럼 들리네 아티스트가 이러한 도구를 사용하는 방법을 이해하고이를 통해 개발 및 디자인 과정을 알릴 수 있습니다 따라서이 기술의 미래가 무엇인지에 관심을 갖고 싶어하는 사람들에게 중요한시기입니다 같이 참여하고 사람들에게 피드백을 줄 것입니다 더 나은 자신을 말할 수 없었다

– 너희들은 어떻게 생각하니? 같은 창업자, 앱, 도구 및 물건을 만드는 소비자 중심의 AI 음악이 많이 있습니다 YouTube 제작 동영상 블로그에서 로열티가없는 음악을 원하는 사람들에게 솔직히 감사드립니다 그게 맞아 – 많은 도구에서 표현력이 부족합니다

그래서 저는 마젠타가 될 곳이라고 정말로 말할 것입니다 솔직히, 더 많은 종류의 감각이 있습니다 hack-y 접근법 이미지와 사운드 같은 것에 대해 생각하기 시작하면, 그리고 한 가지 일을하도록 고안된 도구 인 경우, 그 도구를 다시 용도로 사용할 수 있다면 사람들이 일하는 것의 더 거친 지형 어쩌면 당신은 이미지 인식을위한 무언가를 발견했을 것입니다 하지만 어떻게 소리가 나는지, 어떻게 이미지를 만들 수 있는지, 어떻게 그 이미지를들을 수 있는지 생각해보십시오 그리고 저는 이것이 정말로 비옥 한 방법이라고 생각합니다 사물의 중요성에 대해 생각하기 그리고 당신이 합성으로 할 수있는 일은 단지 사물을 어떤면에서 음으로 생각하는 것부터 시작하는 것입니다

그게 막연한 것처럼 들린다면 – 그거 좋아해 생각한 실험으로 시작하십시오 – 나는이 도구들이 많이 있다고 생각합니다 좋아요, 우린 소리에 이미지 인식 기술을 사용할 거예요

당신은 좀 직접 할 수 있어요 특히 Max MSP와 같은 도구를 사용하는 경우 약간의 해킹이 필요합니다 우리는 그것을 열어 보곤했습니다 – 거기 엔 많은 자원이있어 또한 당신이 기계 학습 및 물건을 기계로 소개하고 싶다면,이 블로그 Distill이 아주 좋은 일을합니다

시각화 및 모든 유형의 물건 – 학습에 대한 학습은 매우 매력적입니다 시원한 고마워 여러분 모두가 패널리스트의 프레젠테이션을 즐기기를 바랍니다

저에게는이 모든 다른 관점을 듣는 것이 훌륭했습니다 나는 몇 가지 공지 사항을 가지고 있는데, 하나는 사실 모두를 위해 박수 갈채를 보내자

Computer Vision and Machine Learning, by Nick Wong

SPEAKER 1 : 이것은 내가 가장 좋아하는 버즈 terms– 두 가지에 대한 세미나 기계 학습, 컴퓨터 비전 당신은 파티의 대화처럼 거기에 사람들을 밖으로 던져 사람들이 괴상한 말 외에, 그들은 또한 아주 나쁜 엉덩이 있다고 생각합니다

그들은 컴퓨터 과학자라면, 그들은 수도 당신이 실제로 얼마나 알고 있는지 질문입니다 그래서 기계 학습 및 컴퓨터 비전, 나는했습니다 가지가 무엇인지에 cutesy 작은 슬라이드를 넣었습니다 나는 보통 자신의 이름으로 그들에게 참조 할 것 내가 ML 말한다면 나는 기계 학습을 의미한다 내가 CV를 말한다면 나는 컴퓨터 비전을 의미한다

아주 쉽게 그리고 이러한 종류의 신화 사람들이의있다 기계 학습에 대한 있습니다 그들은 두 극단 중 하나에 보통입니다 어느 것은 불가능하고 오직 최고 기술 괴짜를 위해입니다 끝에 시간 동안 자신의 컴퓨터에 앉을 수 마법사 우리는 그들이 할 일을 더 잘이기 때문에 아니면 그 흥미로운 아니에요

당신이 그 두 극단의 betweens에 속하지 경우에, 그 너무 멋지다 그러나 기본적으로 기계 학습 및 컴퓨터 비전, 우리가 그들을 필요로하는 이유에 대한 상황은 우리입니다 그 사람들이 문제를 해결할 수 있도록하려면 하루 종일, 프로그래밍 매일하지만 해결 그래서 컴퓨터 프로그램을 할 수 없습니다, 뭔가보고있다 그리고는 소파의, 즉 그 사람의, 그 강아지의, 고양이의 말 실수로 사람을보고 아,이 차를, 말을하지 번호판 거기 어디있어 그리고 당신이 기존 상상할 수 어쩌면 실제 예제 트래픽 인식이다

당신이 뭔가가 무엇인지 알아 내려고 노력하는 경우, 컴퓨터 비전은 매우 중요하다 내가 말할 수 있도록하려는 때문에, 일 그 내 붉은 빛 갈색 곰이나 차를 달렸다 그리고 중요합니다 그리고 그것은 우리가 일반적으로의 후 친절 정말로 무언가이다 이리 그러나 우리는 매우 구체적인 문제에 접근하는거야 우리에게 약간의 컨텍스트를 제공합니다

그리고 지금까지이 두 가지에서 저에 대한 상황과 배경의 나의 종류로 내가 년 전 이전에 코딩 된 적이있다, 년 전에 경우에 그래서 2016 인 이것은 미래에있다 그리고 기본적으로 내가 원한, 내 CS50 최종 프로젝트, 정말 멋진 일을 할 나는 내 자신에 그것을하고 싶었다 그리고 나는 그것이 액세스 할 수있었습니다 뭔가 싶었습니다 그래서 많은 사람들이 오, 같았다, 기계 학습, 컴퓨터 비전은 그 세 가지 기준 중 두 같은 휴식, 가능성이 있습니다

마찬가지로, 당신은 당신의 자신에 그렇게 할 수 있으며 액세스 할 수 없습니다입니다 그 일이 불가능 할 수 있습니다 왜 당신은 이제까지 그 접근 할 것인가? 그리고 네 그 이론적 측면 등으로부터 아마 사실이다 나는 앉아서 기계 학습 뒤에 수학을 모두 자신을 가르쳐주지 않았다 나는 앉아서하는 방법 컴퓨터 비전을 사용하여 윤곽을 수행하는 자신을 가르쳐주지 않았다

나는 앉아서 어떤 YouTube 동영상으로 주위했다 그리고 그 세미나의 포인트는 기본적입니다 그들은 전문 용어가있는 동안,이 두 개념을 가르치거나 표시하거나 증명한다는 것입니다 그리고, 그들은 매우 시원하고 각 주위의 모든 분야가있다 그들이 당신에 액세스 할 수있어, 단지 CS를 시작 CS50 학생, 코드의 어떤 라인을 볼 수없고, 그 전에 무엇을 의미하는지 좋아하지 않았었다 즉,이가 누구입니다 그래서 당신이하는 CS 전문가의 일종 경우 기계 학습, 컴퓨터 비전, 작은에 대한 모든 일을 알고있다 혼란 시청뿐만 아니라, 정말 감사하는 이유 그리고 잘하면 당신은 적어도 재미 있고 어쩌면 조금 찾을 수 있습니다 정보이었다

그리고 기본적으로 내 이야기는 내가 와서되었다 소프트웨어의 두 가지 패키지 또는 조각을 사용하여 최종 프로젝트를했다 기계 학습 부분과 열기 CV이다 Keras 2 컴퓨터 비전 부분과 구축하는 것입니다 알고리즘 또는 소프트웨어의 조각 것 나에게 매우 특정 작업을 수행 할 수 있습니다 나는 악보의 이미지를 변환하고 싶어 음악의 기계 판독 버전으로 지금은 존재하지 않는 소프트웨어 그리고 나는 이유를 발견했다 정말 어려운 현실에서 도피하고 있기 때문에

그러나 시원한 과정은 어쨌든이었다 그리고 나는 그것이 가치있는 노력이라고 생각했다 그리고 나는 그들이 원한다면 그것을 시도 모두를 격려한다 현실 세계 예 그러니 종류의, 우리는 사명의 종류가 이 종류의 패턴 인식의 아이디어로 우리를 완화하는 것입니다 그것은 우리가 어쨌든 기계 학습에 계신입니다

그래서 나는 스톡 이미지에 대한 있습니다 그들은 파워 포인트 슬라이드의 템플릿으로왔다 그냥 자신의 설명을 변경했습니다 그리고 기본적으로 나는 가지 생각하라는거야 당신이이 사명 사이에서 찾을 수있는 패턴에 대한 당신의 머리이다 그리고 인간으로서, 당신은 find– 수 있습니다 나는 수백 말을 주저입니다

심지어 어쩌면 정말 충분히 수백 데이터,하지만이 있는지 모르겠어요 권리? 패턴의 매우 많은 수의 그래서 지금은 의미에서 그 제한거야 기계가, 그들이 선택할 수 있습니다 제한된 양의 데이터가 있습니다 우리도 그래 그러나 우리의 즉시 많은 종류의 많은 데리러 기계가 정말 우리가있어 특히 기계에가는 것보다 이러한 종류의 부드러운 이하 소프트웨어 측면에서, 작업

그래서 당신은이 세 가지를 얻을 그리고, 당신은 인간, 당신이 어떻게 많은 눈 기본적입니다 당신은 포니 테일을 가지고 않습니다 나는 짧은 시간에 있었다 그래서,이 세 가지 범주에서, 나는 경우 당신에게 질문을하면 사람들이 어떤 그룹을 식별 할 수 있어야했다 또는 누군가를 가리 키도록했고, 이러한 범주에 따라 말하고, 무엇을 그들이에 속하는 할 범주, 당신은 할 수 있어야합니다 그리고 인간은, 우리는 꽤 잘있어

나는이 사람이라고한다면, 당신은, 거의 100 % 자신있게 말할 것 그래 그거야 여기에 동일합니다 하나와 동일합니다 네 번째와 동일합니다 그것은 말하기 어렵다,이 여자입니다

여자는 정말 범주 중 하나가 아닙니다 그리고 데이터를 찾고, 잘 어쩌면 당신은 어떤 외부 데이터가 그 빛깔과 사람들이 아마 말한다 약간의 성 차별이다 소녀 그러나 같은, 당신도 알다시피, 우리는 가지 그 가정을 무시하는거야 그냥 묶은 머리는 아마 여자입니다 말한다 우리는 95 % 신뢰과 같이 말할 것이다 함께 글쎄, 당신이 하나를 얻을 그러나이 모든 나머지는 같은, 잘, 더 포니 테일 없습니다

그래서 나는 그들이 여자 아니에요 100 % 확신한다 약간의 문제 그 하나입니다 그래서 이것은 매우 인위적인 만 가지 재미있다 당신이 볼 수있어 데이터의 양을 제한하는 경우, 당신은 지금 당신이 찾을 수있는 패턴으로 제한됩니다 그리고 그것은 매우 직관적 인 것입니다

즉 거의 순간적인 계시해야 뭔가 당신이 경우 같은 샤워는 생각했다 그러나 몇 가지 심각한 증상의 종류가 있습니다 우리는 기계 학습 및 컴퓨터 비전을 적용하려고 할 때 사람들이 만드는 가정 그래서 하나 우리가 필요로 우리는 많은 데이터를 축적 할 수 있다는 것입니다 그러나, 나는 구글 아니에요 또한 구글 아니에요

당신은 아마존이나 마이크로 소프트 아니에요 우리는 데이터의 hedabytes에 대한 액세스 권한이 큰 회사 중 하나 아니에요 그래서 많은 사람들이 다음, 음,처럼 다음 기계 학습 나를 위해 아니다 내가 구글에서 작업 할 때 그때 나는 그것을 할 것입니다 그리고 그들은 이동합니다

하지만 당신은 hedabytes 필요하거나 데이터를 반드시 기가 바이트하지 않습니다 기계 학습이 일을 얻을 수 있습니다 내가 당신에게 간단한 패턴을 제공한다면, 우리는 로직 게이트와 얘기하자 두 개의 입력, 0 또는 1을 취 그리고 그것은 하나 개의 출력, 0 또는 1을 반환합니다 그리고 말과 1과 1, 당신은 1을 반환합니다

내가 말하고 다른 입력, 당신은 나에게 공을 제공합니다 그것은 데이터의 매우 적은 양입니다 사실, 나는 하나의 비트와 입력을 나타낼 수 있습니다 그리고 표현 할 수 있으며, 우리는 10 비트 미만 말할 것이다 지금 당신은 전체 패턴, 완전한 패턴, 만약에 당신을 배웠습니다

그리고 그것은 당신에게조차 킬로바이트 미만했다 그래서 패턴은 많은 데이터를 필요로하지 않는다 당신이 볼로 복잡한 패턴은 어쩌면, 더 많은 데이터를 필요로한다 그리고 그것은 직관적의 종류입니다 그러나 우리는 가지 않고이 문제 과거를 얻을 수 있습니다 단지 더 많은 데이터를 수집합니다

우리는 시간과 시간 동안 앉아서 할 필요가 없습니다 라벨 가지 수동으로 모든 권리를 가고, 그 고양이입니다 즉 간다 즉 개입니다 그것은 여기에 표시됩니다 즉 삼각형입니다

왜 여기에있는 삼각형은? 당신은 실제로 그 일을 앉아서 할 필요가 없습니다 존재하는 모든 다른 기술이있다 그리고 나는 그들이뿐만 아니라 공개하지 않은 생각합니다 그리고 당신이 일의이 종류에 대해 알았다면, 어쩌면 당신은 처음에 기계 학습에서 외면 않았을 것이다 그래서 내가 거기에 열거 한 최초의 사람 중 하나, 이 데이터의 증가라고

화두처럼 들리는 것들의 또 다른 하나 당신이 그것을 버리고 그냥 같은, 내가 일부 데이터를 증강입니다 그리고 당신은 단지 종류의 이동 실제로 아무도 희망 그게 무슨 뜻인지 묻는다 그러나 모두가 정말 그냥 당신이 가지고있는 데이터를 가지고있다 및 종류의 새로운 데이터를 만들거나 패턴이 보존되어 있는지 확인하고 하지만 어떻게 생겼는지 변경 당신이 누군가의 얼굴 사진을 찍을 경우 그래서 제가 그 의미하는 것은 당신은 지점으로, 당신은 여전히 ​​그들을 인식 할 수있는, 그것을 밖으로 스트레칭

그러나 컴퓨터에, 당신이 그것을 밖으로 뻗어 각 픽셀은 더 많은 데이터입니다 지금이 사진을 찍은 나는 그것을 밖으로 뻗어했기 때문에 즉, 같은 사람이다 그러나이 두 개의 서로 다른 이미지입니다 나는 두 이미지를 비교한다면, 그들은 단지 비트가 아니다 동일한 비트별로 비교 그리고 중요합니다

그 기술 중 하나입니다 그래서 이미지를 스트레칭입니다 나중에에 대한 액세스를 얻을 수 있습니다 예제 코드 또는 배포 코드에서, 당신은 전용 전체 구성 파일이 있다고 볼 수 있습니다 당신이 당신의 데이터를 보완 할 방법 그들이 뭔가를 회전합니다 나는 옆으로 돌리면 여전히 삼각형은 삼각형인가? 네 그리고 얼굴과 같은 일

나는 당신의 얼굴을하고 난 거꾸로 아니라, 사람들을 켜면 우리는 거꾸로 자신을 켜고 당신의 얼굴을보고하려고합니다 그러나 같은 일이 기계와 그들이 어떻게 학습에 적용 할 수있다 나는 데이터의 조각의 데이터도 작은 금액을 취할 수 있다면, 나는 그것을 변화의 서로 다른 모든 방법에 따라 증폭 할 수 있습니다 색상이 무슨 상관하지 않는 경우 나는 그림 이모티콘을 사용하고 경우 그들이은 (는) 모든 색상이있을 수 있습니다

당신은 여전히 ​​이모티콘을 인식 할 수있다 그것은 노란색 또는 검은 색 또는 파란색 또는 분홍색하더라도, 여전히 웃는 얼굴 이모티콘입니다 하지만 난 그냥 준 특별한 경우에, 약간의 문제가있다 일부 이모티콘은 의미를 전달하기 위해 색상을 사용합니까 화가 난 이모티콘은 빨간색입니다

당신이 밝은 분홍색 같았다 성난 이모티콘이 있다면, 그것은 약간 다를 수 있습니다 우리는 다른 메시지를 얻을 수 있습니다 그래서, 당신은 당신의 데이터를 보강 할 때하는 것이 중요합니다 패턴을 변경할 수 있습니다 당신은 무엇을 염두에 두어야 어느 사람이 할 수없는, 실제로 이후에 당신을 어떤 정보를 제공합니다 그리고 그 똑똑한 데이터의 다음의 점에 온다 당신이있어 기본적으로 무엇이다, 수집 당신이 당신의 데이터를 보강 할 때 일 당신은 더 많은 것을 얻을 수 밖에 않을 것입니다

내가 데이터를 수집하는 경우 그래서, 난 그냥 이미지를 따기되었다 인터넷에있는 떨어져 종종 무엇인지 나는거야 나는 기계 학습 모델을 구축하기 위해 노력하고있어 경우 수행, 나는 아마 더 있지만, 올바른 종류를 수집 있는지 확인해야합니다 그래서 만약 내가 같은 고양이 30 개 사진을 수집하고 나는 말했다 이 고양이 또는 개 인 경우 모든 권리, 기계, 말해 데이터 수집이 매우 좋은하지 않습니다 난 그냥 같은 일을 포착했습니다 난 단지 그 정보를 가지고 있다면 심지어 인간은 물론, 같은 것입니다

난 그냥 그 고양이가 아니다 말할 것입니다 그러나 기본적으로 여기에 생각입니다 당신이 작은 아이를 가르치고 있다면 당신은 유아 무언가를 가르치거나한다면 또는 당신은, 대학생 복잡한 개념에서 전체 가르치는 경우에도 당신은 그들에게 패턴을 충분히 제공해야 것을 그들은 잘 때마다 얻을 수 있습니다 그들은 주어진하고있는 패턴에서 추정 할 수 있습니다 내가 있다면 그래서 당신에게 번호를 알려 sequence– 1, 1, 2– 다음 어떤 사람들은 갈 수도, 오, 그 피보나치 순서입니다

음 아니 그것은 1, 1, 2, 1, 1, 2입니다

그리고 그 패턴의 매우 종류의 인위적인 방법으로 몇 가지 예를 수 있습니다 내가 당신에게 충분한 정보를 제공하지 않았다 그리고 당신은 이미지를 사용하는 것은, 이런 종류의, 그 패턴의 많은입니다 그것은 눈 색깔이 될 수 있습니다 그것은 머리 색깔이 될 수 있습니다 그들이 사람들이하지 않은 경우? 그것은 모양이 될 수 있습니다

그것은 상황이 교차하는 각도 될 수 있습니다 거기에 많은 정보가있다 그리고 우리는 거의 즉시 그것을 선택하십시오 당신은 한 장의 사진을보고 당신은 같아 여기에서 400 패턴의 이름을 수 있습니다 당신이 생각하지 않는 경우, 오, 나는 정확히 400 개 패턴을 ​​알고 하지만 당신은 아, 그래,이 속성이있어, 열거 시작할 수 있습니다

이 속성이 하나있다 그래서 당신은 당신의 컴퓨터가 있는지 확인해야 충분한 데이터와 실제로 물건을 선택할 수있는 데이터의 오른쪽 종류 당신이 종류의 당신의 mind–를 좁힐 수 있다면 그에게 좋은 벤치 마크입니다 이 단지 좁은 minded– 수, 내가 말할거야 몇 가지 경우 중 하나입니다 오직 당신이있어 어떤 맥락에서 뭔가보고 당신은 아직도 그것을 알아낼 수 있다면, 거기에 아마, 주어진 기계에 대한 방법도 할 수 있습니다 그리고 당신은, 기계는 아마 중 하나를 수행 할 수없는 경우 그리고 자동화 된 데이터 수집이의 다음 솔루션 중 하나입니다 나는 충분한 데이터의 문제가 발생하지 않습니다

기본적으로 원래 때문에, 무력, 솔루션은 사진의 무리을하고 레이블을하는 것입니다 그리고 우리는 여기에 영상 분류와 같은 구체적으로는 약 얘기 기계 학습의 다른 종류가 있습니다 하지만 난 종류의 이미지를 향한이 더 준비하고있어 분류는 이해하고 직관에 조금 더 쉽게하기 때문이다 그래서 만약 내가 수동으로 이미지를 라벨했다 그리고 내가 전에 이런 짓을했습니다

그것은 끔찍 당신이 그것을 피할 수 있다면, 그렇게하지 않습니다 그러나 당신이 앉을 수있는 당신이 아니라, 이것이 A는, 말할 수있다, 이것은 B이다, 이것은 C입니다하지만 당신은 확인하기 위해 충분한 데이터가 필요 당신의 패턴이 완료됩니다 그래서 당신은 일곱, 여덟 시간 동안 그 일을 할 수 있습니다 그것은 끔찍한입니다

좋은 음악을 찾을 수 있습니다 그것은 수행하기가 조금 더 쉽게 것입니다 하지만 당신은 그 과정을 자동화 할 수 있습니다 나는이게 뭐야 모두를 생성 할 수있는 경우의 말을하자 우리는 편지의 일종을하고있는 recognition– 내가 100 개 다른 글꼴 26 개 모든 문자에 생성 할 수 있다면, 우리는 당신이 소문자와 대문자를 할 어쩌면 52 경우, 말할 것이다 그런 다음 내 모든 데이터 수집은 매우 간단합니다

버튼을 클릭하면, 그것은 이루어집니다 당신이 당신의 데이터 수집을 자동화 할 수있는 방법이 있다면 그래서, 그것을 할 그리고 지금 당신이 그것을 자동화 한 것을, 당신은뿐만 아니라 많은 데이터를 생성 할 수 있습니다 원하는대로 그리고 당신은 시간 제한이 될 수도 있습니다 컴퓨터가 더 많은 데이터를 배운다로하기 때문에, 그것은 더 많은 시간이 걸릴 수 있습니다 그래서 지금 당신은 당신이 수행해야 균형을 맞출 수 있습니다

내가 모델링 학습 더 많은 데이터를 생성하고 더 나은 기계를 얻을시겠습니까? 희망에 더 적은 데이터를 생성하고이를 빠르게 수행 할 수있다? 그리고 더 좋은 그것을하지 않습니다 그것을 더 많은 데이터를 제공하는 지점이있다 그러나 그것은 느린 만드는가? 그 시점에서 중지해야하기 때문에 그것은, 어떤 나아지고 있지 않은 경우보다 어쩌면 당신은 당신의 모델을 변경해야합니다 그리고 그 마지막 지점은 우리가 때때로 beefier에 모델을 필요로하고, 거기에 때로는 더 똑똑한 모델 그리고 그 다소 교환 때로는 수 없습니다 당신이 더 큰 더 무거운 모델을 사용해서, 그게 내가 가지 beefier에 무엇을 의미합니다

이 학습 일에서 더 나은 것을 의미하지 않습니다 단지 더 큰 사람들은 더 빨리 본질적으로 일을 배울 수 없습니다 그러나 나는 방법에 대해 조금 더 영리 모델이있는 경우 패턴에 데리러 빠른 수있는, 뭔가를 배운다 아마 상황에 따라 조금 더 잘 할거야 그래서 시스템에 대한 나의 마음에 드는 신화 우리의 일 중 하나 나는 또한의 일부를 차단하고있어 것을 배우는 것은 시간이 오래 걸린다는 것이다

나는 모델을하고 일을 얻고 싶은 경우에, 나는 시간과 시간과 시간을 훈련해야합니다 그리고 그것은 사실이 아닙니다 즉 사람입니다 사람들은 시간이 오래 걸릴 당신은 시간과 시간 동안 사람들을 훈련

기계 학습의 장점 중 하나는 당신이다 그렇게 오래 그들을 훈련 할 필요가 없습니다 많은 시간, 내 말은, 그것은주의로의 당신이 거대한 데이터 세트에 훈련하는 경우, 당신은, 특히 복잡한 모델을 훈련하고 시간이 오래 걸릴 수 있습니다 그러나, 우리는 CS50 최종 프로젝트의 일종을하고있는 주어진 이것은 당신을위한 문제가되지 않습니다 이것은이 프로젝트를 밀어 것이 아닙니다 당신의 이해의 도달의 그것은 실제로 단지 종류의 신화 것들 중 하나입니다 그 기계 학습이 너무 오래 걸립니다

그리고 병렬 신화의 종류는 컴퓨터 비전은 완벽하다 화상의 모든 데이터를 캡처한다 오른쪽 그리고이 병렬 것을 어쩌면 방법은 바로 분명하지 않습니다 그러나 같은 생각이 여기에 존재한다 컴퓨터 비전이이 개념은 어떤 데이터의 완벽한 표현이다 그것은 우리의 이해의 외부로 밀어 본다 그것은 완벽한 표현 인 경우 때문에 우리는 완벽한 표현에서 뭔가를 배울 수 없습니다, 그것은 드리겠습니다 아니다

뿐만 아니라 우리의 손을 던져 포기 수 있습니다 그러나 그것은 사실이 아닙니다 컴퓨터 비전은 조금 주관적이다 나는 내 컴퓨터가 보는 방법을 선택할 수 있습니다 나는 패턴을 집어 들고 얼마나 잘 선택할 수 있습니다, 얼마나 잘 전경과 배경이 무엇인지 구분합니다

당신이 데이터를 선택하려고 할 때 그 모든 것들이 놀이로 온다 그래서 우리는 더 많은 단지, 컴퓨터 비전의 매우 간단한 예제를 사용 당신에게 개방 CV2와 인터페이스하는 방법의 분포 코드의 맛을 제공합니다 그러나 그것은 존재한다 그리고 그것은 내가 특히 생각하는 무언가가있다 이미지 분류에 중요 그러나 우리는이 모든 일을 수행하는 소프트웨어를 선택 할 때, 심지어 그냥 컴퓨터 비전을 수행하는, 기계 학습을 할 수 일반적으로 프로그램으로, 그것은 우리에게 매우 중요 종류의 소프트웨어의 다른 조각 사이의 무역 오프를 볼 수 있습니다

이 프로젝트와 일반적으로 그래서, 나는 Keras 열기 CV로 이동합니다 그러나 후드 아래, Keras는 TensorFlow를 사용합니다 또는 적어도, 나는 그것이 TensorFlow를 사용합니다 당신은 또한 Theano을 사용하게 할 수있다 나는 Theano를 사용하지 않습니다

그것은 약간의 mathier입니다 그것은 내 지적 수준 조금 위였다 내가 생각 TensorFlow하지만 꽤 액세스 할 수있었습니다 나는 회사로 그냥 가지 일반적으로 그것을 좋아하지 나는 그들을 위해 작동하지 않습니다 맹세합니다 그들은 단지 정말 멋지다

그리고이 두 가지가 실제로 같은 혜택을, 내 관점에서 적어도 나는 단지이 모든 것들을 배우는 대학생이었다 다만 일반적으로 컴퓨터 과학을 학습 그래서 내가 아니라, 당신이 프로젝트가 존재하는 것을 알고, 같았다 내 TF를 물었다 그리고 그는 오, OpenCV의처럼 찾아 가서 같은 그 무엇을 볼 수 있었다

나는 기계에 할 수있는 뭔가를 배울처럼 그리고 나는 그에게 물었다 나는 AI를하고 싶어 오 AI가 조금 무서운 소리처럼 그는이었다 그러나 기계 학습도 무섭다 음, 하나를 선택하십시오

그리고 OK처럼, 우리는 기계 학습을 다하겠습니다했다 그리고 당신은 매우 차이가있어 알 수 있습니다 하지만 높은 수준의 인터페이스가 무엇을 의미하는지, 나는, 오픈 소스 생각 그것은 대중에게 열려, 나는 그것을 위해 지불 [들리지 않음]을하지 않았다 대학생 그러나 높은 수준의 인터페이스를 제공하는 무언가이다 내가 가지뿐만 아니라 여기에했던 것을, 제품, 유통 코드 내가 마지막에있을거야, 높은 수준에서 높은 수준의 인터페이스입니다 인터페이스를 제공합니다 그것은 접근 할 수 있다는 점에서 당신은 단지 모델을 구축, 말을해야합니다

그리고 그것은 후드 아래에 모든 것을 처리합니다 그것은 단지 그것이 의미하는 어떤 모델을 구축합니다 당신이 가고 싶다면 후드, 아래에보고하는 난 당신이 프로젝트로이를 구축하는 경우 당신이 할 것을 조언 당신은 무슨 일이 일어나고 있는지 볼 수 있습니다 그렇게하지 당신은 그냥 작업 할 경우에, 그이가하는 일입니다 나는 나의 수학에 한 잘못을 실시, 오, 쓰레기를 앉아서 말할 필요가 없습니다 여기 그래서 내 컴퓨터는 이제 모든 사각형 말한다

그 종류의 짜증나는 것처럼 그리고 어쩌면 그 두 가지 사이의 추적 당신이 사용하고 특히, 매우 어렵습니다 어쩌면 당신이 완전히 이해하지 않는 무언가를하는 알고리즘 당신은 그냥 수학의 많은입니다, 좋아 여기 앉아있어 그게 시그마 생각합니다 그리고 여기 또 다른 편지가있다

그리고 난 이유를 모르겠어 그리고 당신은 내가했던 위키 백과, 그것을 찾아 가고, 그냥 이름이있다 더 이상 수학의 실제 번호가 없습니다 그것은 모든 기호입니다 그리고 읽기가 매우 어려워진다 그리고 거기에서 액세스 할 수 없게됩니다

그리고 어쩌면 당신은 포기 또는 당신은 단지 좌절 그리고 당신은 케이크 한 조각을 먹고 이동합니다 그게 내가 무슨 짓을했는지 그리고 그것은 매우 실망입니다 하지만 소프트웨어의 두 조각을 선택한 주된 이유 그들이 사용할 수 있다고했다

나는 그들을 사용하는 방법을 알아낼 수있다 다소 아이러니 컬하게도 알아내는 방법들을 다운로드하세요 매우 어려웠다 고 나는 그렇게 20 시간을 보냈다 정말하지 않았다 때문에 틀림없이 그였다 시 문서를 읽는 방법을 알고있다 또한 코드를 통해처럼 읽는 방법을 몰랐다 GitHub의 페이지 또는 아무것도 같은합니다

하지만 내가 유일한 사람이 아니에요 것을 알고있다 사실 나는 대략 같은 장소에 대해 728 학생들이 지금 CS50라는 클래스이다 그래서 뭔가가 한 장소에 모여 한 생각 일을 설치하는 쉬운 방법 것과 훨씬 쉽게 소개합니다 그래서이 배포 코드는 무엇입니다 경우에는 분포 곡선을 찾고 당신이 내 이야기의 나머지를 듣고 싶지 않아, 이 강의의 끝으로의입니다

내가 거기에 도착 후이있을거야 당신이 경우에, 놀아 그러니까 기본적으로, 나는 모든 패키지를했다 OpenCV의 작업을 얻기 위해 설치 될 필요가 그들 중 많은이있다 그 하나는 정말 짜증나는 일입니다 Keras 괜찮습니다

당신은 그냥 잘 작동 Keras를 설치 pip3 좋아해요 OpenCV의 끔찍하다 OpenCV의에 대하여 아무것도 없다 난 아주 많이 프로젝트가 존재 함을 감사드립니다 나는 그것을 사용하는 얻을 슈퍼 흥분이있다

그것은 설치하는 엉덩이 단지 고통입니다 내가 젊고 순진 때 또는 적어도 그것은이었다 그리고 그것은 나에게 문서를 읽고 거기에 앉아 매우 힘들었다 하지가 특정 용어가 무엇을 의미하는지 알지 이 일을 설치하는 가상 환경을 사용하는 것이 무엇을 의미합니까? 왜이 필요하다? 나는 내 다운로드 휴식 않았다하지 않으면? 왜 다운로드가 작동하지 않는 이유는 무엇입니까? 주변에 던져 이러한 용어와 모든 것들을있다 그들이 가지고 있기 때문에 당연 나는 아주 무서운 것을 알고있다

그리고 적어도, 그것은 매우 실망입니다 그래서 나는 OK, 난, 말한 일을 결국 무엇을 단지 모든 솔루션을 시도가는 중 하나가 작동, 작동합니다 그래서 하나 개의 지점에서 내 컴퓨터 그것에 OpenCV의 40 개 다른 버전처럼했다 내가 생각하는 모든 프로그래머는 경험의 종류가 있었다 여기서 그들은 단지 사물의 수백을 다운로드했습니다 나는 한 지점에서 소스에서 내장

그리고 멋진 같았다 나는 이것이 무엇을 의미하는지 모르지만 나는 그것을했다 그리고 잘했다 즉 실제로 내 마지막 프로젝트에 사용 결국 사람이었다 당신이 무슨 일을하는지 알지 못한다면 내가 그 일을 권하고 싶지 않다

나는 끔찍하게 그것을 망쳐 그리고 난 그냥 OpenCV의의 누락 절반 것을 깨닫지 못했다 나는 분명히 필요하지 않았다 그러나 나쁜, 나쁜 거래처럼 그래서 결국 우리는 몇 가지 코드를 가지고있는 점에 입수했습니다

당신이 원하는 경우 bitly 링크가있을 수 있습니다 다음은 당신이 그들을 원하는 경우에 실제 슬라이드입니다 당신이 슬라이드에 갈 수 있도록 그들은 그들에 이러한 링크가 다음 링크를 클릭합니다 GitHub의 링크가 내 개인 GitHub의이다 나는하지 않았다 우리는 우리의 실제 이름 때를 사용하기로했다 실현 우리는 학교 GitHubs를 만들었습니다 내 이름은 셀의 강국이 아니다

실제로 닉입니다 그러나 나는 그것을 유지되었다 내 TF는 괜찮습니다 그래서 우리는 그것을 유지 그리고 이것은 bitly 버전, 약간 짧아입니다

내가 가지 조금 얘기를하는 동안 그래서 내가 거기 사람들을 떠날거야 그리고 결국 나는 몇 가지 코드를 끌어 올려서 우리는거야 코딩 일에 도착, 또는 적어도 코드가 무엇을하는지 데모를 제공합니다 내가 발견했습니다 당신이 실제로 사람들 앞에서 물건을 코딩 할 때, 당신은 초당 약 400 개 오타를 확인하십시오 정말 좋은 거래 만이 아니다 그래서 나는 다른 사람들 앞에서 특히 많은 코딩 좋아하지 않는다

그러나 당신은 GitHub의 기본적 것을에서 찾을 수 있습니다 매우 치즈 읽기 나 많은 파일 내가 필요했다 생각으로 나는 많은 그림 이모티콘을 포함했다 나는 일반적으로 그림 이모티콘을 사용하지 마십시오 내 GitHub의에 물건을 쓸 때 나는 또한 자주 사용하지 않습니다 그것은을 가진 유일한 하나입니다

그러나 GitHub의이 그림 이모티콘 등을위한 좋은 인터페이스를 가지고 있습니다 그리고 그 이유는 문제는 내가 알고리즘의 종류와 해결하기 위해 원 이 세미나에 대해이 기계 학습, 컴퓨터 비전 그림 이모티콘을 분류했다 그리고 그것은 매우 광범위한 문제입니다 그리고 나는 그것의 모든 해결되지 않았다 난 사실도 정말 해결되지 않았다

그러나 나는 그 길에 우리를 시작했다 그래서 나는 OK, 그럼 난 이모티콘과 함께 뭔가를하고 싶어했다 그 서늘함의 종류도 가지 dorky 엉덩이의 종류, 때문에 그리고 그 가지, 후자가 아닌 처음 두 날을 맞는다 그래서 나는 결국 내가 당신이 말한 일 우리가 존재의 그림 이모티콘 등 수백 분류하지 않을거야 무엇을 알고있다 우리는 15 개 행복을 찾고 것과 같은 걸릴거야 15 종류 중성 틱 ones– 나는 실제로 those– 13 다음 15을 얻을 생각 화를 내거나 부정적인보고 사람의 종류

우리는 그 세 그룹 클래스를 호출하는 것입니다 우리는 중립있다, 긍정적 인 무언가가있다, 말거야 과 부정이있다 그리고 나는 기계가 나에게 말할 수 있기를 원하는 것은 임의의 이모티콘입니다 나는 긍정적 인 중성 또는 부정적인에서 찾고있다 그리고 그 가지 사소한 것 같다 인간은 그 모든 시간을

그리고 우리는 너무 그것에 대해 매우 주관적입니다 나 그냥 화가 나서 좋아하는 우리는 같은 종류, 우, 그 사람이 그녀가 찾고 있습니다 그는 단지 그에게 공격적인 얼굴처럼 있어요 그는 그냥 차게 자신의 차를 홀짝입니다 당신은 그녀의 신발을 엉망

뭐 그런 우리가 인식하기가 매우 어려울 수 있습니다 그리고 심지어 예에서, 그 완전히 주관적이다 내가 방금 말한 것은 기본적를보고 누구에게 달려 있습니다 이 어려운 문제가된다 어디에 즉, 이 일하러 가야하기에 충분한 데이터를 제공 할 방법이다 그래서 실제로 disservices의 몇했다 이 코드의 당신에게, 사용자

하나, 당신이 잘, 함께 제공되는 기계, 그것은하지 그것을 아주 잘 수행, 작동 않고 훈련을 배우게됩니다 말은 기본적으로 무작위로 추측합니다 그것은이 33 %의 확률로, 그 33 %의 확률로, 나도 몰라, 그것은 관하여, 말할 것이다, 당신이 알 수 있습니다 그 중 33 %의 확률로, 세 가지, 세 가지 범주에서 100 %, 약 33 %가있다 그래서 기계는 그것을 알아내는 아주 좋은 일을하지 않습니다 내가 데모 거라고 하나의 시험 때 그리고 가끔 발견되는 때로는 기계는 실제로 당신을 제공하는 것 그냥 완전히 잘못 얻을 수 있지만, 그 슈퍼 확인 같아요

, 나는 매우 행복을 찾고 이모티콘주고 그것 같았다 나는이 음수 100 % 확신한다 바로 거기에 부정적인 표정 이모티콘 그리고 그 재미있는 것 중 하나의 종류입니다 나는 많은 시간이 때 기계 학습을하고있는 것으로 생각 당신은, 특히 성가신 유아 유아를 훈련하는 것처럼 당신은 그 느낌이 주위에 자체에 정말 위험 또는 아무것도 아니다 그러나 특히 당신을 싫어한다 사실, 당신이있어 어떤 과제 결코 있는지 확인하고 싶어 노력하는 수행 할 수 있습니다

즉 특히, 나는 종류의 기계 학습 작품을 배운 방법 나는이 존재 작업을 할 때처럼, 오, 쓰레기 내가 가르치는 세미나가 있습니다 이 작동되지 않았습니다 그것은 단지 내가 원했던 일을 거부했다 그리고 그것은 매우 실망했다 그러나 뭔가이 유아 비유와 평행선을 많이 공유하는

당신은 유아 모든 시간이 걸릴 것 인 경우 단지처럼 그들은 단지 당신이 그들이하고 싶었던 일을하지 않았다 좋아요, 점점 새로운, 그리고 단지 같은 새로운 유아 가서, 그 여러 가지 방법으로 이상한거야 너무 또한 가지 이상이와있다 그것은 좀 덜 극단적이다 당신은 아무 문제가 기계를 거래 할 수 없습니다 하지만 당신은 내가 당신을 건네 한 기계가 실제로 않는 것을 확인할 수 있습니다 수정할 수있는 몇 가지가 그 안에이 훨씬 더 확인합니다

그리고 방금 복사 한 것을 의미하고 반복해서 같은 층을 붙여하지 않습니다 다시 더 이상 기계를 만들지 만, 오히려 조금 더 영리 할 수 ​​있습니다 그러니까 기본적으로, 우리는 machines– 훈련 또는 때 내가 때 training– 나는 우리를 말한다 나는 기계 모델을 훈련 내 방처럼 외로운 때 나는 I 의미 나는 어떻게 든 일이를 얻을 수있어, 모든 권리를 말하고 있었다 내가 할거야 모르겠어요

아시 경우에, 나는 약 15 이미지를했다 말했다 긍정적 중성 슬픈 그래서 45 개 이미지가 대략 총했다 즉 데이터의 매우 작은 양의 종류입니다 그래서 실제로 code– 일부 기술을 사용 내가 노력하고 내가 가서 때 there– 그들을 지적거야 그것은 내 데이터를 보완 할 수 있습니다 우리는 첫 번째 단계를 수행합니다

우리는 우리의 데이터를 증강 내가하지 않았다 매우 좋은 데이터를 추가했다 내 데이터 수집 내 게으름의 부분적 제품 하지만 지금은 소급, I의 제품은 원 그것은 가르치는 순간이었다, 가르치는 것은 데이터입니다 많은 생각없이의 임의의 종류의 수집 패턴이 포착되고 있었다 무엇인지에 당신이 경우 내가 가지, 두 번째 규칙 내 자신의 종류를 무시했다 난 그냥 게으름 때문에 그리고 네, 그 대부분입니다

난 그냥 데이터의 무리를 선택하고 같은 거기에 그것을 던져했다 그것은 일을 바랍니다 그리고는 잘 작동하지 않습니다 그 전략은 대단히 도움이되지 않습니다 그 하드 그것에 대해 생각하지 않았다 그러나 당신은 최소한 그것에 대해 생각으로이 얻을 수 있습니다

당신이 웃는 얼굴 이모티콘이있는 경우, 예를 들어, 우리가이 경우에 이것에 대해 얘기부터, 그것은 충분히 다른 웃는 얼굴을 찾기 위해 너무 어렵지 않다 일반적인 경우를 포함한다 그것은 대부분 자신의 얼굴의 바닥에 그 웃는 작은 반원입니다 당신은 여전히 ​​작은을 유지 할 수있는 동안으로 그리고 많은 데이터를 포함하는 그 어려운 일이 아니다 당신은 그것에 대해 조금 더 똑똑해야 보다 내가했다 그리고 데이터가 그 GitHub의 페이지에 포함되어 믿습니다

그래서 당신은 거기뿐만 아니라 내 허접스런 수집 된 데이터를 볼 수 있습니다 난 정말이 저작권 문제가 아니에요 바랍니다 누군가가 나를 체포 나타나는지 우리는 알게 되겠지 그래서 우리는 실제로 실제 GitHub의 페이지보고로 전환하는 것입니다 cheesiness이 들어오는 곳이있다

나는 기계의 느낌을했다 나는 그 날 좀 dorky 느끼고 있었다 나는 매일 약간의 dorky 느끼고있다 그리고 나는 쓰레기, 오, 좋아했기 때문에 내가 할 수있는만큼 많은 이모티콘을 포함했다 마찬가지로 당신은 가격 인하에 이모티콘을 포함 할 수 있습니다

그건 괜찮아요 그래서 나는 거기에있는 사람들을 통해 그리고 당신은 당신이 원하는 경우 자신이 읽을 수 있습니다 어쩌면 당신은하지 않습니다 그렇게하지 않으면 나는 저를 비난하지 않는다

바로 여기가 txt이 요구 사항이 있습니다 그리고 그건 당신이 기본적으로 그냥 바로 설치할 수 있습니다 이 전체 프로젝트에 대한 모든 요구 사항 이게 다예요 구글 또는 아무것도를 통해 검색의 어떤 20시간 없습니다

그냥 그 그리고 우리는 우리의 소스 폴더가 있습니다 그리고 원래 좀 골격 코드를 제공하려고 했어요 가지 실제 코드를 보완합니다 나는 시간의 부족 때문에 나는 그 반대 결정했다 그리고 나는 또한 약간의 의미라고 생각했다

그래서 그 대신 우리는 완벽하게 작동 샘플 코드가 있습니다 그리고 나는 조금 밖으로 물건을 분리 한 그냥 쉽게 무슨 일이 일어나고 있는지 이해 할 수 있도록합니다 그리고 바로 여기에 최대, 상단에, 당신이 기본적으로 컴퓨터 비전 폴더가 있습니다 거기에 단 한 가지가있다 그냥 기본적으로 컴퓨터 비전을 제공하는 것입니다 우리의 코드에 속성

그리고 당신은 데이터를 가지고있다 그래서 우리는 짧은 여기에 살펴 보겠습니다 그것은 매우 큰 아니에요 테스트 데이터가 훈련 데이터가있다 그것은 꽤 밖으로 분할합니다

그러나 당신은 기본적으로 pngs 단지 무리하다고 볼 수 있습니다 이 사람은 꽤 슬퍼 발생합니다 그리고 그들은 같은 높이와 너비를 볼 수 있도록 모든립니다입니다 그들은 200 개 픽셀 모든 200입니다

나는 그것을 추천 할 것입니다하지만 당신은 그렇게 할 필요가 없습니다 당신이에서 정상화 할 수있는 것들 중 하나로서 크기가 무엇 때문에 데이터가 다른가요? 그 다루는 기술이있다 당신은 다만 적당한 비율로 축소 할 수 있습니다 당신은 가지의 다양한 종류를 할 수 있습니다 당신이 할 수있는 경우에, 당신은 일에 걸쳐 꽤 일관성있는 데이터를 보존하려면 그것은 중요하지 않습니다

그래서 여부 같은 것은이 크기 또는이 크기는 여전히 슬픈 얼굴의입니다 그것은 여전히 ​​부정적이다 그래서 분류는 그것이 무엇인지 크기에 정말 의존하지 않습니다 그래서 난 내 데이터 같은 크기의 모두를 유지하고 싶어 그래서이 경우에 기계, 오, 같은 것을 201 개 픽셀이 이미지는 그 슬픈이다 400 픽셀입니다 이미지, 그들은 행복하다

그 때문에 그건 정말 불행한 일 우리가 쫓고있는 실제 패턴 근처에도 없습니다 그리고 당신은 심지어 복잡한 예를 이해할 수, 당신은거야 패턴이 문제가있는 인식 할 수 있어야합니다 그리고 어떤 것들하지 않으며, 어떤 사람은 당신이 실제로 도입된다 당신의 모델로 그리고 그 가지 복잡한 소리가 있습니다 하지만 난 그냥이 준 예, 너무 어렵지 않다 이미지의 크기가 실제로하지 않습니다 있는지 만들기 실제로 배우는 것의 기계 학습의 종류로 재생할 수 있습니다

그것은 매우 직관적이다 그리고 이들의 대부분은 같다 그들은 꽤 직관적입니다 이런 종류의 프로젝트, 그것은 복잡한의 종류를 소리에도 불구하고 너무 나쁘지 않다 당신이 만드는 경우 특히 복잡하지입니다 그것은 유사 인간 또는 유아를 좋아합니다

당신은 당신의 젊은 조카, 조카, 딸 등 생각할 수 당신이 아이, 형제, 형제, 작은 사람, 작은 인간의 존재가 있다면, 당신은 그들을 가르치는 방법에 대해 설명합니다 당신이 아이를 가르 칠 수 있다면, 당신은 아마 수 몇 가지주의와 기계를 가르칩니다 그래서이 폴더의 나머지 부분에서, 우리는 ML 있습니다 그것은 바로 여기 주위에 있었다 그것은 단지, 단지 기계 학습 부분입니다

이 모든 기계 학습 부분을 수행한다는 점에서 파일이있다 우리가 그냥 아주 높은 수준의 모델을 가지고하는 나는 클래스를 만들었습니다 그러나 그것은 또한 당신에게 충분히 낮은 수준을 제공합니다 당신을 모델 자체 수리를 할 수 있습니다 그래서 당신이 원하는에 따라 달라집니다 그리고 우리는 그것의 내부 변수의 무리가있는 구성 파일이 있습니다

우리는 약간의 내부를 살펴 수 있습니다 그리고 우리는 우리의 실제 실행 파일이있는 우리가 소프트웨어의 전체 조각을 실행할 수 있습니다 그리고 제가 이전에 사용하던 단지 테스트 이미지입니다 testpng 있습니다 나는 귀여운의 그것의 종류를 떠났다

그래서는 GitHub의에 모든 코드입니다 당신은 그것을, 다운로드 풀 요청을 복제하려면 환영합니다 바람직하게는 이익을 위해 그것을 판매하지 않습니다 당신이 경우에, 그건 정말 멋지다 나는 그것이 작동하는지 그냥 자랑스럽게 생각합니다 그런 것들의 어떤 굉장합니다

그러나 우리는 실제로 여기에 코드를 조금 보여 것입니다 그래서 실제 코드의 디렉토리에 이미입니다 당신이 GitCloned 한 것 인 경우에 그래서, 당신은 좋겠 여기 어딘가에 만난다 그래서 이것은 루트 디렉토리의 실제 종류이다 나는이 지루한 터미널 화면의 종류 알고 하지만 곧 더 흥미로운 얻을 것이다

그래서 여기에 당신의 파일 만 잔뜩있다 볼 수 있습니다 즉, MIT는, 읽기가-나를 말하는 어떤 라이센스 알려 과 같은 몇 가지 여기 캐싱, 소스 파일 및 요구 사항이있다 우리는 소스 때문에 SRC로 갈 것입니다 그리고 우리는 실제로 샘플 디렉토리에 특별히 갈 것입니다 우리가 시작했던 곳 그리고 우리는 돌아왔다 내가 이것을 실행하기를 원한다면 그래서, 나는 기본적으로 네, 오, /run

py 그리고 – 말할 수 있습니다 내가 말했듯이, 사람 앞에서 입력, 당신은 너무 많은 실수를합니다 그리고 이것은 우리의 도움말 화면의 종류를 나타납니다 이는 가능한 한 비 모호하기위한 것입니다 조금 애매한 될 수 있도록 그러나, 나는 전문가는 코더입니다 없습니다 하지만 사용하기 아주 쉽게 할 의도

그래서 출력 파일에 대한 -o있다 그리고이 소프트웨어 물건의 모든 단지 일종이다 특히 흥미로운 것은 아닙니다 당신이 이후에 관심이 있다면, 가서 알려 주시기 바랍니다 그리고 나는 그것에 대해 당신과 얘기 할 수있을 것입니다

그냥이를 실행하기를 원한다면, 그때 우리는, 음, OK, 말할 수있다 내 출력 파일이 세미나가되고 싶어요 그리고 그것을 통해 가고 싶은, 우리는 교육의 한 라운드를 말할거야, 다음 45 분 동안 여기 앉아서 할 너희들하지 않는 한 그리고 나는 또 다른 모델이 이미 존재 하나를로드하지 않습니다 나는 그냥 가지 자신의 일을하고 싶습니다 그리고 정말 할 필요합니다

명령 줄에서, 그게 훈련 할 것이다 그리고 나는 그 말을이는 한 번있을거야 그것을 절대적으로 환상적인 휴식 그러나 TensorFlow 백 엔드를 사용하는 것 있음을 알려줍니다 내가 그것을 건네했던 모든 데이터를 발견했다 그리고 지금 훈련을 시작한다

나는 그것이 종류의 동행입니다 생각하기 때문에 내가 이것을 가져다 이유는 이러한 것들의 각각의 의미를 아주 확실하지 않다 그리고 어떤 종류의 재미 것은 어쨌든 이러한 메트릭의 각을 사용자 정의 할 수 있습니다 그러니까 기본적으로,이 화면을보고하는 경우, 당신이 경우 당신은 멋진 작은 애니메이션의 자신의 종류를 참조하십시오 그러나 이것은 정말 당신에게 훈련 라운드를 통해 얼마나 많은 단계를 말하고있다 그것은이라도 [? 신기원 또는?] 에픽은 일반적으로 실제 훈련이 될 것입니다 이에 라운드

그래서 훈련 내내 내 컴퓨터는 기본적으로 모든 오른쪽 말하고있다 난 당신이 지정하는 데이터의 일부 금액을 제공하고 있습니다 그리고 나는 도대체이게 무슨 뜻인지 알아낼 수있어 나는 그것을 분류 할 수있어 그리고 그것이 무엇을하면 거기에 앉아이며 흠, 그건 고양이처럼 보이는 말했다 즉 새입니다

즉 개입니다 그리고, 또는이 경우에, 그는 중립이다, 즉 부정적, 긍정적입니다 그리고 그 답을 던졌습니다 그리고 그들을 인코딩 somehow– 0, 1, 2, 완전히 합리적인 그리고 그것이 무엇을 그것이 확인, 여기 내 대답은 모든 데이터에 있습니다 말한다 나는 손으로 봤는데

그리고 그것은 답변 본다 그리고 오, 쓰레기, 나는이 일이 하나,이 하나를 놓친 말했다 그래서 몇 가지 마술을 할 수있어 나는 다시 무게 내 번호의 일부를거야 좀 하드 코어 수학 물건을 할거야

그리고 나는 다시 시도거야 그리고는 새로운 교육의 라운드입니다 이제 각 막대 또는 각 행의 오른쪽 방향의 종류를 알 수 있습니다, 이 발 손실과 모음 ACC가있다 그리고 그들은 여기 손실과 ACC에 해당합니다 손실 존재는, 음, 어떤 손실은 실제 알고리즘에 사용되는 메트릭입니다 또는 수학 아래

그리고 ACC는 정확성이나 주어진 모델의 정확성되는 절대적으로 이미지의 어떤 종류를 이야기하려고하는 것을 그 여러 범주와 함께입니다 그리고 당신은이 모델을 빌드 파일 내에서이 모든 것을 지정할 수 있습니다 하지만 지금 우리는 그대로 만 가지 걸릴 것입니다 당신은 예를 들어, 그 정확도 메트릭을 사용할 필요가 없습니다 그 각각의 발 버전은 검증 버전입니다

그들은 여기에, 말하는 것, 모든 권리있어 당신이 전에 본 적이 한 어떻게 당신은에해야합니까? 그리고 그 하나, 그것은 그 가중치를 재조정하지 않습니다 그건 그냥 조금 평가합니다 그것은 당신이 overfitting하지 않을 것을 확인합니다 그래서 던져진 첫 번째 항이었다 날 때 나는 이것이 배우고 시작했다 무엇 그것은 당신의 데이터를 overfit을 의미 하는가 그리고 그것은 직관적의 종류입니다

당신은 너무 많은 피팅하고 있습니다 그리고 당신은 피팅으로이 교육 과정을 생각하면, 당신은 단지 그것을 너무 많이 훈련하고 있습니다 그리고 당신은 유아와 등이 생각할 수 당신이 그것을 제한된 패턴을 너무 많이 주면, 어쩌면이다 당신은 모든 것이 너무나 종류의 것으로, 기계를 말한다 당신은 그것을 가져 모든 데이터 조각을 제공합니다 그리고 그것은 단지 데이터가 아니라 실제 패턴을 기억합니다

사람들은이 모든 시간을 당신은 그들이 그 사실을 기억, 그들에게 화학 사실의 무리를 제공합니다 당신이 그 사실을 그들에게 외삽을 요구하는 경우에, 그들은 아무 생각이 없습니다 이는 특히 예를 들어 공립학교 시스템에서, 매우 일반적인 문제입니다 작은 정치적 잽

그러나 너무 기계에 일어나는 일입니다 그들은 단지 자신의 데이터를 기억 끝날 경우, 예 그들은 적어도 메트릭 손실 정확도의 종류에, 바로 그것을 얻을, 하지만 그들은 바로 검증의 정확성을받지 않습니다 그 물건 때문에 그들은 한 번도 본 적이 없어요 그들은 그것을 기억 수 없었다 그것은 기본적으로 테스트 복용 뒤에 같은 생각입니다 나는 당신에게 데이터를 제공합니다

난 당신이 패턴이 아닌 실제 데이터 내용을 기대합니다 그리고 나는 당신이 전에 본 적이 데이터를 가지고 테스트를 제공 하지만 같은 패턴을 가지고, 당신은 그것을 알아낼 수 있어야합니다 그래서 당신은 볼 수 있습니다 또는 불행하게도 그것은 종류의 다음까지 잠겨있어 하나는, 그러나 우리는 이러한 03S 열로은 거의 동일 대략 것을 말하는 것입니다 당신은 0

32, 035, 038, 038처럼, 그들이 알 수 있습니다 그리고 당신은 그들이 대략 추측하고 알 수 있습니다

나는이 하나가 중립적이라고 말한다면 기계는 기본적으로, 헤이, 말하는 이 하나,이 하나의가 positive– 중립적, 부정적 부정적 양– 난 그렇게 좋은하지 않은 것이 거의 제대로 나는 당신을 건네 모델이 아니라이기 때문에 그것은이다 특히 지적하지 또한 데이터를 아주 잘하거나 수집하지 않습니다 그리고 당신은 심지어 accuracy–을 알 수 있습니다 정말 모든 것을 암기 할 수있는 기회를하지 않았다, 하나님 – 감사합니다 여전히 매우 낮다 그것은 대략 여기에서도 추측입니다

그래서 너무 좋지 않다 그리고, 나에게 물었다 나는 모델을 저장 하시겠습니까 그리고 당신은 기계의 신화에 대한 하나의 나의 점을 알 수 있습니다 그 오랜 시간이 걸리지 않았다 학습 우리는 몇 분 여기를 얘기했다 그리고 그것은 이루어집니다 그것은 지금 훈련입니다

그래서 지금 우리는 컴퓨터 비전 부품의 종류가 내가 함께 해킹했다이 때문에, 다소 성가신이다 하지만 괜찮아요 그것은 지금 일어나고 그래서 우리는 화면의 라이브 피드의 우리의 종류가있다 그리고 이것은 우리가 사물의 사진을 촬영할 수 있습니다 그래서 실제 스크린 샷 소프트웨어가 즉, 즉 이것보다 쉽게 ​​사용할 수 있습니다 하지만 컴퓨터 비전의 아이디어를 소개하는 나를 위해 쉬운 방법이었다 특히

그래서 내가 할 수있는 것은 내가 모든 권리, 말의이 이모티콘을 끌어하도록 할 수있다 나는 그 이모티콘과 I의 사진을 먹고 싶어하기 때문에 내 컴퓨터가 이모티콘이 무엇인지 말해 싶습니다 그것은 긍정, 부정 또는 중립인가? 그리고 구글에 웃는 이모티콘을 말할 수있다 그리고 나는이 라이브를 수행 이유는 내가 당신에게 증명하는 것입니다 단지 기계에 하드 코딩하지 않았다 나는 그것이 올바른받지 않습니다 거라 확신

그러나, 명성을 수행합니다 그래서 우리는이 이모티콘이있다 그리고 당신은 바로 여기 위에 우리의 피드에 팝업 볼 수 있습니다 실제로 나는 시간의 무한한 수를 생각 팝업 당신이 좋아한다면 충분히 가까이 보인다 하지만 이유 나는 피드에 팝업이 내가 실제 공급을 통해 드래그 할 수 있으며 그 사진을 선택했다는 것이다

그리고 그것은 그 사진을 촬영합니다 아, 내가 잘 한 것을 가지고 너무 흥분 해요 즉 점등시킵니다 그래서 당신은 실제 터미널 출력 것을 알 수 있습니다, 그것은 나에게 일이있는에 정확하다고 확률했다 포지티브 또는 네거티브 또는 중성 나는 그것이 바로 정말 높은 확률로 그것을 가지고하는 것이 정말 흥분 해요 당신은 70 %의 확률과 같은 위의 경우 레이블 충분히 좋은 번호를 가지고, 당신은 꽤 흥분해야한다

이 94 %의 확률로 멀리있어 사실, 그것은 아마 추측했다 그것은 유아 나처럼, 그 하나의이 작은 아이처럼입니다 그리고 그들은 올바른 될 일이 그래, 난 그렇게 똑똑처럼 그리고 그들은입니다 이 기계처럼, 정말 위대한 아니다

그러나 신용과에 세미나의 신용이다 우리는 내가 아주 작은 데이터를 처리 한 바보 같은 기계를 가지고 나는 우리 모두의 앞에 사분 등의 총 훈련을했습니다 그리고 그것이 바로 얻었다 물건을 알아낼 수 있었다 이 패턴을 알아 냈다 그리고 그것은 또한 약간 부정적 수도 있다고 말했다

그리고 당신은 공유하는 몇 가지 속성이 있다는 것을 알 수 있습니다 웃는 얼굴과 찡그린 얼굴들 그들은 둘 다 눈이 특히 그림 이모티콘에 꽤 표준입니다 그들은 같은 거친 형상을 갖는다 그들은 같은 색상입니다 그리고 그들은 종류의 미소 또는 빈축 동일한 폭을해야합니까 심지어 서로 다른 방향에서 비록

그래서 기계는 끔찍한 일을하지 않았다 그리고 견과류의 종류입니다 그리고 잘하면 그게 액세스 할 수 있는지 작은 방법 적어도 증명 쉽게 할 수 있습니다 당신은 거기 앉아서 코드로 수리를해야 할 수도 있습니다 하지만 당신은 코드 땜질 거기에 앉아하지 않는 경우 당신은 정말 코딩? 당신이 거기에 앉아 일을 디버깅하지 않는 경우, 당신은 왜 여기? 그래서 디버깅 코딩의 좋은 금액입니다

그리고 이것은 단지 코드의 다른 부분처럼, 심지어 단지 프로그래밍을 시작한 사람에 의해 수행하고 디버깅 할 수 있습니다 당신은 아마도, 몇 시간이 수준에서이 작업을 수행 할 수 있습니다 며칠 당신은 조금 연구하고 말을해야 할 수도 있습니다 아, 쓰레기, 그것은 무엇 overfit을 의미 하는가 그 사람은 고양이와 삼각형에 대해 이야기 미친 친구, 무엇을 말 했는가 잠시 동안? 글쎄, 그건 괜찮아요 이것이 어떻게 작동하는지 때문이다

그러나 내가 말한 경우, 오, API를 사용하는 이동보다 더 어렵지 않다 나를위한 PUT 요청을 통해 일부 정보를 검색 할 수 있습니다 그냥 복잡한 소리로 그러나 그것은 모두 같은 생각입니다 당신은 앉아서 조금 그것을 배울 수있다 그리고이 경우, 당신은 꽤 괜찮은 예제를 가지고있다

그 전 – 그게 그 일한 행운의 종류이라고 강조 gonig하고있다 나는 그것의 매우 자랑스럽게 생각합니다

하지만 여전히 종류의 말도 그래서 우리가 이미 존재하는 모델을 개선하고 싶다고 가정 해 봅시다 그래서 많은 기계를 많이 쓴 나보다 똑똑한 사람들이있다 학습 알고리즘 나는보다 더 지능적인 사람들은, 내가 주장이있다 보다 작 이런 짓을했는지입니다 그래서 사실은 그 사전 교육을받은 모델 중 하나를 포함 내가 생각하기 때문에이 종류의 멋진 데모를하는

그래서 코드에서 실제로 당신이 그 사전 훈련 모델을 끌어 할 수있는 능력을 가지고있다 그것은 셉션 V3라고 나는 그들이 그 전화를 꽤 나쁜 엉덩이 생각합니다 다른 사람의 많은 그런 VGG16 물건 같다 그러나이 하나 인 셉션 V3라고합니다

나는 그 이름의 소리를 좋아한다 그래서 당신은 플래그, 사전 훈련 플래그이 프로그램을 실행할 수 있습니다 그것은 TensorFlow 모델이기 때문에 아직 말을 TensorFlow을 다시 가져옵니다 TensorFlow는 Keras의 기본 기계 학습 소프트웨어 인 또는 적어도 방법 나는 그것을 디자인하는 그것은 여전히이 경우에이없는 경우에도 데이터를로드 우리가 다른 데이터 조각을 찾으려고하기 때문이다

정말 모델을 저장하지 않습니다 그것은 조금 큰입니다 그러나 그렇게 같은 피드를 가져올 것 내 화면의 사진을 찍을 수있다 우리가하려고했던 그리고 기본적으로,이다 우리는 고양이의 사진, 특히이 고양이를 끌어 것입니다 난 정말이 고양이를 좋아한다

그것은 귀여운의 종류입니다 그래서 이것은 이집트 고양이입니다 내 마우스를 걸릴거야 그리고 제가하고 싶은 것은, 나는, 클릭을 통해 끌어거야 나는 그 고양이의 사진을 찍을거야 그리고 내가 할 수있는 것은, 그때 내가 말할 수있는 모든 권리입니다 의 내 컴퓨터는 그것이 말을 살펴 보자

주의 깊게 읽어 줄 테니한다면,이 다섯 개 레이블을 반환합니다 이 액세스 할 수있는 1,000 라벨이 실제로있다 그냥이 다섯 아니에요 난 그냥 상위 5 개를 골랐다 그리고 당신은 그 아래 하나가 동안 알 수 있습니다 가장 정확한 것이 아니다 잘못이 아닌 윈도우 화면,,, 근처에도 안

이 때문에 비율,하지 분수입니다 지금까지 가장 가까운 사람은 약 94 % 또는 동일한 정밀도로했다 내 다른 모델을 가지고있다 그리고 그것은 이집트의 고양이입니다 그리고 그 기계 학습의 강력한 부분 중 하나입니다 빨리 이전보다 더이었다이 모델이다 그리고 그것은 고양이의 단지 임의의 사진을 가지고 나는 94 %의 정확도로 올바른 인터넷을 고른 것이다

즉 너트입니다 난 그냥 무작위로 사진을 찍었 후를 포착하고 그것을 작동합니다 그리고 내가 강조하고 싶은 점은 정말 여기 인정 하듯이, 몇 분에 나는 잠시 동안이 수험 공부의 장점을 했어 당신은 여기 앉아서하는 알고리즘을 구축 할 수 꽤 정확하게 사물을 식별합니다 그래서 당신은 얼굴 인식 소프트웨어 알고리즘을 구축하기를 원한다면 그것은이 있습니다 이 같은 생각입니다

당신은 데이터를 변경합니다 그리고 당신은 당신의 모델을 약간 변경합니다 조금 더 똑똑합니다 특히 직면 것이 더 적합합니다 그러나 그것 뿐이다

그건 정말 여기에만 큰 차이입니다 이 개념이 유행어, 기계 학습, 컴퓨터 비전, 그들은 컴퓨터 과학 초보자로서 당신과 나에게로 접근 할 수있어 그들은 컴퓨터 과학의 년의 무리를 수행 한 사람에게 그대로 어쩌면 컴퓨터 마법사입니다 어쩌면 그들은 그것으로 쿨러 물건을 할 수 있습니다 그들은 API와 다른 약어 무서운 소리가 나는 단어의 모든 종류를 넣을 수 있습니다 그 뒤에 그것은 아래 같은 일입니다

기계가 작동합니다 그것은 모든 단지 결정적으로, 일하고있어 잘하면 당신이 그것을 원하는 방식으로 내가 생각하기 때문에 그래서 우리는 코드를 모든 조금있어 것을 그 가치있는 노력이다 이것은 또한 당신이있어 무엇 이사 확인할 수 있습니다 최악의 방법처럼 이 정당의 같은 느낌 때문에하지만 같은 시간에 이야기하고있다 난 비주얼 스튜디오의 코드를 사용합니다 그리고 난 정말 말도 열린 같은 것을하지 않아도 바랍니다

우리는 단지 그것을 조금 확장 읽기 쉽게 만들 것입니다 그래서 우리는 코드가 있습니다 그리고 이것은 보통 사람들이, 모든 권리와 같은있는 부분이다 지금은 밖으로입니다 우리는 거기에 도착, 우리는 완료됩니다 그리고 당신은 끝내하지 않은 경우

나는 수학이 당신을 멀리 무서워 한 것이라고 생각했을 것이다 그리고, 어떤 수학이 없다는 것을 보여준 이후 나는 당신이 여기 아직도 것으로 기대하고있다 그래서 우리는 꽤 임의의 파일을보고 여기 앉아있어, 그러나 이것은 실제로 ML 모델 파일입니다 그래서이 실제로 당신이나를 알려주는 파일입니다 실제 모델의 모든 속성에서의 코드가 이 모델의 저장 방법을 가지고있는 클래스이다

그것은을 구축하거나 데이터를 예측하는 부분이있다 그것은 모든 일을 가지고 당신은 어쩌면 수 우리는 단지 예제를 보여 무엇을 얻을 필요가있다 그래서 우리는 여기에서보고 제가 가지에 우리의주의를 환기 할 것 바로 근처에 있습니다 이 부분에서 찾고있다 이것은 꽤 많은 방금 본 모델의 대부분이다

이게 다예요 당신은 빈 줄을 계산하지 않으면, 코드의 단 5 줄의 내 마우스는 모든 것을 강조 그래서 아주 간단합니다 그것은 매우 간단합니다 이제, 이러한 용어가 많이 어쩌면 조금 더 복잡하다

맥스 밖으로 드롭 풀링 그리고 당신은 팬케이크처럼 평평 그리고 당신은 무언가의 밀도가 하나님이 무엇을 알고 할 당신은 그 활성화하지만 풀 크기는 여기있다 이 임의의 숫자가있다 나는 그것이 마법 생각합니다 난 이유를 모르겠어 그리고 그것은 매우 매우 빠르게 복잡해진다

그러나 다시, CS50에서와 문제 추천하기 추천, 정말 더 작은 조각으로 그것을 깰 의 코드의 어쩌면 가장 쉬운 부분부터 시작하자 here– 단조롭게 하다 이 인수가 없습니다 그래서 우리가해야 할 일을했을 모두 펼치기를 추가했다 그리고 어쩌면 쉽게 왜 우리는 모델 일을 추가한다

이 모델은 어떻게 작동합니까? 당신은 레이어의 스택 등 생각할 수 있습니다 그리고 당신은 당신의 스택 지향 방법에 따라 입력을 받아, 하지 리터럴 물리적 스택 같이 누적 데이터 구조 당신은 하나의 입력을 삭제하고 또는 당신이 그들을 참을 수있어 하지만 어느 쪽이든 그것은 스택을 통해 것입니다 그리고, 그 첫 번째 레이어는 입력에 소요 그것은 말한다 좋아, 우리는 그와 방울과 마법을 할거야 다음 층으로 그리고 그 같은 일을한다 이 다음 위치에있는 마지막 하나 같은

그리고 마지막 하나는 내가 그것이 무엇인지 말한다 그것은 삼각형입니다 그리고 그것은 당신에게 그 번호를 던졌습니다 그리고이 모든 정말 수행합니다 이 데이터 포인트에 소요 그들과 함께 물건을 수행 수학의 단지 무리입니다

우리가 그들을 추가하는 이유는 그래서입니다 그리고 순서는 우리는 그들이 스택의 순서를 변경 추가 할 수 있습니다 그리고 너무 나쁘지 않다 그러나 우리가이 이상한 단어가, 최대 풀링처럼, 중퇴, 평평 치밀한 그리고 그 당신이 하나 생각으로 이해하기 어려운되지 않습니다

이 인수를하지 않기 때문에 우리는 평평하게 시작하는 것입니다 그러나 거기에서 이동하기 매우 쉬운 것입니다 그래서 평탄화 층을 추가,이 조금 말도 보일 수 있습니다 심지어 불필요하게 보일 수 있습니다 당신이 그림을보고하는 경우 그러나 그림은 데이터의 모든 종류를 캡처 점과, 어쩌면 X 길다 넓은 X, 그리고 어느 정도의 두께 우리는 정말로 유일한 폭과 높이에 대해 걱정할 필요가

그리고 수 아마 어떻게 든 정보의 다른 모든 부분 이 같이 뻗게하지 않고 인코딩 될 수있다 처럼의 그 밖으로 스트레칭 가정 해 봅시다 것은 색상, R, G 및 B입니다 그래서 우리는이 사각형의 종류에 배치의 우리의 이미지 종류의 경우에도, 그것에 깊이의 약 3 층이있다 많은 빨간색 픽셀에 얼마나 첫 번째 계층은 어떻게 녹색 많은, 다음 방법 파란색 많이 그러나 우리는 정말 무엇을 상관하지 않는 경우 또는 우리는 어떻게 든 데이터를 인코딩 할 수 있습니다 다른 방법은? 그런 다음 우리는 사진을 평평하게 할 수 말하자면, 당신 손 두 차원 일 대신의 3 차원 하나

그리고 당신은 동일하지만, 복용이 차원 일을 할 수있는 경우 그리고 라인에 그것을 무너 다시 평평 것이다 그리고이 개념은 정말 어려운 일이 아니다 실제로 우리가 어차피 할 일입니다 이미지를 분석하고 싶었 경우 당신이 정말로 색에 대해 관심이 없었어요, 예를 들어, 당신은 그것을 평평가 흑백으로 만들 수 있습니다 이제 이미지를 평평하게했습니다

그래서이,하지만 그것은 조금 이상하거나 이상하게 말로 수 있습니다 우리가 실제로 너무 익숙하지 않은 일을한다 다음 쉬운 일이 아마 드롭 아웃됩니다 그리고 이것은 우리가 이미 본 적이 뭔가 역할을한다 이것은 기본적으로 overfitting의 역할을한다 그래서 우리는 이전에이 용어에 대해 이야기했습니다

우리는 유아에게 사실의 무리를 가르쳤다 그리고 그 아이가 그 사실을 알고있다 그것은 브라키 오 사우루스가 무엇인지 알고있다 이게 다예요 그래서 지금 우리가 원하는 우리의 모델에해야 할 일 우리의 모델은 그렇게되지 않았는지 확인합니다

그냥 대답은, 다음 대답은, 않을거야 (B)이며, 다음 하나 등등 C 및이다 우리는 우리의 모델이 아니라, 패턴을 픽업하고 싶은 말 그 패턴이 작동하는 방식에 따라, 그것은이 있어야합니다 즉 더 나은 모델이다 그리고이 경우, 우리가 우리가 드롭 아웃을 소개합니다 그리고 당신은뿐만 가끔 그 생각할 수있는 우리는 단지 종류의 무작위로 일부 데이터를 쫓아있다

그것은 가정으로, 50 %의 확률로합니다 분수 그래서 얼마나 많은 데이터를 말하고있다 아닌 확률을 쫓아합니다 내 실수 이것은 실제로의 데이터의 일부분이다 될 것 종류의이 층에서, 주어진 섹션에 떨어졌다 그래서 어떤 레이어 말하는 것은, 같은 모든 권리입니다 우리는 가끔 사람의 단지 종류의거야 데이터의 조각을 선택하지

그리고 우리는 이동 및 다른 일을 할 것입니다 그리고 그 방법으로, 우리는 매일 시간을 설정 같은 데이터를 제공하지 않습니다 우리는 조금 덜을 제공합니다 우리는 여기에 당신이에서 선택받을 데이터의, 모든 권리를 말한다 우리는 실제로 단지 당신이 많은 손을 것입니다

여기 당신은 간다 그리고 그 주위 오는 다음 번에 다른 부분 집합 일 수 있습니다 어쩌면 내가 당신에게이 부분 집합 대신 이전을 손 수 있습니다 그리고 그 방법으로, 우리는도 overfitting을 방지 할 수 있습니다 이제 데이터의 50 %는 꽤 높은 모든 시간을 중퇴하고

그래서 나는 여기에 전투의 종류에 도입했습니다 우리가 경우에 발생합니다 overfitting 분의 몇 배의 뭔가 수백 훈련 그러나 당신은 낮은 무슨 일이 일어나는지 볼 수 있었다 아마 훈련 데이터의 종류에 아주, 아주 좋은거야 그러나 실제 검증이나 테스트 데이터를 아주 나쁜 수 있습니다 그래서 어쩌면 적합하지 않습니다

그러나 당신은 또한 너무 많은이 결코 증가 할 수 없었다 학습 데이터에 잘 도착하고 잘 테스트 데이터는 소송을 따릅니다 그리고 그 중 하나가 적합하지 않습니다 그래서 포기하고 여기에 걸릴 어떤 종류가있다 당신은 그것으로 주위를 혼란에 약간 않아도됩니다 당신이 맞는 볼 그리고 당신은 더 많은 이들 층의 더 적은을 추가 할 수 있습니다

당신은 일해야하는 몇 가지 차원이 있다는 사실을 알게 될 것입니다 예를 들어, 평탄화 층을 제거있어 경우, Keras 그냥 내가 무슨 일이 일어나고 있는지 이해가 안처럼 될 것입니다 그리고 그것은 종류의 당신을 흥분 수 있습니다 당신이 맞는 볼하지만 그 이외의, 당신이 더 많거나 적은 비용으로 주위를 재생할 수 있습니다 중요한 일의 다른 종류의 우리가 최대 풀링 2D로 가기 전에이 조밀하다

그리고 밀도가 약간의 활성화를 가지고있다 당신은 무게의 일부 유통 것으로 조밀 상상한다면 그들이 호출하거나 컴퓨터를 말할 수있는 것입니다 무엇을 이 만드는 결정의 값은, 그래서 당신을 말한다면 당신은 만지는 것을 난로는 100의 값을 가지고 있으며, 당신은 접촉 지상 40 같은 값을 가지고 있으며, 당신은 당신의 자신의 피부가 접촉 0 등의 값이, 당신은 아주 쉽게 알 수 있습니다 어디에서 내 가치 체계가 것입니다 어느 쪽이 더 위험하다 그리고 가치 체계의 종류, 여기 놀이에있다 하지만 활성화는 우리가를 원하는 수행하는 방법을 잘 알려줍니다 어느 정도 사전 체중 가지의 종류 그리고 [들리지] 단지 사람들이 이미지를 사용하는 공통의 하나가 발생합니다

그들의 무리가있다 당신이 그들을 찾아 볼 무료입니다 Keras 그들의 톤과 내장에 온다 소프트 맥스와 같은있다 10H가있다

다른 사람의 모든 종류가있다 그리고 그들은 모든 것을 변화하는 것을 의미한다 그것은 매우 기술이 될 수 있습니다 가끔은 그냥 그들과 함께 놀러와 사람이 더 잘 작동 확인할 수 있습니다 당신은 매번 동안 그들을 교환하고 그것을 시도 할 수 있습니다

어느 작품? 어느하지 않습니다? 그리고 당신은 종종 [들리지 즉 이미지와 특히 잘 작동 찾을 수 있습니다 바로 아래의 수학 때문이다 당신이 수학에 관심이 있다면, 나중에 나에게 이야기 주시기 바랍니다 당신이하지 않으면, 우리는 단지 가지 떠날거야 그것이에게 그 결정의 가치를 알려주는 활성화있다 그리고 그 결정의 시작 값입니다 나중에, 그 자체-가중치를 다시

그것은 오, 그래, 아니, 그 나쁜 결정이었다 말했다 우리는을 rechanging하고 있습니다 그리고 조밀이 레이어에 추가되는 실제 것입니다 즉,이 레이어의 이름입니다 그리고 자신의 조밀 정말 그냥, 말하고 헤이, 우리는 노드 또는 뉴런이 될 것입니다

우리는 특히 그 중 16이 될 것입니다 그리고 우리는 그들 모두 서로 통신 할 수있는 것입니다 그리고 무엇 그건 그냥라고하는 것은 내가 결정을 내릴 경우입니다, 나는 그건 내 주위 모든 사람을 말할거야 결정은 내가 만든 나쁜했다 그 하나를 수행하지 마십시오 그 끔찍한 결정이었다

그것은 당신이 하룻밤 물에 조금 너무 취 경우처럼 그리고 당신은 바로 다음 날 봐, 같은 사람 나쁜 계획을 모든 사람에게 주위를 이동합니다 그렇게하지 마십시오 당신은 결정을하지 마십시오 그 취급의 아주 쉬운 방법 그리고 그 계층에서 당신은 신경 세포의 무리가 모두 서로 이야기합니다

그리고 어떤 사람들의 즉각적인 해결책은 그냥 더 신경을 추가 할 수도 있습니다 때때로 때로는 없습니다 그리고 당신은 훨씬 느린 컴퓨터를 만드는 것을 알 수 있습니다 그래서 항상 트레이드 오프가있다

그리고 우리는 우리의 최대 풀링 2D를 가지고있는 당신이 아래에 무슨 일이 일어나고 있는지 알고 있다면 꽤 직관적으로 지정됩니다 그렇게하지 않으면, 그것은 단지 무엇 퍼지 같다 그래서 우리는 여기에 무슨 끝나는 것을 나는 그것을 풀 크기를 준 것입니다 나는 2 2 말했다 그래서 당신은 당신의 이미지 상상 경우 픽셀의 부분, 네가 기본적으로 사각형처럼 2로 2가 이미지를 가로 질러 슬라이딩 그 화소

그리고 정말 내가 여기서 뭐하고있어 내가 가지 모두 함께 풀링하고있어한다 및 최대를 복용 이게 다예요 그리고 그 최대를 복용하고 아마 것을 말하는거야 일을 결정하는 기능입니다 그리고 이미지에서, 그것은 때때로 경우가 있습니다 특히 이미지의 이런 종류의, 꽤 잘 작동합니다

분 풀링도 있습니다 당신은 최소 걸릴 즉 중요한 사람입니다 즉 특히 관련이있을 경우가 있습니다 당신은 이미지의 부정적인보고있는 어떤 경우? 어쩌면 여기에 적용됩니다

아마하지 않습니다 그래서 그 마음에 계속 뭔가 또한, 저는 믿습니다, 평균 풀링이있다 그것은 Keras의 평균 풀링 호출 할 수 있습니다 그러나, 당신은 단지 생각하는 것과 같은 일을 소요, 그 평균이하고 잘 지내 있다고한다

당신이 적절하다고 생각한다면 풀의 크기를 변경할 수 있습니다 2에 의한 2, 우리는 정말 그래, 말을하지 않기 때문에 여기에 꽤 피팅 이 모든 것은, 당신은 단지 거기에 가장 큰 지점을 가지고가는 경우에, 그게 행복 아닌지 여부를 결정합니다 이게 다예요 그것은 매우 정확하지 않습니다 우리는 멀리 얻을 수 없을 것입니다

그래서 우리는 우리의 데이터 조금 응축하는 데 도움이됩니다 우리는 종류의 단지 우리가보고있는 정보를 가지고 그리고 보풀의 일부를 밖으로 던져 그리고 당신이 몇 번 않습니다 그리고 마지막에 우리는 우리의 출력을 뱉어 있도록 매우 국소 개요 종류의 기계 학습에있다 생각에 잘하면 소개 그것은 구체적으로, CS50에 대한 최종 프로젝트로 액세스 할 수 있는지

그러나 심지어 현실 세계의 종류, CS50의 외부 클래스의 외부, 당신이 주변에 수리를 원하는 경우 그 완전히 당신의 능력에 있습니다 그리고 내 말은 당신하지 CS의 년을했다 사람으로 지금은 과정을 가르치고있다,하지만 사람 모두 시작하거나 더 나쁜 경우 누가 시작했다 나는이의 경험이 시작 내가 갔던 곳이었다 이것은 내가 선택한 방향이었다 그리고 그것은 완전히 접근 할 수 있습니다

당신은 그렇게 할 수 있습니다 그게 당신의 손안에 완전히이다 당신이 모든 관심에 있다면 그래서, 나는 그것을 추구에게 추천 할 것입니다 당신은 어렵다는 것을 확인할 수 있습니다 그것은 실망입니다 점이있다

그러나 당신이 CS에서 어떻게 할 건데 아무것도의 경우입니다 그들이 어려울 것이다 지점이있다, 어디 실망 할 것이다 그래서 나는 포기하지하는 것이 좋습니다 것보다는 생각 것을 그 기본적 권리 경로입니다 당신은 거리를 것입니다 계속해

당신 때문에 수도뿐만 아니라, 당신이 어떤 프로젝트에이 작업을 수행하려고하는 경우, 관심있는 일에 그것을한다 그리고보다 구체적 지시 충고의의 CS50에 대한 최종 프로젝트에서 3 주 동안 당신의 시간을 낭비하지 마십시오 멋진 무언가를 구축 할 수 있습니다 그것은 어려운 그것은 많은 시간을 소요하고는 디버그에 매우 성가신 경우 마지막 가능한 분까지 작동하지 않는 것을있다, 당신은 아마 바로 그 일을하고 있습니다

그게 바로 대해 아마 CS에서 가장 많은 작업이 가능한 마지막 순간에 발생합니다 내가 그것을 가지고, 당신은 같은거야 어디에 그 순간이있다 그리고 당신은 좋은거야 우리의 많은 CS 아직 이유 구호의 의미이며, 우리는 우리가 제작 한 것이 만족되는 느낌을 좋아합니다

혹시 CS 당신을 위해이 아니라고 생각하면 그래서 너무 어렵 기 때문에 모든 사람이하지만 당신을 얻을 것 때문에 또는, 그 100 %가 아닌 경우입니다 기계 학습은 어렵다 컴퓨터 비전은 어렵다 컴퓨터 과학은 어렵다 학습 어렵다

이 모든 것은, 우리는 할 수 있습니다 그래서 나는 그것을 추구 항상 추천 할 것입니다 기계 학습, 컴퓨터에 대한 너희들이 몇 가지 질문은 무엇입니까 시력? 나는 내 마지막처럼 칠 정도 분 그림 나는거야 질문에 엽니 다 확실한 스피커 2 : 당신은 아마 말할 수 있는지 궁금 해서요 최소 및 최대 풀링 풀링하고, 경우 (2) 2를 사용하는 방법에 대한

마찬가지로 100 100처럼 사용하는 거라고 어떤 상황은 무엇인가 또는 [들리지] SPEAKER 1 : 나는 풀까지 모든 이미지에 정말 아니에요, 상상할 수있다 하지만 어쩌면 나는 귀엽다 여기에 고양이를 유지할 수 있습니다 그래서 본 이미지는 픽셀들의 세트 량을 갖는다 그래서 분 풀링을 의미 대 풀링 최대 대 풀링 이유있는 질문 그것은 다른 풀 크기를 가지고 무엇을 의미 하는가 왜 정말 관련이? 그래서 우리는 귀여운 때문에, 특히이 이미지에 대해 이야기 할 것입니다

그리고 나는 갈색 또는 붉은 생각합니다 난 정말 말할 수 없습니다 그러나 이집트의 고양이 그리고 그들은 아름다운이 넓은 눈과 큰 귀처럼 그들은 최고입니다 그리고 기본적으로이 이미지는 픽셀의 수를 설정하고있다

나는 일부 픽셀 수에 그것을 표시하고있어 비록, 그 자체가 이미지가, 안 400 (200)을 수행의 말을 보자 아주 잘하지만 충분히 가까이하지 않습니다 A는 주어진에 인 경우에 그래서 (200)에 의해 (400)는, 다음, 우리는 20 박스 (20)과 같이 말할 것이다 우리는 너무 많은 데이터를 얻을 수 있습니다 의 20에 의해, 즉 귀 일각 (20)를 가정 해 봅시다 글쎄, 난 그 단지 최대를 취할 경우 나는 20의 최대를 할 경우, 실제 (20) (20)에 의해 부분으로 생각할 수 20, 또한,이 귀 전체 팁은 하나 개의 포인트가된다

나는 귀 끝 하나 개의 데이터 포인트가 있습니다 그리고 같은 일 우리는 전체 이미지를 반복한다 그래야이 이미지는 상당히 응축됩니다 가 (200)에 의해 400 인 경우, 물론 당신은 생각할 수 있습니다 지금처럼 적합 할 수 있습니다 (20)의 비율로 감소된다 어쩌면 당신이 정말로 걱정하는 모든 일반적인 모양이다

그것은 고양이가 아니면 손잡이인가? 즉 구축 할 수있는 아주 쉽게 분류합니다 정말 걱정해야하는 것은 좋지 원이 아닌 손잡이, 그것을이다 하지만 어쩌면 문 손잡이의 클래스가 다르다 그것은 거기에서 더 복잡 얻을 수 있습니다 그러나이 경우, 당신은 아마 사용할 것 세부에게 아주 작은 풀을 유지한다

우리는 우리의 이미지를 조금 응축 위해 노력하고 있습니다 우리는 보풀의 일부, 소음의 일부를 제거하기 위해 노력하고 있습니다 마찬가지로 여기에 몇 가지 모피가있다 하지만 정말 실제로 무엇을 그 모피를 중요하지 않습니다 당신은 매우 특별한 기계를 찾고하지 않는 한, 않습니다 분류하는 경우에 당신은 아마보고하지 않을 전체 동물의 사진에서 우리가보고있는 경우 그래서, 그것은, 음, 개 대 고양이 모피의 반점이 여기가 있다면 정말 문제가 않습니다 또는 일부 추가 노이즈가 사진을 찍었 카메라에 의해 포착? 정말

그래서 우리는 그냥 가지 위에 그 평균을 무시할 수 있습니다 아니면 이상 최대 풀링을 사용하고 당신, 말 우리는 우리의 모든 세부 사항을 풀거야 알고, 모든 가장 큰 자세한 내용은 함께 즉,이 경우에 해당 될 수 있습니다 동안,이 그림은 무엇 이었습니까 경우 200 만 픽셀 400 만 화소? 이제 풀 크기는 많이 확장 할 수도 있습니다 우리는 여분의 모든 정보가 필요하지 않습니다 특히이 같은 사진의 경우 우리는 당신이, 우리가 그것을 줄이기 위해거야 알고, 말할 수 같은 백만 배

그리고 지금 당신은 너무 작은 수 있습니다 2로 4를 가지고있다 지금 당신은 기본적으로 그냥 네 개의 픽셀 아래로 두 걸쳐있어 희망 그것은 여전히 ​​고양이입니다 하지만 당신은 그와 함께 주위를 재생할 수 있습니다 그리고 그 사건이 될 수있는 당신이하고자에서 당신도 A 최소 또는 최대 또는 일을하는지 여부를 변경해야 당신이 이미지를 분석하고 방법에 대해 설명합니다 그것은 단지 하나의 이미지를 가지고이 작업을 수행하는 것이 적절하다? 또는 데이터에 하나의 이미지 만 추가 설정 (150) 150처럼 나머지 모든 후 크고입니까? 그럼 당신은 그것을 변경할 수 있습니다

스피커 3 : [들리지] 당신이 경우처럼 같은 , 400 만 화소 긴 같은 말을했다 하나 개의 이미지를했다 아마 사전 처리 한 후 더 나을 당신이 가기 전에 데이터, [들리지] 크기 특정 값 [들리지] 좋아한다 SPEAKER 1 : 예 실제로 샘플 코드가 약간있다 그냥 가져 있었는지 약간의가있다, 화상의 전처리는이다 그것은, 사람들이 거기에 던질 것이다 재미 작은 단어의 또 다른 종류의 당신이 그들을 사용하기 전에 바로 오처럼, 그래, 이미지를 사전에 처리합니다

그리고 그들은 돌아 그냥 무시처럼 그들은 단지 당신에 전부 떨어졌다 사전 처리는 정말 기본적으로 무슨 일이 방금 언급 한 것입니다 당신이 당신의 이미지를 가지고 가지 그들에게 조금을 정상화 할 것입니다 당신은 400 만있어 데이터 세트에서이 아웃 라이어를하고 싶지 않아 2 백만으로 할 때 100 같은에서의 나머지 당신이 그들을 확장, 사람들을 어쩌면 그 크기를 조정하려면 아래 적절한 방법을 사용 그리고 그 방법은 데이터에 따라 변경 될 수 있습니다 어떤 당신은보고 또는 당신이 그것을 수행하는 방법에 따라하고 하지만 그들에 걸쳐 정상화 할 수있는 것은 전처리의 일종 될 것이다

당신이 생각하는 경우 처리 부분이기 때문에 그리고 그것은 전처리라고 당신의 기계 학습 알고리즘으로 던지고, 이 beforehand– 전처리을한다 그 용어가 가지 들어오는 곳 그리고 그입니다 그리고 특히 이미지가 많이 온다 이미지는 사람들에 의해 사용되는 카메라로 촬영 할 수 있기 때문에 사람들이 꽤 확률이다 나는 같은 사진 400 시간이 걸릴 수 있습니다 그것은마다 다를 수 있습니다 그리고 그 사람들이 사진을 찍는 방법에 문제의 종류, 특히이다 실제 시나리오에 어디를 적용하고 살아있는 동물의 사진이나 사람의 얼굴의 어떤 종류에 그런거나하는 것들

당신은 아마 그들이있어 수 있도록 사전 처리에 이미지를 방법을 찾아야 할 것 대략 적당한 크기 및 줄거나 걸 대략 옳은 일을 찾고 어쩌면 사람의 얼굴의 사진은 여기에서 밖으로 모든 방법을 확대한다 어쩌면 다른 모든 사람의 사진이 매우 가까이와 같은 확대 된 그래서 당신은 자신의 얼굴을 가지고있다 하버드 IT는 사용자를 식별하는 데 그 사용합니다 그것은 단지 당신의 얼굴입니다 그래서 그들은 당신을 가지고 모든 이미지를 사전 처리 그들은 당신을 식별 할 수 있습니다 그리고 그 기계 학습에 많이 오는 무언가이다

이 프로젝트의 일부입니다 그리고 나는 시간 중 약 괜찮아 생각하지만, 나는거야 질문에 대한 이후 주위를 어슬렁합니다 그러나 지금까지 실시간 스트리밍이가는대로, 시청 해 주셔서 감사합니다 난 내 자신의 일을하고 캠퍼스의 종류에 수 있습니다 하지만 난 정말 당신이 모든 방법에 걸려 감사 맨 마지막에 이상한 고양이 사진을 통해

그래서 대단히 감사합니다 너희들을 보여 주셔서 감사합니다

How Machine Learning is Changing the @NBA with Computer Vision @SecondSpectrum #DataTalk

– 안녕하세요 Experian의의 주간 데이터 토크에 오신 것을 환영합니다, 똑똑한 사람들의 일부를 특징으로 쇼 데이터 과학에서 작업 오늘 우리는 제나 호수와 이야기 된 것을 기쁘게 생각합니다 누가 컴퓨터와 비전 엔지니어 이상의 두 번째 스펙트럼에서

제나는 과학 학위의 그녀의 석사 학위를 취득 카네기 멜론 대학에서 컴퓨터 비전에 및 컴퓨터 과학 학사 과학의 정도 웨스트 버지니아 대학의 생체 인식 시스템이다 제나는, 우리의 쇼 오늘의 참여 해주셔서 너무 감사합니다 – 초대해 주셔서 감사합니다 – 내가 제나 궁금해, 나는 항상 우리의 손님에게 그들의 여행에 대해 조금 공유 할 수 있습니다 데이터 과학으로 당신을 이끌어 무엇을 특히 컴퓨터 비전? – 음, 나를 위해 내가 정말 있었다 힘든 시간을 선택

나는 코드를 작성하는 사랑 과 어디 플래시 내장 간단한 소프트웨어를 작성 내 전공 중 하나로서 생체 인식 시스템이기 때문에, 실제로 이미지 프로세싱을 많이 할 수 있었다 내가 졸업 할 때 다음, 나는 충분히 운이 좋았다 나는 매우 지원을 가진 회사와 함께 작동하도록 보스 정말 많은 컴퓨터 비전으로 나를 밀어 그 많은 데이터 처리 기술하고 있었다 로 이끄는 정말 좋은 경험 내 석사 학위를 받고 – 그게 최고입니다 고등학교에있을 때, 당신은 항상 수학에 정말 관심 과 과학? 그것은 거의 초점이 되었습니까? (웃음) – 네 내 고등학교에서 수학 한 사회의 설립자 (웃음) 나는 역사에 끔찍 했어요

– 그것은 좀 조금 절단있어, 제나, 하지만 난 당신의 입술을 읽으려고합니다 (웃음) 당신이 정말로 정말로 즐겼다 ​​것처럼 소리 수학 및 고등학교 과학 당신은시 또는 인문학에 대해 뭔가를했다? – 나는 역사에서 정말 나쁜입니다 – 오, 역사, 좋아 참조, 나는 반대했다

내가 읽고 사랑하고 내가 글을 사랑하고 내가 고등학교 때 나는 수학에서 떨어져 있었다 (웃음) 나는 정반대였다 내가 대학에 갔을 때, 나는 영어를 전공했다 나는 멀리 엔지니어링에서 머물렀다 나는 하나 개의 컴퓨터 과학 클래스처럼했다

이 같은 1999 년에 다시, 그래서 그것은 같았다 C ++ 기본 시각 및 나는 지금 누구를위한 큰 존경을 가지고 컴퓨터 과학 (웃음) 그 하나 개의 클래스 후 제나, 컴퓨터 비전 요즘 정말 뜨거운 주제입니다 난 그냥 구글 렌즈에 대해 읽고 있었다 지금은 사람들이 사진을 찍을 수 있도록 허용 객체와 AI의 식별 할 수있을 것입니다 어떤 객체 것은 꽃의 종류와 같은 것입니다 일어나고있는 정말 멋진 일이 많이있다 컴퓨터 비전이다 내가 당신이하고있는 일에 대해 좋아하는 것은 당신은 컴퓨터 비전을 사용하여 정말 활성있어 스포츠 분석에 도움이됩니다

당신이 주식의 종류 수 있을지 궁금하네요 어떻게 도움이있어 컴퓨터에 대해 조금 농구와 NBA를 이해합니다 – 네, 잘 실제로 정말 흥미 롭군요 그것은 단지 (궁시렁)입니다 우리는 다른 이미지의 무리에 걸릴 그리고 우리는 선수들에게 시도하고 볼이 착용 플레이어의 끝에서 여기하면 농구의 3D의 모든 프레임에 대해 다음 우리가 할 수있는 완전히 별도의 팀을 보유하고 있습니다 또한보고 가서이 무엇을 의미합니까라고? 농구 여기 때 그것은 무엇을 의미 하는가 어쩌면 반대 팀은 가까운 거리에 있습니다

우리는 공격 또는 수비가 있습니까 그 일이야? 그리고 그것은 매우 흥미로운 일이, 정말 이것은 일반적으로 행해졌 무언가 때문에 매우 수동 방식으로, 사람들은 다시 시계를 것입니다, 재 시계, 다시 시계 – 시계 다시 있다 당신은 사물 이러한 유형의 작업을 수행하려는 경우 방식에 매우 편리합니다 전체 경기를 시청하지 마세요, 여기 당신이 원하는 소개 및 비트 당신은 어떤 의견을 듣고 있습니까? – 네, 몇 가지 의견을 듣고 있어요

나는 일부 오디오 문제가 있습니다 당신이 말하는 된 원인 나는 '아웃 얻어 먹게 느낌 (웃음) 뭔가 정말 매력적이었고, 난 그 지금 비트와 조각을 잡기 나는 당신이했다 말을 듣지 않았다 무엇 과거에, 그것은 항상 어떻게 어떻게 다시 관찰 같은 비디오 영상을 계속해서 또 다시 확실히 영화를 보았다, '나는 스포츠에 참여 적이 없습니다 원인 그래서 나는 단지 그것을 어떤 건지 상상 탈의실 내부 있지만 (웃음) 그래서 나는 그들의 팀과 감독의 영화를 볼 때 또 다시 연극을 다시보고, 이제 컴퓨터를 가르침으로써 그 과정을 돕는 것 선수들 사이의 관계를 이해하고, 공, 무슨 일 이죠? – 정확히 우리는 선물 어쩌면 당신은

이 선수가 얼마나 말했다 이러한 다른 사람들과이 위치에, 당신은 할 수 매와 매보고 에있다, 대신 당신은 말할 수 나는이 사람이 방어적인 움직임을보고 싶다 내가보고 싶은 것은 법원에이 사람이다 가장 효과적인 및지도에서, 법원에이 선수의 말 그는 오른쪽보다 왼쪽으로 성공적인 이상이다 아니면 그가 함께 작동하는 경우 더 성공적이다 이 사람이나 그 사람 그것은 매우 흥미로운 종류의 이 코치에 대한 더 많은 데이터를 노출시키는 방법 그들도 더 자세히 이해하기 위해 무슨 일이야 – 네, 그래서 실제로 그것을이다 당신이 검토하고있는 데이터의 일부는 방법입니다 플레이어는 다른 플레이어와 상호 작용? – 모든 플레이어가이다 음, 우리는 알고있다 볼이 어디 3D의 모든 프레임에, 우리는 알고있다

우리의 출력 부족 그래서 우리는 말할 수있다 우리가 주석을 달 수 있습니다 여기에 좌표는 그 위에, 우리는 심지어을 당길 수 이런 일을 정확한 타임 스탬프, 그런 다음 쿼리와 함께 그 넣어 말할 수 있습니다 이것은이 내 심층적이며, 무슨 일이 일어나고있다 게임의 분석 그리고 정말 우리가해야 할 무엇을하려고 수 있습니다 코치는 가능한 한 빨리이 작업을 수행 할 수 있습니다 그냥 전원을 켜고 말을 할 수 있다면 우리는 그것을 사랑 아, 정말 흥미로운 것을, 나는 그것에 대해 생각하지 않았다 그냥 다시 볼을 NBA 시즌, 1000 경기 시즌이 있습니다

나는 부여, 의미, 그건 모든 팀하지만 때때로 당신은 어떻게 당신의 팀의 작품을 이해할 수있다 또는 상대 그것은 단지를에 인간에 대한 데이터 만 많이 있어요 수동에 걸릴 – 네, 의심의 여지가, 그리고 내가 당신의 웹 사이트에서 읽을 생각하지 그 그것은 지금 NBA 팀의 세 번째 당신이 작업하고 있었다? – 우리는 실제로와 독점 계약을 체결 추적을위한 전체 NBA, 통계의 종류 당신은 볼 것이다 어쩌면 판타지 농구 사이트 또는 다른 사이트에, 그 우리에 의해 생성 된 것 – 오, 좋아, 아주 좋아 방법은 아주 멋진

– 또한, 우리는 소프트웨어를 코치하고있다 팀의 실제에 가입 뿐만 아니라 해당 소프트웨어의 프리미엄 수준입니다 – 그게 최고입니다 깊은 학습을 위해, 기계 학습, 당신은 훈련 많은 데이터를 필요로하고 내가 가지였다 농구 어떤 유형의 데이터에 대한 호기심 당신과 분석 당기는 것입니다 – 우리는 그 사실에 매우 운이 있었다 우리는 우리 자신의 카메라를 가지고, 그래서 우리는 우리가 원하는 것을 수집 할 수 있습니다 그러나, 우리는 동일한 데이터에 문제가 모든 사람들이 있습니다

라벨, 라벨, 라벨, 라벨 당신은 아무것도를 양성하려는 경우, 당신은 거기에 무슨 일이 일어나고 있는지 알 필요가있다 그것은 데이터의 엄청난 금액을 가지고 훌륭합니다, 하지만 하루의 끝에, 우리는 할 수 있어야합니다 그것의 의미를, 그리고 완전히 비효율적하기 말, 오 인간에 대한, 모든 단일 프레임 레이블을 모든 단일 플레이어, 공 그건 그냥 영원히 걸릴 것 그래서 당신은 정말 좋은 라인을 걸어야한다 나는, 기계 학습에서 거의 모든 사람을 생각 컴퓨터 비전은 지금 당장해야 이해하는 것입니다 나는 효과적인 방법으로 모델을 학습 할 수있는 방법 어떤 데이터가 어떤 데이터 또는으로 표현하기 위해 가장 중요하다 당신은 또한 표현하기를 원하기 때문에 효과적으로 일반적인 경우뿐만 아니라 가장자리의 경우

– 지금, 우리의 의견 중 하나는 막 들어왔다 왜 초점은 NBA에 있고 그 때문이다 농구는 우리가있어 시작됩니다 NBA에 대한 실제 흥분하지만, 분명히, 바로 당신이 농구를 넘어 팽창을하고있는 일? – 예 MLS의 일부 축구 팀 작업, 그래서 매우 흥분되고, 그리고 것 그것은 차이를보고 정말 흥미 롭군요 스포츠한다 그냥 농구 같은 매우 간단한 일, 당신은 실내에서 재생할 수 있습니다 MLS, 모든 야외 그래서 갑자기 지금 우리는 모든 것을 같이가 그것은 우리가 실내에서 더 이상 실험실 없다 날씨, 당신은 하루의 시간 이동을합니다

당신은 그냥 그렇게 다른 얼마나 상상할 수있다 하지만, 갑자기 당신은 그뿐만 아니라 사람들의 매우 다른 수 당신은 필드를 추적해야합니다 그것은 우리 그냥 아주 재미, 흥미 진진한 시간이다 – 네, 의심 할 여지없이, 그것은 정말 멋지다 없습니다 너희들은 축구의 분석, 국가 하키 리그을한다

이 양의 단지 놀라운 비디오 영상 너희들은 분석해야 당신이 당기는해야 센서 데이터 – 우리는 주로 프로 농구 (NBA)와 함께 작동 우리는뿐만 아니라 일부 MLS를합니까 그리고 그것은 때문에 때로는 정말 흥미 롭군요 나는 사람들과 얘기하고, 그들이 말하는 당신은 볼 수 있습니까? 나는, 물론, 같은했다 네,하지만 (웃음) 나는 매우 다른 방식으로 생각 그것을보고 (웃음) 누군가보다 – 그래, 내가 상상 그건 정말 재미 있어야합니다 당신과 함께 슈퍼 볼을보고 앉아, 당신은 아마 게임을 시청하고 있기 때문에 완전히 다른 방식이다 (웃음) – 그래, 그래

– 나는 모델의 정렬 대해 궁금 당신은 당신이 만들거나 모델 작동합니까 당신은 농구 선수를 식별 할 어떻게 그들이 수행하는거야? – 네, 그래서 우리는 다른 모델의 번호가 않습니다 물론 당신은 선수에 대한 모델이 필요합니다 우리는 다른 것을, 스포츠 매우 운이 좋다 야생에서, 사람들은 함께 유니폼을 착용 면들 자신의 그들에 이름은 서로 다른 색상과 번호입니다 그러나 그 자체가 자신의 문제를 가지고있다 당신이 상상할 수있는 동일한 두 가지가있는 경우 법원에 숫자, 즉 약간 다릅니다

또는 당신은 무엇을 가지 같은 모습 몇 가지 숫자가 있다면? 그것은, 그것은 누군가를 위해 열심히 우리를 위해 어렵다 컴퓨터뿐만 아니라 우리가보고있는 공을 모델 그리고,이 모든에서, 정말 하나 흥미로운 점을 생각한다 당신이 사람처럼 기분이 운동이 작업을 수행, 아무도 알 수없는 것입니다은 하프 타임에 당신은 잘 말 우리는 우리가이 있지만 대해 이야기 할 수 바랍니다, 통계, 그들은 또 다른 30 분 걸릴거야 그래서, 그것은 실용적 일 필요가있다 괜찮아 말을, 나는 이해할 수있다 어디이 개별 사용자의 각, 나는 그들이 누군지 알고 나는 볼이 어디 있는지 그것은 효율적인 방법으로 그렇게 할 것이다 실제로 소비 될 수 있도록 과에 법원 떨어져 두 사람에 의해 사용

아마 스포츠 방송 또는 어쩌면이다 , 당신은 그냥 집에 앉아있는 당신은 사람 아 같은거야 판타지 농구 시간 그것은 정말 열심히 도전하지만, 정말 흥분 하나 같은 시간에 – 그것은 코치 정말 흥분해야합니다 에서 뽑아 훨씬 더 많은 데이터를합니다 그들은 법원에보고있는 단지보다, 또는 그들이에있어 어디든지 – 내 생각 엔 우리가 사용하도록 설정하는 것입니다 자신의 작업의 일부입니다 자신의 작업의 재미있는 부분은 앉아서보고되지 동일 영상 릴 네번 자신의 흥미 진진한 것은 내가이 일이 벌어지고 참조, 아 – ​​하이다

아, 우리가 지금이 변경합니까, 또는 우리가이 개선 않습니다, 또는 나는이 선수 볼, 그는이 정말 열심히 촬영을하고있어 그리고 그는 시간의 일부를 성공입니다 그리고 어쩌면 다른 플레이어가, 그는 바로, 하루 종일 모든 정말 쉽게 사람을합니까? 어느 하나의 더 나은? 숫자들, 그리고 모든 시간, 그는 낫다 이 봐, 그 자격을 가지 지금 우리 팀에 더 중요한 무엇인지 또는 미래입니다 – 내가 제나 좀 궁금 해서요, 당신은 환상 농구를 재생? (웃음) – 바로 이거 야

– 당신이 지배 할 것 같은 느낌 (웃음) – 우리는 사무실에서 어떤 사람이 그것에 대해 매우 심각 브래킷은 매우 강렬하다 (웃음) – 당신에 대해 조금 공유 할 수 다른 방법이 NBA 코치 및 팀 실시간으로 데이터를 사용할 수있는, 하기 전, 후, 또는 게임 중? – 네, 그래서 (중얼 중얼) 나는 어떤 팀이 난거야 얼굴 매우 어려운 팀이야 그것은 목과 목이었다있다 당신은 플레이 오프에 대해 생각할 수있는, 그들은 어떻게 전략을 세울거야? 그래서, 당신이 할 수있는 한 가지는 당신이 준비 할 수있다 강점과 자신의 팀의 재능, 뿐만 아니라 팀으로서, 그리고 항상 볼 것이다 이전에 본 적이 게임, 우리가 붕괴 곳 오이입니다 이 곳에 우리가 정말 성공하고 그것은 정말 흥미로운 일이 다만 전략 수준

하지만 당신은 그보다 더 깊은 보면, 우리는 오른쪽 거래 및 자유 계약으로 얘기 할 수 있습니다 나는 많은 것들을 오프 시즌에서 일어난 알고 다음은이와 NBA와의 그들은 말을 장소에 도구를 가지고 나는이 내 팀이 무엇을 알고 그러나 이것은, 우리 팀이 무엇을 필요로하는지입니다 누가 그에있어 중요시하는 점은 무엇입니까? 나는, 그건 그냥 정말 재미있는 것 같아요 내가 비밀리에 희망 무언가가 있다는 것입니다 이런 일들은 누군가가 앉아 일이 발생할 때, , 컴퓨터를 가지고 우리의 소프트웨어를 쳐다 보면서 말했다 그건 좋은 사이트, 당신은 알고 있어요? 그게 정말 멋진 것 같아요 또 다른 정말 멋진 응용 프로그램 그것은 우리가 작업중인 선두에 가지입니다 우리가보고있는있다 가져 사람들에게 우리가하고 계획하는지, 이것은, 레코딩에 대해 이야기하고있다 스티브 발머에 의해 우리는 우리 모두가 서로 다른 요구 사항이 모두 다르다 우리는 스포츠를 볼 때

내가 운동을 확대 할 수있는 방법이 있나요 당신을 위해 그것을 더 즐겁게 이상합니다 방법이있다 그래서 우리는 모든 다른 방법으로보고있다 우리가 (궁시렁)이보기를 사용자 정의 할 수있는 방법 경험 아마 당신은 정말 당신의 친구를 감동 할 당신의 환상 농구 리그한다 우리는 우리 물건의 일부를 보여줄 수있는 방법이 있나요 당신과 당신이 말할 수있는에, 나는 새로운 오늘 뭔가를 배웠습니다 또는, 말하는 방법이 이? 그게 정말 흥미로운 것 같아요 지금 우리는 어쩌면 일주일 전에 시작하고 있습니다

– 네, 고급형이고 난 그냥 해요 미래에 대해 생각하는 방법 바로 작년에 우리는보고있다 가상 현실과 도약과 범위, 미래의 가능성이 스포츠 경기 관람 우리가 코트에있을 수있는 가상 현실, 가능한 데이터로 오버레이 다음 경기를보고 너희들은 우리가하고있는 플레이어를 통해 제공하는 관심, 그건 그냥 경이로운 것 실시간으로 그에 액세스 할 수 있습니다 이것은 사람을 위해 아주 아주 흥분되는 사람은 스포츠 팬, 또는 가상 현실로, 때문에 너희들이 실시간으로 제공하는 데이터 단지 매혹적인 확실히 도움이 될거야 그들의 결정을 내릴로 코치와 팀을 향상시킬 수 있습니다 의 일부를 무엇 나는 약 좀 궁금 해서요 당신이 지금주의 가장 큰 도전 컴퓨터 비전에서 일하는 사람들을 위해? – 내가 컴퓨터 비전에서 생각, 우리는 항상이 저주를 당신은 너무 많은 것들을 볼 수에 대한, 하지만, 우리가 천천히 앉을 수있는 및 우리는 지금 일어나는 모든 것을 볼 수 있었다 우리는이 정말 흥미로 올 수 분석 그러나 우리는 그것을 4 주를 기다릴 것입니다 그것은 당신이 좋아하고 있다면 당신이 필요로하는 무슨 있다면 다음 20 년 폭풍의 예측 당신은 사주를 절약 할 수 있습니다 그러나 나는 우리가이 모든으로 실행하고 생각 실제 성능 장벽

우리는 때문에,이 편리하게 이용할 수 있도록 어떻게 이 데이터에 올 때 나는 모든 것을 생각 그것에 유효 기간이있다 기업의 경우, 당신은 주식 거래와 작업을 같이한다면, 당신은 곧 무슨 일이 일어나고 있는지 알고 싶어 당신은 무슨 일이 일어나고 있는지 알고 싶지 않아 이 일어난 후 나는 군대에 대한 IED의 감지와 함께 작동하는 데 사용됩니다 아무도 그들이 IED를 달려 알고 싶어 그들이 그것을 통해 실행 한 원인 분 전, '포인트입니다 그래서, 정말 흥미 롭군요, 어떻게 할 성능의 균형을 어떻게 정확성을 균형 않습니다

즉 일반적으로 당신이를 재생해야하는 트레이드 오프의 정말 정말 빨리 당신에게 무언가를 줄 수있는, 하지만 결과는 충분하고 뭔가 우리는 걱정? 그래서 나는, 컴퓨터 비전에 전반적인 생각 그건 정말 뭔가 태클과 내가이야 정말에 갔을 때 좋아했다 큰 컴퓨터 비전 컨퍼런스, CVPR, 실제로 일부 연구자을 보았다 당신은 거의 모든면에서 볼 수 있습니다 당신이 컴퓨터를 다루는 산업의 이제 GPU의 것을 함께오고있다 이러한 종류의 최적화 그런 처리 기술 및 일 당신은 진정한 변화가있다 볼 수 있습니다 전체 업계, 학계에서 좋아 말할 것 그 무슨 경우 가능하지 지금 가능하다 우리가 어떻게해야합니까? 당신은 알아? – 네 그것은 모든 성장을 그냥 놀라워 즉, 컴퓨터 비전에서 일어나고

내가 원래 컴퓨터 비전에 대해 생각하면, 나는 자동차에 대해 생각했다 나는 내가 그것에 대해 듣고 난생 처음 생각 구글은 자기 차를 운전 개발과 어떻게 컴퓨터 비전은 자동차 탐색을 돕고 있었다 및 인식하는 것은하는 도로에 나무 조각이나 종이 가방이다? 컴퓨터 비전에 많은 교칙이있다, 하지만 그것은 지금과 관련되고 어떻게보고 정말 멋지다 더 나은 결정을 내릴, 팀에 도움이 스포츠에 도움이 그래서 나는 일에 의해 단지 아주, 아주 감동 것을 당신은 일을하고 있습니다 또한, 당신은 문제의 일부에 대한 호기심 공유 컴퓨터 비전 가장 인상적인 일부 응용 프로그램은 무엇입니까 당신은 컴퓨터 비전으로 보았으므로 그리고 어디 향했다 일을 볼 수 있습니까? – 그건 큰 문제는 물론 자, 내가 여기서하는 일은 매우 멋지다 하지만 그 이외의 다른 일이 있습니다 단지 워 나는 전에 그것에 대해 생각하지 않은, 같았다

현실을 직시, 모든 사람들이 자기 운전 차에 일하고, 모두가 VR에 일하고 그리고 그것은 모두 아주 멋지다 하지만 실제로 같은 몇 가지를 내가 본 아주 새로운 것, 나는 무엇을 기다릴 같이 있었어? (웃음) 내가 CMU에있을 때, 나는 충분히 운이 좋았다 조명 및 이미징 연구소에서 작동하는, 거기에, 그들은 스마트 헤드 라이트에 노력하고 있습니다 당신이 운전 할 수 상상한다면 모든 시간에 당신의 높은 빔과, 누군가를 멀게에 대해 걱정하지 그래서, 그들은 해제 할 수 있습니다 상기 헤드 라이트 부분 등 그것은 두 차선에서 멀게하지 않습니다 난 그냥 그 멋진 일이라고 생각 누가, 항상 눈이있어 동해안에서 자랐 나는, 그건 그냥 좋은 줄 알았는데 나는 오 좋아요 같았다

그들이 해제 할 수있는 일이있다 이러한 픽셀 영역의 광 여기서 비 또는 눈에서 반사가 많이있다, 당신은 상상할 수 있는가? – 아 – 그게 생각했다 흥미 및 신규 애플리케이션 내가 최근에 본 적이 그 컴퓨터 비전의 생각 실제로 MIT에서 나오는, 그들은했다 당신의 얼굴 색상의 미묘한 변화 당신은 거의 인간의 눈으로 볼 수있는 일반 웹캠 비디오에서 당신의 심장 박동 – 뭐? – 예 – 그건 미친 짓이야

– 네, 너무 이상해 그들은거야 전화 접속 당신은 실제로 그것을 볼 수 있습니다, 화이트 레드, 화이트 단지 빨간색 사람의 얼굴, 빨강, 흰색, 그것은 이상한 일이지만, 그것을 작동합니다 – 와우 – 내가 학교에있을 때 나는 같았다 나는 이것이 진짜 작동하는지 확인해야 그래서 나는 (웃음) 자신을 그것을 코딩 그것으로 주위를했다 그것은처럼, 그런 것들 중 하나입니다 그것은 이해가되지해야하지만, 그것은 않습니다 그것은 너무 재미있다

정말 흥미로운 한 가지를 말해야한다 좋은 컴퓨터 비전의 이브 기계는 우리가 가지고 학습 나는 개인적으로, 나는 컴퓨터 비전의 사람입니다 나는 점과 사각형을 살 이미지 물건의 상자와 분할 경계, 그러나 나는 말하는 최초의 하나가 될 것입니다 내 출력은 무시 무시한 보인다 그것은 끔찍한 (웃음) 외모 그것은 많은 양의 데이터가, 당신이 나의 하나님 오 생각, 우리는 규모의 수주 증가하고 당신이 보는 무엇을, 좋아 일반적으로, 예를 들어 농구 말 우리는이 사람의 이런 말을 사용하고 있습니다 저기, 다음 공 그것은 우리가 걱정하는 전부입니다

갑자기 지금 우리는 모든 단일 프레임이, 모든 싱글 플레이어 우리가 그것을 사용할 수 있습니다 그래서 우리는이를 증류 어떻게, 그래서 나는 그 같은 생각, 나는 영원히 감사 훌륭한 사용자 경험을 사람들 그리고 창조적 인 사람과 전체 스택 엔지니어 누가 실제로 매일 이것에 대해 생각합니다 때문에 나는 정말 인상적입니다 생각합니다 당신은 나의 점과 이러한 출력을 어떻게 그리고 당신은 그들이 그렇게 많은 사람들이 그것을 사용할 수 있도록 난 그냥 항상 그런 종류의에 감동하고 있습니다

– 와우, 잘 당신이있어 무엇을 매우 인상적 에 걸쳐 데이터를 얻기 위해 수행 할 수 그 다양한 과학자들은 좀 더 의미있는 도움이됩니다 그러나 당신을 위해, 당신처럼뿐만 아니라, 모델을 생성하고 중요한 것을 찾는 부분 뿐만 아니라 당신은 또한 잘 이해하고 있어야합니다 게임과 그래서 작업이 매력이며, 발전이 일어나고보고 매우 매우 멋진 당신의 공간이다 내가 알아 원, 데이터 과학자의 많이있다 우리 사회에서 즉, 컴퓨터 비전에 점점보고있다 에 대해 생각하는 사람들도 있습니다, 그들은 지금 학생들이 고등학교 또는 대학에서 현재입니다 그들은 학위를 추구해에 대해 생각하고 데이터 과학이다 당신이 그들에 대한 어떤 조언이 있다면 궁금 해서요

– 예 나는 조언이 비트를 가질 수 내가로부터 입수 한, 오, 감사합니다 알렉스을 주셔서 감사합니다 나는 사람들을위한 조언의 비트를 가지고 내 교수로부터받은으니 과거에 내 상사뿐만 아니라 우선은 호기심이 유지된다 나는 기본적으로 묻는에 의해 컴퓨터 비전에있어 이봐, 당신은 내가 그와 함께 재생할 수 있습니다, 거기에 mathed했습니다 잠시 동안? 또한, GP 프로그래밍에있어 이는 범용 GP 프로그램입니다

나는 기본적으로 말함으로써 그에있어, 당신은 당신이 볼 왼쪽에있는 그 사람을 알고있다 내가 그 일을 시작하면 될까요 있다는거야? 그리고 그들은 확실히, 오, 그래 좋아했다, 왜 안 호기심이있어 당신이 생각하는 것들에 자신을 가져 오기 흥미 진진하고 재미있다 그리고 둘째로,이 정말하고있다 어려운 일이 나는 대부분의 사람들이 투쟁이라고 생각합니다 많은 것들을 시도하고 대부분의 시간을 실패 준비합니다

당신은 기계 학습에있어 여부 또는 소프트웨어 공학, 인생의 대부분의 것들, 당신은, 30 일 (10), (20)을하려고합니다 40, 50 시간, 당신은 실패합니다 그러나, 당신이 말하는 그 한 시간이있을거야 오이 실제로 좋아요, 작동합니다 그래서 실패하는 것을 두려워하지 않습니다 그것은 완전히 정상 및 내가 이야기 한 매우 운이 있었어요 컴퓨터 비전에서 유명한 선수 중 일부 내가 CMU에서, 그리고 그 같은 일 동안 그들은 말했다 나는 모든 시간을 실패했지만 아무도 그것을 기억하지 않습니다

그들은 단지, 실제로 성공 시대를 기억합니다 나는 그 조언의 큰 조금 걸릴 것 같아요 아주 쉽게 때문에 그것에 대해 자신을 이길 수 있습니다 – 그래, 그 사랑, 그 멋진 조언이다 나는 약간의 에코를들을 수 있습니다 마지막 질문, 토론의 많은 거기에있는 약, 단지 데이터 과학에 점점 사람을위한 경우, 어떤 프로그램이 처음 배우는 지금은 파이썬이처럼 간주됩니다보고 있어요 언어를 배울 수 있습니다

당신은 어떤 조언이 있다면 궁금 해서요 사람들을 위해 단지로 시작하는 언어의 파괴? – 나는 개인적 관심사 뭔가 갈 것입니다 거 당신이 학습을 계속 것 것은, 그것을 할 아침에 일어나 경우는, 헤이 말 나는 임베디드 시스템에 매우 관심이 있습니다 나는 정말 멋지다 생각합니다 나는 그 사람들 중 하나 있어요 난 지금, C ++의 언덕에 거 실행 해요? 내가처럼 단지거야,이 굉장합니다! 하지만 당신처럼 사람이 있다면, 이봐, 나는이 책을 가지고 그들은 이야기 내가 배우고 싶은이 정말 멋진 라이브러리 컴퓨터 비전이나 기계 학습을 수행하는 방법, 사용 이동합니다

그것은 일부 오래된 언어이든 방금 생각은 정말 펑키하고 이상한 당신은 배우고 사랑 해요 여부는 새롭고 신선한 뭔가 여기 사무실에서, 사람들은 L에 정말 당신은 당신이 그것에 대해 흥분하는 경우, 그것을 배울 이동 알고있다 로 갈 잘못된 언어가 있기 때문에, 정말 없습니다 당신은 하나 개의 언어 배우면 비밀은있다 그것은 다른 언어를 배우는 것은 매우 쉽다

당신이 배운 때 그리고, 정말 쉽게 세 번째 내용으로 이동합니다 그래서 당신 관심사에 시간을 투자합니다 당신은 정말 민감한 경우 나는 C ++과 파이썬 원하는, 또는 내가 원하는 자바와 C, 몇 가지 예를 들어, 하나 이동 당신은 내가이있는 작업을 원하는 말할 것 그들은 무엇을 원하는 것입니다 하지만 그건 보조 관심사입니다, 말할 것입니다 먼저 흥분 무엇을 함께 할 것입니다

– 그 사랑 알렉스, 화면에 그것을 넣어 "당신이 그것에 대해 흥분이 있다면, 그것을 배울 이동합니다" 그 조언을 사랑 해요 제나, 당신의 시간 오늘 주셔서 정말 감사합니다 어디 모든 사람들이 당신에 대해 더 많은 정보를 얻을 수 있습니까? – 오, 당신이 링크드 인에 나를 찾을 수 있습니다

그것은 사이트에 연결되어 있습니다 또한, 두 번째 스펙트럼에 대해 자세히 알아 보려면 특히 인턴, 그래서 너희들이하는 경우 기계 학습 또는 컴퓨터에 대한 흥분, 그것을위한 사이트 – 당신에게 너무 굉장 감사 드리며 있는지 확인합니다 정보 섹션에 링크를 넣어 YouTube 동영상뿐만 아니라에서 페이스 북의 라이브 비디오의 코멘트 섹션 제나는, 시간을내어 주셔서 너무 감사합니다 우리와 함께 이야기하고 통찰력을 공유 컴퓨터 비전에 대한 우리와 함께 나는 시청 모두 감사드립니다, 당신의 마음에, 당신의 의견, 우리 모두 다음 주에 얘기하자

제나는 다시 한번 감사드립니다 – 그것은 큰있었습니다 당신에게 너무 많은 마이크를 감사드립니다 – 좋아,주의하십시오 – 감사

Machine Learning & Artificial Intelligence: Crash Course Computer Science #34

안녕하세요, 캐리 앤 해요, 물론 컴퓨터 과학 크래시에 오신 것을 환영합니다! 우리는이 시리즈에서 몇 번에 감동 한 것처럼, 컴퓨터, 조직, 저장에서 믿을 수 있습니다 페치 및 대량의 데이터를 처리하는 단계를 포함한다 즉, 판매 품목의 수백만 전자 상거래 웹 사이트 같은 것들에 대한 완벽한 의사에 의해 신속하게 액세스 할 건강 기록의 수십억을 저장합니다

그러나 우리는 그냥 가져 및 디스플레이 데이터를 실제로에 컴퓨터를 사용하지 않을하려는 경우 데이터에 대한 결정을 내릴? 이 기계 학습의 본질이다 – 컴퓨터를 배울 수있는 능력을 제공 알고리즘 데이터를 입력 한 다음 예측 및 의사 결정을 내릴 이메일이처럼이 능력을 가진 컴퓨터 프로그램이 응답 질문에 매우 유용합니다 스팸? 사람의 마음은 부정맥이 있습니까? 유튜브는이 일 후에는 어떻게 비디오를 추천해야합니까? 유용하지만, 우리는 아마에서 "지능형"이러한 프로그램을 설명 할 것 같은 방법으로 우리는 인간의 지능 생각합니다 따라서, 용어는 종종 상호 교환에도 불구하고, 대부분의 컴퓨터 과학자들은 그 기계를 말할 것 학습은 인공의 더 야심 찬 목표 안에 앉아 기술의 집합입니다 짧은 지능, 또는 AI INTRO 기계 학습 및 AI 알고리즘은 꽤 복잡한 경향이있다 그래서 오히려 그들이 작동하는 방법의 메커니즘으로 넘어 가고보다, 우리가에 초점을하려고하는지 알고리즘은 개념적 않습니다

간단한 예제부터 시작하자 : 나방은 루나 엄 또는 황제 나방입니다 결정합니다 이 결정 과정은 분류라고하며,이를 수행하는 알고리즘이라고 분류 훈련을 위해 원시 데이터를 사용할 수있는 기술이 있지만 – 같은 사진과 소리 – 많은 알고리즘으로 실제 물체와 현상의 복잡성을 줄일 것 라는 기능이 있습니다 기능은 유용하게 우리가 분류 할 것을 특징 값입니다 "날개"와 "대량"우리의 나방 예를 들어, 우리는이 기능을 사용하는 것입니다

좋은 예측을하는 우리의 기계 학습 분류를 양성하기 위해, 우리는 갈거야 훈련 데이터가 필요합니다 그것을 얻으려면, 우리는 둘 다 루나에 대한 데이터를 수집하기 위해 숲으로 곤충 학자를 보낼 것 그리고 황제 나방 이 전문가들은 다른 나방을 인식 할 수있는, 그래서 그들은 단지 특징 값을 기록하지, 또한 실제 나방 종과 데이터 레이블을 붙입니다 이것은 표시 데이터라고합니다 우리는 두 가지 기능을 가지고 있기 때문에, 그것은 산점도이 데이터를 시각화하기 쉽습니다

자, 내가 빨간색과 파란색 (100 명) 루나 나방 100 명 황제 나방에 대한 데이터를 꾸몄다했습니다 우리는 종 두 그룹을 만들 것을 볼 수 있지만 수 있습니다

이 중간에 겹치는 부분입니다 그래서 완전히 명확하지의 최선의 방법을 별도로 두 최적의 분리를 찾을 수 – 즉 기계 학습 알고리즘이하는 일입니다! 날개 가능성이 높습니다에 난 그냥 아무것도 미만 45mm 그것을 안구 말할거야 황제 나방합니다

우리는 위해서는 질량이 075보다 작아야합니다 추가로 말한다 다른 부문을 추가 할 수 있습니다 우리의 황제 나방 될 것 같아요 결정 공간을 잘라이 라인은 의사 결정의 경계라고합니다 우리는 우리의 데이터를 자세히 보면, 우리는 86 황제 나방가 제대로 끝낼 것이라고 볼 수 있습니다 황제 결정 지역 내부에 있지만, (14)는 루나 나방 영토에 잘못 끝날 것입니다 반면에, 82 명 루나 나방 (18)는 반대쪽에 떨어지는, 올바른 것입니다

테이블은 다음과 같이 표시하는 분류는 혼란라고 옳고 그른 일을 얻는 곳 매트릭스 아마 또한 마지막 두 영화의 제목 있었어야 매트릭스 부작! 우리가 우리에게 100 %의 정확성을주고 선을 그릴 수있는 방법이 없다는 것을 알 수 있습니다 우리는 우리의 날개 결정 경계를 낮출 경우에, 우리는 Lunas로 더 황제 나방을 잘못 분류

우리가 그것을 올릴 경우, 우리는 더 많은 루나 나방을 잘못 분류 기계 학습 알고리즘의 작업은 높은 수준에서, 정확한 분류를 극대화하는 것입니다 오류를 최소화하면서 우리의 훈련 데이터에, 우리는 평균 분류, 168 명 나방 올바른 얻고, 32 명 나방 잘못 84 %의 정확도 이제, 이러한 결정 경계를 사용하여, 우리는 숲으로 나가서 경우 알 수없는 발생 나방, 우리는 그 특징을 측정하고 우리의 결정 공간에 그것을 플롯 할 수 있습니다 이 레이블이없는 데이터입니다 우리의 결정 경계 나방가 무엇인지 종으로 추측을 제공합니다

이 경우, 우리는 그것이 루나 엄의 예측 것입니다 이 간단한 방법은, 상자들로 결정 공간을 분할의로 표현 될 수있다 어떤 그림으로 같을 것이다하거나 기록 할 수있는 의사 결정 트리를,라고 코드에서이 같은 IF-문을 사용하여 의사 결정 트리를 생산하는 기계 학습 알고리즘은 어떤 기능을 선택해야합니다 에 분할합니다 그리고 이러한 기능의 각각에 대해 분할에 대해 어떤 값을 사용 할 수 있습니다 의사 결정 나무는 기계 학습 기법의 한 기본적인 예이다 컴퓨터 과학 문학에서 알고리즘 오늘의 수백이있다 그리고 더는 모든 시간을 게시하고있다 몇 가지 알고리즘도 예측을 만들기 위해 함께 노력 많은 의사 결정 트리를 사용합니다

그들은 나무를 많이 포함되어 있기 때문에 컴퓨터 과학자들은 돈을 지불 그 숲을 호출합니다 서포트 벡터 머신, 본질적으로 같은도 있습니다 비 트리 기반의 접근 방식, 임의의 선을 사용하여 결정 공간을 조각

그리고이 직선 일 필요는 없습니다; 그들은 다항식 또는 다른 공상 될 수 있습니다 수학 함수 이전과 마찬가지로, 그것은 제공하는 최고의 라인을 파악하기 위해 기계 학습 알고리즘의 일이다 가장 정확한 의사 결정 경계 지금까지, 내 ​​예는 단지 그림에 인간의 쉬운 충분하다, 두 가지 기능을 가지고있다 아웃 우리가 제 기능을 추가하는 경우, 안테나의 길이가 다음 우리의 2D 라인은 3D 비행기가,의 말을하자 세 가지 차원에서 결정 경계를 생성 이 평면은 직선이 될 필요가 없습니다

또한 진정으로 유용한 분류는 여러 가지 나방 종에 맞설 것입니다 지금은이 손으로 알아낼 너무 복잡지고 동의 할 거라고 생각 그러나 이것조차도 아주 기본적인 예입니다 – 단지 세 가지 기능 다섯 나방 종

우리는 여전히이 3D 산포도에 표시 할 수 있습니다 불행하게도, 한 번에 네 개의 기능 또는 스무 기능을 시각화하는 좋은 방법은 없습니다, 혼자 수백 또는 기능의 수천 수 있습니다 그러나 많은 실제 기계 학습 문제에 직면거야 당신은 천 차원을 통해 졸졸 흐르는 초평면에 대한 방정식을 알아 내려고 상상할 수 의사 결정의 공간? 아마, 영리한 기계 학습 알고리즘하지만, 컴퓨터, 그리고 그들이 할 수있는 모든 일 구글, 페이스 북, 마이크로 소프트와 아마존 같은 장소에서 컴퓨터 오래 의사 결정 나무와 서포트 벡터 머신 같은 기술이 강하게에 뿌리를두고있다 자신감 의사 결정 데이터를 사용하여 처리 한 통계 필드, 긴 컴퓨터 앞에 있나 존재했다 널리 사용되는 통계적 기계 학습 기술의 매우 큰 클래스가있다하지만, 통계에없는 기원 어떤 방법도 있습니다 가장 주목할만한 우리의 뇌에서 신경 세포에 의해 영감을 된 인공 신경망입니다! 생물학적 뉴런의 프라이머를 들어, 기본적으로 여기에 우리의 세 부분으로 개요를 확인하지만, 신경 세포의 전기 화학적 신호를 처리하여 세포 및 송신 된 메시지이다

이들 다른 세포, 프로세스 그 신호로부터 하나 개 이상의 입력을 수행하고 자신을 출사 자신의 신호 이 복잡한 정보를 처리 할 수있는 거대한 상호 연결된 네트워크로 형성한다 그냥 당신의 두뇌이 유튜브 동영상을보고 좋아한다 인공 뉴런은 매우 유사하다 각들을 결합 일련의 입력을 받아, 신호를 방사한다

오히려 전기 화학적 신호를 것보다, 인공 뉴런의 숫자를 가지고 가고, 침 숫자가 부족합니다 이들은 따라서, 신경의 네트워크를 형성하는 링크로 연결되는 층으로 구성되어 이름 의 분류를 위해 사용하는 방법 신경망보고 우리의 나방 예제로 돌아가 보자 우리의 첫번째 층 – 입력 층 – 분류를 필요로 한 방에서 데이터를 제공한다 다시 말하지만, 우리는 질량과 날개를 사용합니다

다른 쪽 끝에서 우리는 두 개의 뉴런과 출력 층을 가지고 : 황제 나방과 하나를 루나 엄의 또 다른 가장 흥분 신경 세포는 우리의 분류 결정됩니다 그 사이에, 우리는 숨겨진 층을 갖고, 그 출력으로 우리의 입력을 변환하여, 하드을 수행 분류 작업 이 작업을 수행하는 방법을 보려면의 숨겨진 계층에서 하나의 신경을 확대 할 수 있습니다 신경 세포가하는 첫 번째 일은 특정 중량의 각각의 입력을 곱이다하자 이 두 번째 입력의에 대한 최초의 입력을위한 2

8 및 01을 말한다 그리고,이 경우, 이는이 두 가중 입력을 합산 한 총합이며 974 이 추가 환언 또는 고정 감산 – 신경 세포는이 결과에 바이어스를인가 값, 예를 들어, 마이너스 여섯, 3

74의 새로운 값 이 바이어스 및 입력 가중치는 처음에 임의의 값으로 설정 될 때 신경망 생성된다 그런 다음 알고리즘은 간다, 그리고 신경 네트워크를 양성하는 모든 값을 조정하기 시작, 교육 및 테스트를위한 라벨 데이터를 사용하여 프로세스를 매우 -이 점차 정확도를 개선, 많은 상호 작용을 통해 발생 인간의 학습있다 마지막으로, 신경 세포 활성화 기능을 가지고, 또한 가져 그, 전송 함수를 호출 결과로 최종 수학적 변형을 수행하는 상기 출력에 적용

예를 들어, 네거티브 및 포지티브 한 하나 또는 설정 범위에서의 값을 한정 어떠한 음의 값 0 우리는 변화를 통해 값을 전달 선형 전달 함수를 사용하기 때문에 374 것이다 374로 유지됩니다 입력 0

55 82 주어진 예제 신경 세포에 대한 그래서, 출력은 374가 될 것입니다 이것은 단지 하나 개의 뉴런, 그러나 가중이 과정 합산 편향 및 적용하는 활성화 함수는 모든 층에서 뉴런에 대해 계산되며, 상기 값은 전파 동시에, 네트워크에 하나 개의 층을 전달 루나 엄 :이 예에서 가장 높은 값을 출력 뉴런은 우리의 결정이다 중요한 것은, 숨겨진 층 한 층이 될 필요가 없습니다

그것은 많은 레이어 될 수 있습니다 깊은 용어 깊은 학습이 어디에서 오는지이다 이러한 더 복잡한 네트워크를 훈련하는 것은 더 많은 계산과 데이터를합니다

신경 네트워크는 오십 년 전에 발명 된 사실에도 불구하고, 깊은 신경 그물은, 아주 최근 강력한 프로세서 덕분에 실용적하지만, 훨씬 더있다 그래서, 사악한 빠른 GPU를 그래서, 그래서 실크처럼 부드러운 프레임 속도에 대해 요구되는 당신에게 게이머 감사합니다! 몇 년 전, 구글과 페이스 북은 찾을 수 깊은 신경망을 보여 주었다 사진뿐만 아니라 인간의 얼굴 – 인간이 정말 좋다! 그것은 거대한 이정표였다 이제 깊은 신경망 의료 조건, 인간의 연설을 번역, 자동차를 운전 진단된다 그리고 훨씬 더 이러한 알고리즘은 매우 정교하지만, 설명 할 필요가있는 경우는 덜 분명 같은 "지능형" 그들은 정말 만 분류 나방처럼 한 일을 얼굴을 찾거나 언어를 번역 할 수 있습니다

AI의이 유형은 약한 AI 또는 좁은 AI라고합니다 그것은 특정 작업에서만 지적이다 하지만 그것이 유용하지의 의미하지 않는다; 나는 진단을 할 수있는 의료 기기를 의미한다, 자신을 구동 할 수 자동차는 놀라운! 그러나 우리는 음악을 작성하고 맛있는 조리법을 찾기 위해 해당 컴퓨터를 필요로 할 자신의 자유 시간? 아마 아닙니다 그것은 좀 멋진 것이지만 정말 범용 AI는 스마트하고 인간으로 잘 반올림 하나, 강한라고 일체 포함

아무도 아직 인간 수준의 인공 지능에 가까운 아무것도 증명하지 않았다 일부는 불가능 주장하지만, 많은 사람들이 디지털화 된 지식의 폭발을 가리 – 완벽한 점화로 – 위키 백과 문서, 웹 페이지, 유튜브 동영상 등 강력한 AI합니다 당신은 유튜브의 하루 24 시간의 최대를 볼 수 있지만, 컴퓨터는 볼 수 시간의 수백만 예를 들어, IBM의 왓슨 자문 및 콘텐츠의 2 억 페이지에서 정보를 합성, 위키 백과의 전체 텍스트를 포함 하지 강력한 AI 반면, 왓슨은 꽤 똑똑, 그것은 위험에 인적 경쟁을 분쇄 돌아 오는 길에 2천11인치 뿐만 아니라 활성 성분 정보의 거대한 볼륨을 중얼 수 있지만, 그들은 또한 이상 배울 수 있습니다 시간, 인간보다 종종 더 빨리

2016 년, 구글은 어려워 복잡한 보드를 재생 AlphaGo 좁은 AI 데뷔 게임 이동합니다 방법 중 하나는, 그래서 좋은 최고의 인간의 선수를 이길 수있어 연주했다 자체 수백만의 클론과 시간의 수백만 이 일을하고 무슨 짓을하지, 그리고 그 길을 따라, 성공 전략을 발견 한 것을 배웠다 모든 자체 이 강화 학습라고하며, 이는 슈퍼 강력한 방법입니다 사실, 인간이 학습 방법과 매우 유사합니다

사람들은 마술이 수천 시간 소요 산책 할 수있는 능력을 획득하지 않습니다 시행 착오의 그것을 알아낼 수 있습니다 컴퓨터가 시행 착오에 의한 학습의 첨단에 지금, 많은 좁은 문제, 강화 학습은 이미 널리 사용된다

학습 기술의 이러한 유형을 적용 할 수 있는지 흥미로운 일이 될 것이다 무엇이며, 더 넓게, 아이들이 학습 방법처럼 많이 배우고 인간처럼 강력한 활성 성분을 만들지 만합니다 슈퍼에서 속도를 가속 그렇게되면, 인류의 가게에서 꽤 큰 변화가 – 주제 우리는 나중에 다시 방문합니다 시청 주셔서 감사합니다 다음주에 보자