IBM Research Director Explains Ethics In Machine Learning | In-Person | J.P. Morgan

[에너지 넘치는 음악] 다리오 : 안전한 AI를 어떻게 구축합니까? AI 모델은 공격하기 쉽기 때문입니다 편견으로 고통받지 않는 AI를 어떻게 구축합니까? 적은 데이터로 학습 할 수있는 AI를 어떻게 구축합니까? 종종 비즈니스에서 우리는 많은 종류의 데이터를 가지고 있습니다

그 중 많은 부분에 라벨이 충분하지 않을 수 있습니다 어떻게 그런 식으로 작동하는 AI를 만들 수 있습니까? 마지막으로 계산 플랫폼이란 무엇입니까? AI 모델 구축 비용을 계속 낮추는 방법 AI 모델을 배포 하시겠습니까? AI는 기술 플레이어의 이야기였습니다 당신은 2, 3 년 전에 알고 있습니다 전 세계 비즈니스에서 AI를 모두 자신의 AI 팀을 만들고 AI가 새로운 IT라고 말하고 싶습니다 그리고 60 년대와 70 년대에 IT가 등장했을 때 무슨 일이 있었습니까? 글쎄, 무슨 일이 일어 났는가는 현대 기업이라는 것을 직관적으로 이해했지만 IT를 배치해야했습니다

AI가 새로운 IT라는 사람들의 직관 이제 현실에서 나타나야합니다 자율 주행 차가있는 경우 어떻게 선택합니까? 한 가지 방법은 다음을 이해하는 것입니다 인간이 실제로 어떻게 이러한 선택을하는지 인간 행동을 모델링하는 AI를 만들 수 있습니다 이것이 도덕적 추론을 주입하는 예입니다 이해의 노력 어떤 지역 사회에서 봉사하고 있습니까? 그 공동체의 도덕적 선호는 무엇입니까? 자율적으로 행동 할 AI가 봉사하는 공동체의 도덕적 선호를 반영합니다

나는 오늘날 우리가 좁은 형태의 AI에 있다고 주장했다 일반적인 형태의 AI를 그것은 개념화되고 실현되지 않았습니다 종종 같은 용어를 사용하면서 우리는 매우 다른 것을 의미합니다 엘론 머스크가 AI의 위험에 대해 이야기 할 때 그는 정말 근본적으로 이야기 AI의 일반적인 형태에 대해 더 넓은 의미로 말입니다 인공 지능 애호가가 그들은 현재의 AI와 좁은 형태의 AI에 대해 이야기하고 있습니다

진행되는 발전, 그들은 서로 과거를 말하고 있습니다 그래서 우리가 가진 것이 중요하다고 생각합니다 이러한 범주는 좁고 광범위하며 일반적이며 대화가 더 정확해질 수 있기 때문입니다

IBM Z | Transform data into insights with machine learning

– 모든 고객 거래 귀중한 정보를 제공합니다 고객에게 도움을 줄 수있는 최선의 경험을 통해 z14에서 기계 학습은 해당 데이터를 이해하는 데 도움이됩니다

실시간으로 더 나은 의사 결정을 내릴 수 있고, 더 빠르고, 전반적인 결과를 향상시킬 수 있습니다 (부드러운 문자열 음악) – 기계 학습을 볼 때, 그것은 오늘날 신흥 분야입니다 누군가 18 개월 전에 나 한테 말하면, 우리가 그런 강한 세트를 가질 것입니다 분석 및 기계 학습 도구, z / OS에서 직접 사용 가능하며, 나는 그들을 믿었을지 확신하지 못한다 그리고 우리가 그 분야의 주요 선수라는 사실은, Z가 현대 플랫폼 인 방법의 또 다른 예입니다

– 세계 데이터의 80 % 이상, Google에서 검색 할 수 없습니다 그 데이터는 엔터프라이즈 방화벽 뒤에 있습니다 전 세계의 조직 그 데이터에는 엄청난 가치가있다 그것은 현재 발견 할 수없는 것입니다

– 기계 학습은 산업 용어입니다 그 시스템의 능력에 대한 이야기 과거 데이터를보고, 해당 데이터로부터 주요 특성 및 패턴을 식별하고, 그 데이터의 주요 상관 관계를 추출하고, 이러한 핵심 기능에 통계 알고리즘을 적용하고, 적용 할 수있는 모델을 만들 수 있습니다 최신 데이터로, 가능한 결과 또는 예상되는 행동을 예측합니다 – 분석 및인지 처리 수행 데이터를 옮기는 것이 아니라, 정말 두 세계의 최고를 제공합니다 데이터를 안전하게 유지하고, 그러나 당신은 여전히 ​​그것으로부터 내부를 얻습니다 – 이제 기업은 다음 단계로 나아갑니다

분석 및 기계 학습을 적용하고, 더 많은 통찰력을 추출하려면, 그들이 보유하고있는 데이터로부터 – 고객이 IBM의 기계 학습을 사용하는 경우, 그들은 어드레싱 측면에서 참으로 혁신적입니다 그들이 오늘날 그들의 산업에서 경쟁하기를 원한다면, 고객에게 최고의 경험을 선사합니다 (부드러운 문자열 음악)

Dinesh Nirmal, IBM | Machine Learning Everywhere 2018

>> 아나운서 : 뉴욕에서 생방송으로, 그것은 the CUBE, 어디서나 학습하는 기계 커버 : AI에 사다리를 건축하십시오 IBM이 당신에게 가져 왔습니다

>> 뉴욕의 Midtown에 다시 오신 것을 환영합니다 우리는 Machine Learning Everywhere에 있습니다 : 입고있는 사다리를 건축하십시오 빅 애플 (Big Apple)에서 2 월 말에 IBM에 의해 발표되었다 Dave Vellante와 함께, 저는 John Walls입니다 우리는 이제 Dinesh Nirmal, 누가 애널리틱스 개발 담당 부사장인가? 곧 IBM Silicon Valley 연구소의 Site Executive가 될 예정입니다

Dinesh, 오늘 아침에 만나서 반가워요 >> 고맙습니다, 존 >> 캘리포니아에서 신선 너 멋지다 >> 고마워

>> 좋아, 너는 이것에 대해서 이야기 해 봤어 그리고 그것은 정말로 당신의 세계입니다 : 데이터, 새로운 정상 설명하십시오 새로운 법칙이라고 할 때, 정확히 그것이 어떻게 변형되고 있는가? 사람들이 적응해야하는 것은 무엇인가? 새로운 법선의 관점에서 >> 그래서, 데이터를 보면, 나는 말할 것입니다 우리 모두는 살아있는 데이터 세트가되었습니다 나이, 인종, 월급

우리가 좋아하거나 싫어하는 것, 모든 사업은 매 초를 모으고 있습니다 전화를 사용할 때마다 그 데이터는 어딘가에 전송되어 어딘가에 저장됩니다 예를 들어 항공사는 찾고 있습니다 있잖아, 뭘 좋아하니? 통로 좌석이 마음에 드십니까? 일찍 집에 가고 싶니? 알다시피, 그 모든 데이터 >> 위의 모든 것, 맞죠? >> 그리고 페타 바이트와 제타 바이트의 데이터가 생성됩니다

이제 기업의 도전은 어떻게 그 데이터를 가져 와서 통찰력을 얻습니까? 당신을 더 나은 고객으로 제공합니다 그게 내가 왔던 곳이야 그러나 가장 큰 도전은, 이 엄청난 양의 데이터를 어떻게 처리합니까? 그것이 바로 도전입니다 그것으로 사이트를 만드는 것 >> 그거 재미 있네

내 말은, 정체성의 정의가 정말로 수십 년 동안 그것은 똑같습니다 당신이 방금 설명한 것은 완전히 새로운 인물입니다

개인의 신원 >> 그리고 지금, 당신은 데이터를 가져 가고, 컴플라이언스 또는 프로비저닝 추가 그 위에 GDPR처럼, 갑자기 어떻게 – >> John : GDPR이란 무엇입니까? 그것에 익숙하지 않은 사람들을 위해 >> Dinesh : 그것은 규제 용어입니다 EU가 확인하십시오 >> EU에서

>> 고객으로서의 나를 기업에 보내 게되면, 말하자면, 나는 내 데이터가 저장되는 것을 원하지 않는다 그 데이터를 완전히 삭제하는 것은 당신에게 달려 있습니다 맞습니까? 이것이 사용 된 용어입니다 그리고 그것은 5 월에 발효됩니다 해당 데이터가 완전히 삭제되었는지 어떻게 확인합니까? 그때까지 고객은

고객으로부터 어떻게 동의합니까? 그 모든 일을하기 위해 그래서 많은 어려움이 있습니다 데이터가 증가함에 따라 어떻게 데이터를 다룰 것인가? 데이터에 대한 통찰력을 어떻게 창출합니까? 데이터에 대한 동의를 어떻게 작성합니까? 해당 데이터를 어떻게 준수합니까? 필요한 정책을 어떻게 작성합니까? 데이터를 생성 하시겠습니까? 그 모든 것들이 있어야합니다 그것들은 기업이 당면한 과제입니다

>> 당신은 GDPR을 기릅니다 그것에 익숙하지 않은 사람들을 위해, 실제로 작년에 효력을 발휘했다 그러나 올해 벌금이 부과됩니다 벌금은 매출액의 4 %처럼 번거롭고, 나는 그것이 단지 끔찍한 것을 의미한다 내가 너에게주는 질문은 이것은 회사들에게는 정말로 무서운 일입니다

그들이 따라 잡으려고했기 때문에 큰 데이터 세계에, 그래서 그들은 방금 큰 데이터 프로젝트를 던지고 있습니다 데이터를 수집하는 모든 곳에서, 종종 개인 정보, 그리고 지금 EU가 내려와 말하기를, "요청하신 경우 삭제할 수 있어야합니다" 많은 시간에 그들은 그것이 어디에 있는지조차 모릅니다 너무 큰 도전

너희들, 도와 주겠니? >> 그래, 내 말은, 오늘 네가 보니, 데이터가 모든 곳에서 존재합니다 내 말은, 그것이 관계형 데이터베이스에 있는지의 여부입니다 또는 Hadoop에서 비정형 데이터, 당신이 알다시피, 광학 상점은 모든 곳에 존재합니다 데이터가 어디에 있는지 말할 방법이 있어야합니다 고객이 동의해야합니다

당신이 데이터를 볼 수 있도록 주어진, 데이터, 그 모든 것들을 삭제할 수 있습니다 우리는 우리가 만든 도구를 가지고 있습니다 우리는 아주 오랫동안 사업에 종사해 왔습니다 예를 들어 우리가 볼 수있는 거버넌스 카탈로그 모든 데이터 소스, 관련 정책 그것, 준수, 그 모든 것들 카탈로그를 살펴 보시려면 어떤 데이터가 GDPR을 준수하는지 확인할 수 있습니다

어떤 데이터가 아닌지, 어떤 데이터를 삭제할 수 있는지, 어떤 데이터를 볼 수 없습니다 >> 우리는 방금 열린 이야기를하고 있었고, Dave는 많은 회사, 너는 단지 누군가가 아닌 모든 스타를 필요로한다 한 특정 분야에서 전문 분야를 가진 사람, 하지만 아마 특정 연대에있는 누군가 그리고 그들은 약 5 개의 다른 모자를 써야합니다 그렇다면 어떻게 데이터를 핵심으로 민주화합니까? 이 모든 별을 만들 수 있다고? 모든 종류의 서로 다른 비즈니스 단위에 걸쳐 또는 회사 내 다른 초점, 갑작스러운 모든 사람들이 접근하기 때문에 훌륭한 정보를 얻을 수 있습니다 나는 전에 이것에 대해 걱정할 필요가 없었습니다

하지만 이제, 당신은 그 재산을 흩어지게해야합니다 모두를 귀중하게 여기십시오 >> 그래, 정말 좋은 질문이야 내가 말했듯이, 데이터는 모든 곳에 존재합니다 대부분의 기업은 데이터 이동을 원하지 않습니다

이사하는 것은 엄청난 노력이기 때문에 기존 장소에서 다른 장소로 응용 프로그램이 작동하는지 확인하십시오 우리는 데이터 가상화 계층을 구축하고 있으며, 연합 레이어 (federation layer) 당신이 사업 단위라고 가정 해 봅시다 해당 데이터에 액세스하려고합니다 이제 해당 연합 데이터 가상화 계층을 사용할 수 있습니다 데이터 이동없이, 그 작은 조각의 데이터를 가져 와서 당신이 데이터 과학자라면, 아주 작은 데이터 만 원한다

귀하의 기업에 존재합니다 데이터를 이동하지 않고도 이동할 수 있습니다 그 데이터를 골라 내고, 일을하고, 예를 들어 해당 데이터를 기반으로 모델을 구축 할 수 있습니다 따라서 데이터 가상화 계층이 실제로 도움이됩니다 이것은 기본적으로 SQL 문이므로, 내가 그것을 단순화한다면

그것은 존재하는 데이터를 추적 할 수 있습니다 그것이 관계형이든 비 관계형이든, 그리고 나서 다시 가져오고, 일을 끝내고, 그 데이터를 다시 작업에 적용하십시오 >> 나는 비관 주의자가되고 싶지 않다 나는 낙천주의 자이기 때문에, 그러나 회사에게는 무서운 시대입니다 그들이 20 세기 조직이라면, 그들은 정말로 인간 전문 지식을 바탕으로 만들어졌습니다

어떻게 무언가를 만드는 방법, 무언가를 처리하는 방법, 또는 누군가에게 봉사하는 방법, 또는 그것이 무엇이든 상담하십시오 21 세기 조직, 데이터는 기본입니다 그것은 핵심이며, 제 데이터가 모든 곳에 있다면, 나는 데이터 중심으로 태어나지 않았고 클라우드에서 태어 났으며, 그 모든 유행어, 전통적인 조직은 어떻게 따라 잡습니까? 그들을위한 출발점은 무엇입니까? >> 대부분은 아니지만 모든 기업이 데이터 중심 경제, 그것은 모두 데이터에 의해 추진되기 때문입니다 이제는 단순한 데이터가 아닙니다 또한 응용 프로그램을 변경해야합니다

귀하의 응용 프로그램은 응용 프로그램이기 때문에 데이터에 액세스하고 있습니다 하나, 어떻게 지내세요? 애플리케이션 적응 형 들어오는 데이터의 양에? 어떻게 정확도를 만드나요? 내 말은, 모델을 만들면, 정확성을 생성하는 정확한 모델을 갖는 것이 중요합니다 당신은 그것을 공연이나 통치하고 스스로 안전하게합니까? 그것은 또 다른 도전입니다 당신은 그것을 어떻게 측정 가능하게 만들고 모든 것을 감시합니까? 당신이 3 개 4 개의 중핵 신조를 가지고가는 경우에, 그것이 바로 21 세기가 지향하는 것입니다 왜냐하면 우리가 증강하기 때문에 우리의 인간, 또는 개발자, AI 및 기계 학습, 어떻게 당신이 가져 오는가 점점 더 비판적이됩니다

데이터에 대한 이러한 세 가지 또는 네 가지 핵심 교리 따라서 데이터가 커짐에 따라 애플리케이션도 확장 할 수 있습니다 >> 큰 과제 당신이 붕괴 된 산업을 보면, 택시, 호텔, 책, 광고 >> Dinesh : 소매 >> 소매점, 고마워요

어쩌면 지금은 덜하고, 당신은 아직 그 붕괴를 보지 못했습니다 은행, 보험 회사, 확실히 정부, 국방, 아직 큰 혼란을 보지 못했지만오고 있습니다 그 곳곳에 데이터가 있다면, 이전에 거의 모든 회사에서 데이터 중심적이어야하지만 많은 회사 내가 말하는 것을 말하면서, "글쎄, 우리 산업은 일종의 고립 된 것" 또는 "그래, 우리는 기다릴거야" 그게 재앙의 처방이라고 생각합니다 그것에 대한 당신의 생각은 무엇입니까? >> 나는 그 분열이 세 가지 측면에서 비롯 될 것이라고 생각합니다

하나, AI 확실히 그것은 길을 바꿀 것입니다 blockchain, 또 하나 당신이 말할 때, 우리는 재정적 측면에서 보지 못했습니다, 블록 체인이 그것을 바꿀 것입니다 세 번째는 양자 컴퓨팅입니다

우리가 계산하는 방식은 완전히 바뀔 것입니다 양자 컴퓨팅 그래서 나는 붕괴가 올 것이라고 생각합니다 그것들은 셋이다 21 세기로 예측해야한다면, 그것은 우리가 일하는 방식을 바꿀 것입니다

AI는 이미 엄청난 노력을하고 있습니다 이제 기계는 기본적으로 이미지를 볼 수 있습니다 그리고 그것이 무엇인지 말하지, 그렇지? 우리는 암 종양학을 위해 왓슨 (Watson) 우리는 400 ~ 500,000 명의 환자가있다 왓슨이 치료를 받았다 그래서 AI는 기업 관점에서뿐만 아니라 변화하고 있습니다

그러나 사회 경제적 관점에서 인간의 관점에서 볼 때, 그래서 Watson은 그 좋은 예입니다 하지만 그래, 우리가 말하는대로 혼란이 일어나고있다 >> 그리고 그 점에 동의합니까? AI에 대한 기본은 데이터입니까? >> 네 >> 그리고 고객과 함께, 당신이 말했듯이, 당신은 그것을 묘사했습니다, 그들은 모든 곳에서 데이터를 가지고 있습니다 모든 것이 사일로에 있지만 모두가 아니라 사일로에 있습니다

IBM은 이들을 사일로 – 버스터로 어떻게 도울 수 있습니까? >> 몇 가지, 맞지? 하나는 모든 곳에 데이터가 존재한다는 것입니다 어떻게하면 데이터에 액세스 할 수 있는지 어떻게 확인합니까? 데이터를 이동하지 않아도됩니다 그러나 전체 라이프 사이클을 살펴보면, 그것은 데이터를 섭취하는 것입니다 데이터 가져 오기, 데이터 정리, 왜냐하면 당신이 말한 것처럼 데이터가 핵심이됩니다 쓰레기 입력, 쓰레기 출력

데이터가 깨끗하지 않으면 좋은 모델을 얻을 수 없습니다 그래서 모든 과정이 있습니다 나는 당신이 데이터 과학자라면, 아마도 귀하의 시간 중 70 %가 데이터를 청소하는 데 소비됩니다 모델 구축을위한 데이터 준비 또는 모델이 소비 할 수 있습니다 그리고 일단 당신이 그 모델을 만들면, 모델이 재교육되도록하려면 어떻게해야합니까? 정기적으로 모델을 모니터링하는 방법, 모델을 어떻게 다스 립니 까? 그리고 마지막 부분은 시각적보고입니다

어떻게 확신하니, 일단 모델 또는 애플리케이션이 구축되면, 생성하려는 보고서를 작성하는 방법 또는 해당 데이터를 시각화하려고합니다 데이터는 기본 레이어가되고, 하지만 그 위에 전체 라이프 사이클이 있습니다 해당 데이터를 기반으로합니다 >> 그래서 미래의 혁신을위한 공식, 그런 다음 데이터로 시작합니다 당신은 인공 지능에 추가, 클라우드 경제학, 그러나 우리는 그것의 일부이기도하다는 것을 정의합니다

제 감각은 대부분의 회사들이 준비가 안 됐습니다 >> 구름 때문에? >> 나는 혁신에 대해 말하고 있습니다 우리가 혁신을 일으킨다는 것에 동의한다면 AI 플러스 데이터 플러스 클라우드 경제학은 API 경제라는 것을 의미합니다 당신은 엄청난 규모의 경쟁을해야합니다 택시 및 소매업의 혼란을 들여다 보면, 그 밑에는 구름 경제가 있습니다 그래서 대부분의 고객은 실제로 가지고 있지 않습니다 그들은 아직 클라우드 경제학을 마스터하지 못했습니다 데이터와 AI 구성 요소만으로는 충분하지 않습니다 그래서 큰 차이가 있습니다 >> 큰 도전입니다

어떻게 데이터를 가져 와서 데이터에서 통찰력을 얻을 수 있습니까? 기존 데이터뿐만 아니라, 맞습니까? 데이터는 초에 곱합니다 초당, 페타 바이트 또는 제타 바이트 데이터가 생성되고 있습니다 그래서 당신은 존재하는 데이터에 대해 생각하고 있지 않습니다 현재 귀하의 기업 내에서, 하지만 지금은 데이터가 여러 다른 장소에서 온다 비 구조적 데이터, 구조화 된 데이터, 반 구조화 된 데이터, 어떻게 그 모든 것을 이해합니까? 그것은 고객이 직면 한 도전이며, 기존 데이터가있는 경우, 새로운 데이터 위에 당신은 그걸 어떻게 나오고 싶은지 어떻게 예측합니까? >> 정말 어려운 수수께끼입니다

일부 회사는 왜냐하면 당신이 지금 커브 뒤에 있다면, 당신은 따라 잡기가 많습니다 그래서 우리는이 공간에 있어야한다고 생각합니다 그러나이 공간을 따라 가면서, 변화가 그렇게 빨리 일어나기 때문에, 정말 힘들어서 페달을 두 번 빨리해야합니다 그냥 게임에 들어가기 도전에 대해 이야기하십시오

어떻게 해결합니까? 당신은 누군가 거기서 어떻게 말하게합니까? "네, 여기 로드맵이 있습니다 "나는 그것이 어려울 것이라고 알고있다 "하지만 일단 거기에 도착하면 괜찮을거야 "아니면 최소한 평등 한 경기장에있을거야" >> 나는 세 D를 본다

데이터가 있습니다 모델이나 응용 프로그램의 개발이 있습니다 그런 다음 해당 모델 또는 응용 프로그램의 배포 기존 엔터프라이즈 인프라 스트럭처에 통합 할 수 있습니다 데이터가 변할뿐만 아니라, 그러나 모델의 개발, 개발에 사용하는 도구도 변하고 있습니다 당신이 다만 예측 조각을 보는 경우에, 나는 80 년대부터 지금을 바라 봅니다

당신은 바닐라 기계를 배우는 것과 깊은 학습을하는 것, 사용할 수있는 도구가 너무 많다는 뜻입니다 어떻게 다 함께 가져 왔어? 어느 것을 사용 하시겠습니까? 내 생각에, 데이브, 하둡을 언급 했어 10 년 전의 용어였습니다 이제는 객체 저장소에 관한 것입니다 데이터가 있는지 확인하는 방법은 무엇입니까? 또는 JSON과 그 모든 것들

모든 것이 변화하고 있습니다 그래서 어떻게 가져 오나요, 기업으로서, 당신은 계속 살아남고, 뿐만 아니라 데이터 조각에, 그러나 모든 핵심 인프라 조각, 응용 프로그램 조각, 그 모델의 개발 조각, 그리고 나서 가장 큰 도전이옵니다 언제 당신이 그것을 배포해야합니다 지금 당신은 가지고 있어야하는 모델을 가지고 있기 때문에 현재 인프라 스트럭처에 배포하고, 쉬운 일이 아닙니다 당신이 기계 학습에 몰두하기 때문에 기존 응용 프로그램, 타사 소프트웨어, 60 년대와 70 년대에 쓰여진 소프트웨어, 그것은 쉬운 일이 아닙니다 나는 유럽의 주요 은행에 있었고, CTO가 나에게 이렇게 말했어

"Dinesh, 우리는 3 주 만에 모델을 만들었습니다 "11 개월이 지났지 만 아직 배포하지 않았습니다" 그리고 그것이 바로 현실입니다 >> 문화적 측면도 있습니다 나는 그것이 Rob Thomas라고 생각한다

나는 그가 쓴 블로그를 읽고 있었다 그는 고객과 이야기하고 있다고 말했다 "나는 기술 산업에 종사하지 않아, "일이 너무 빨리 변하기 때문에 나는 결코 그것을 할 수 없다 "나는 소프트웨어 회사가 아니다" 그리고 롭의 반응은 "어, 잠깐만

(웃음) "당신은 기술 사업에 종사하고 있습니다 "당신은 소프트웨어 회사입니다" 그래서 문화적 사고 방식이 있습니다 그리고 제프리 이멜트 (Jeffrey Immelt)는 GE와 함께 그것을 보았습니다 "나는 산업 거인을 자러 갔다

"소프트웨어 회사를 깨웠다" 그러나 산업 거인 변신 했으니 까 그들은 파트너가 필요합니다

그들은 전에 이것을 한 사람들이 필요합니다 그들은 전문 지식과 분명히 기술이 필요합니다 그러나 항상 그것을 붙잡는 사람들과 과정입니다 >> 나는 기술이 하나라는 것을 의미한다 이것이 바로 IBM과 같은 회사들이 생각하는 것입니다

큰 차이를 만들어라 당신은 기업을 이해합니다 너는 그 풍부한 지식을 가져 오기 때문에 수십 년 동안 그들과 함께 일하는 그들은 귀하의 인프라, 그 핵심 요소입니다, 마지막 조각은 배포 조각이라고 말했듯이, 어떻게 그 모델을 가져 오나요? 기존 인프라로 해당 아키텍처에 맞는지 확인하십시오 그리고 그것은 엄청난 양의 일을 필요로합니다 기술 및 지식

>> 직업 안정 (모두 웃음) >> Dinesh, 오늘 아침 우리와 함께 해줘서 고마워 우리는 그것과 행운을 고맙다 이벤트의 나머지는 뉴욕시에 있습니다 다시 CUBE에서 더 많은 것을 보자

(진정한 테크노 음악)

What is Machine Learning? Find out in 6 minutes with IBM Client Center Montpellier

안녕하세요,인지 솔루션에 대한 새로운 몽펠리에 튜토리얼로 돌아 환영합니다 데이터 시스템 아키텍트로서, 나는인지 시스템에서 작동, 도움 고객은 변화와 정보 시스템을 설계

나는 기계 학습 (Machine Learning) 파에 당신을 환영하고 싶습니다 2016 년 현재로, 기계 학습이 화두이다, 및 팽창 기대의 정점에서 가트너 과대 광고주기에 따라 이 비디오의 목적은 기계 학습 (ML)를 설명하는 것입니다 그리고 그것은 어떻게 작동하는지? 이 짧은 기계 학습 레슨 3 장 : 첫 번째 장에서는 도입 및 기계 학습 정의에 관한 것입니다 그런 다음 두 번째 장에서는 기계 학습 모델을 배포하는 여러 단계를 처리합니다 그리고 마지막으로 우리는 기계 학습을 위해 설계된 IBM 파워 시스템 제공하는을 선물 할 것이다 : PowerAI 기계 학습은 예측에 자신을 빌려 복잡한 모델과 알고리즘을 고안하는 데 사용되는 방법이다; 상업적 사용에, 이것은 예측 분석에 관련 될 수있다

ML은 의사 결정의 무리입니다 기계 학습은 학습과에서 배우고, 데이터에 대한 예측을 할 수 수학적 알고리즘의 구조를 탐구한다 ML은 Mathematicals 모델의 단지 무리입니다 ML의 목적은 출력에 근접하는 가장 적절한 함수 F를 찾을 수 있습니다 입력 데이터의 수십억, 수백만 모델을 훈련 그래서 우리는 어떻게 입력 데이터와 theresult 사이의 관계를 모델링 함수 F를 찾을 수 있습니까? 어떻게 예측 오차를 줄일 수있는 기능을 조정? 우리는이 개 데이터 세트, 교육 및 테스트 데이터 집합으로 우리 역사의 입력 데이터를 나누었다

기계 학습 알고리즘은 예측 모델을 만드는 훈련 데이터를 사용 : 정확도는 홀드 백 데이터를 테스트합니다 모델 출력 테스트 데이터를 이용하여 여러 번 반복 한 후, 모델을 검증한다 한 가지 중요한 점은 ML 시간과 HW 자원을 많이 소비 할 수있는 반복적 인 과정이라는 것이다 모든 반복은 전체 훈련 데이터 세트를 분석합니다 데이터를 준비하는 모델을 구축하고, 생산에 배포 할 때 이러한 모니터링을위한 반복

데이터 입력의 변화 때문에 등등 modelize 다시, 데이터를 준비해야합니다 오픈 소스 프레임 워크는 비용을 minizing, ML 및 수학 기능을 프로그래밍하는 데 도움이됩니다

가장 인기있는은 (구글에서) Tensorflow (페이스 북에서) 토치, Caffee 및 Theano 있습니다 예를 취할 수 있습니다 : 당신은 ATM 거래는 우리의 역사 ATM 트랜잭션 데이터를 기반으로 사기 때 예측하고 싶습니다 학습 모델은 매개 변수를 초기화, 하나의 함수 정의로 시작 예를 들어, 우리는 고객의 거래 시간, 나이, 성별과 우리의 수학 함수를 초기화 우리의 알고리즘은 오류를 찾기 위해 정확한 출력과 실제 출력을 비교하여 배운다 우리의 모델은 점수에서 보이는 (087) 오프 그가 모델에서 얼마나 멀리 본다

그런 다음 초기 가정을 조정하기 위해 더 많은 수학을 사용하여, (가)의 무게 변화 ??? 날짜, 나이, 성별, 데이터에 대한 새로운 반복 라운드를 실행하는 새로운 점수를 얻을 수 있습니다 예측 모델을 구축하는 두 가지 주요 방법이 있습니다, 각 방법은 서로 다른 수학적 모델을 재편성 : 첫째, 학습 알고리즘이 표시된 예를 사용하여 훈련 감독 예컨대 원하는 출력이 알려져 입력으로 이것은 우리의 예입니다 감독 모델의 2 그룹 : 분류 기준 또는 값을 예측하는 회귀 분석에 기초하여 그룹을 예측할 (이것은 우리의 예이다) 두 번째 방법은 자율 학습은 역사적 라벨이없는 데이터에 대해 사용된다

이 시스템은 "정답을"말했다되지 않는다 표시되는 내용이 알고리즘은 파악해야합니다 목표는 데이터를 탐색하고 내 일부 구조를 찾는 것입니다, 클러스터링으로 알려진 같은 반 감독 또는 강화 학습과 같은 다른 ML의 방법이 있습니다 기계 학습은 명시 적으로 프로그램을받지 않고 학습 할 수있는 기능을 제공하는 특정 컴퓨터 솔루션입니다 인프라 다시 인식과 기계 학습 솔루션과 데이터 분석의 핵심을 명확하게합니다 기계 학습으로 인해 데이터의 볼륨으로 인해 많은 기능의 수, 높은 메모리를 많이에 집중 매우 계산이다

IBM은 (CAPI와) 혁신을 불어 전력 시스템을 기반으로 자사의인지 시스템에서의 성능 (GPU 가속) 및 openess (오픈 파워, 열기 CAPI의 intiaitive) 한 가지 예는 IBM PowerAI 제공합니다 PowerAI 통합 기계 학습 프레임 워크 (Tensorflow, caffee) HPC 서버 S822LC와, 최적화 된 엔비디아 GPU 카드와 엔비디아 NVLink 가속화 IBM® 전원 시스템 ™ 깊은 학습을위한이 소프트웨어 플랫폼을 결합함으로써, 기업은 신속하게 완벽하게 최적화를 배포 할 수 있습니다 과 성능을 타오르는 학습 시스템을위한 플랫폼을 지원했다 IBM의 고객 센터 몽펠리에는인지 적 프로젝트를 지원할 수 있습니다

하나 개의 중심에서 우리는, 기계 학습에 인 에이블 세션을 제공 시스템 환경 및 벤치 마크 PowerAI 프레임 워크를 테스트 인지 데모 디자인은 사용 사례를 구축 할 생각 그래서 저희에게 연락하는 것을 망설이지 말라 고맙습니다