Powered by TensorFlow: helping paleographers transcribe medieval text using machine learning

세레나 아미미치 :이 책을 페이지별로 살펴 봅니다 그리고 무엇이든지 해독하고, 읽고, 필사하는 것을 시도합니다

엄청난 시간이 걸립니다 고고학자들의 군대가 필요합니다 ELENA NIEDDU : 기계 학습에 대해 가장 흥분되는 것은 무엇입니까? 우리가 최대 10 개의 문제를 해결할 수 있었고, 15 년 전에 우리는 풀 수없는 생각을했습니다 ELENA NIEDDU : 어떤 종류의 기계 학습 모델을 사용하기 전에, 우리는 먼저 데이터를 수집해야했습니다 당신은 인터넷에 개와 고양이의 수천 개의 이미지가 있습니다

그러나 고대 원고의 이미지는 거의 없습니다 crowdsourcing을위한 자체 웹 응용 프로그램을 만들었습니다 그리고 우리는 고등학생들이 데이터를 수집하는 것을 포함했습니다 나는 일반적으로 기계 학습에 관해 많이 알지 못했다 그러나 나는 TensorFlow를 만드는 것이 매우 쉽다는 것을 알았습니다

환경 우리가 알아 내려고 할 때 Keras가 최고의 솔루션이었습니다 생산 모델은 TensorFlow 레이어에서 실행됩니다 인터페이스 우리는 바이너리 분류, 완전히 연결된 네트워크

마지막으로, 우리는 길쌈 신경 네트워크 및 다중 클래스 분류 ELENA NIEDDU : 단일 문자 인식에 관해서는, 95 %의 평균 정확도를 얻을 수 있습니다 세리나 아미미치 : 이것은 엄청난 영향을 미칠 것입니다 단기간에, 우리는 엄청난 양의 역사적 정보가있다 유효한

ELENA NIEDDU : 문제를 푸는 것이 재미 있다고 생각합니다 그것은 나 자신에 대한 게임이며, 내가 얼마나 잘할 수 있는지를 보여줍니다