데이터 라벨링은 툴을 활용하기에 겉보기에 쉬워 보일 수 있지만 실상은 그렇지 않다. 데이터 라벨링이 어려운 이유가 뭘까 . . . 1. 데이터 수집의 어려움 대량의 데이터를 어떤 경로로 어떻게 혼자서 수집할 수 있을까? 딥러닝은 대량의 데이터가 필요하고, 라벨링 작업을 진행할 원천데이터가 많아야한다. 원천데이터가 많아야 하는 이유 - 라벨링된 데이터 수가 줄어든다 - 중복 학습, 불필요한 데이터 제외하고 작업 진행 가능 이때 고려할 부분은 '저작권' tvN 드라마 '또오해영'의 영상을 활용하는 과정에서 저작권 문제를 해결하기 위해 코난 테크놀로지가 드라마 제작사와 협의를 거친 사례도 있다. 국가 인공지능 프로젝트인 VTT:Video Turing Test 세부 비디오 이해를 위한 데이터 수집 & 보정 자동..