반응형

딥러닝 2

데이터 라벨링 툴 소개 (feat. BlackOlive)

데이터 라벨링이란? 이미지, 영상, 텍스트 등의 데이터에 사람이 데이터 가공 도구를 활용하여 인공지능이 학습할 수 있도록 다양한 정보를 목적에 맞게 입력하는 것을 의미합니다. 더욱 쉽게 설명하자면 자동차에 박스를 그리고 ‘자동차’로 표시를 해 주는 것이 데이터 라벨링입니다. "게임은 아이템 빨" 이라는 말이 있듯이 데이터 라벨링을 효과적으로 하기 위해서는 학습 데이터에 맞게 라벨링 기능을 가진 도구를 활용하는 것 입니다. 데이터 라벨링이 쉬워 보일 수도 있지만, 데이터 입력 기준에 맞춰 라벨링을 진행해야 하기 때문에 집중력과 섬세함이 요구됩니다. 인공지능을 학습시키기 위해서는 정확한 데이터가 필요하며 잘못된 학습 데이터는 인공지능을 망치는 데이터가 될 수 있기 때문입니다. 인공지능 학습을 위한 데이터 형..

카테고리 없음 2022.03.03

데이터 라벨링, 나도 할 수 있을까?

데이터 라벨링은 툴을 활용하기에 겉보기에 쉬워 보일 수 있지만 실상은 그렇지 않다. 데이터 라벨링이 어려운 이유가 뭘까 . . . 1. 데이터 수집의 어려움 대량의 데이터를 어떤 경로로 어떻게 혼자서 수집할 수 있을까? 딥러닝은 대량의 데이터가 필요하고, 라벨링 작업을 진행할 원천데이터가 많아야한다. 원천데이터가 많아야 하는 이유 - 라벨링된 데이터 수가 줄어든다 - 중복 학습, 불필요한 데이터 제외하고 작업 진행 가능 이때 고려할 부분은 '저작권' tvN 드라마 '또오해영'의 영상을 활용하는 과정에서 저작권 문제를 해결하기 위해 코난 테크놀로지가 드라마 제작사와 협의를 거친 사례도 있다. 국가 인공지능 프로젝트인 VTT:Video Turing Test 세부 비디오 이해를 위한 데이터 수집 & 보정 자동..

카테고리 없음 2022.03.03
반응형
LIST