디지털신호처리 연구실, 오류율 낮춘 아동 음성 데이터 인식 모델 개발로 최우수상
서지영 석사과정생 · 윤수연 학생, 음석 데이터 인식 오류율 최소화로 아동용 AI학습 데이터 모델 성능 향상시켜
▲ 전기컴퓨터공학과 인공지능전공 서지영 석사과정생과 전자공학과 3학년 윤수연 학생
디지털신호처리 연구실(지도교수 이보원) 소속 전기컴퓨터공학과 인공지능전공 서지영 석사과정생과 전자공학과 3학년 윤수연 학생이 '2021 한국어 아동 인공지능(AI) 데이터 해커톤 대회'에서 최우수상을 수상했다.
두 학생이 모인 ‘말모이대장’ 팀은 한국어를 쓰는 아동의 음성 데이터를 인식하기 위해 Encoder-Decoder 기반 모델을 개발하고 Local Attention과 SpecAugment 기법을 적용하여 성능을 향상시켰다. 그 결과 테스트 셋 글자별 오류율 4.79%를 달성해 한국어 아동 음성인식 부문에서 2위를 기록했다.
과학기술정보통신부와 한국지능정보사회진흥원(NIA)이 주최하고 음성 데이터·인식기술 전문기업 미디어젠이 주관한 ‘2021 한국어 아동 인공지능 데이터 해커톤 대회’는 지난 12월 8일부터 21일까지 진행됐다. 주관사가 제공한 ‘한국어 아동 음성 데이터’를 AI용 학습·인식 데이터로 만드는 모델을 개발하기 위해 참가자들이 2주간 경쟁을 벌였다.
서지영 학생은 “공개된 한국어 음성 데이터가 부족한 상황에서 한국어 아동 음성 데이터를 시험해볼 수 있는 소중한 기회였으며, 수상으로 이어져 뿌듯하다”고 소감을 말했다.
함께 수상한 윤수연 학생은 “대회 기간 내내 밤낮없이 코드를 수정하는 고된 일정이었지만 모델 성능이 잘 나오는 만족감에 피곤함을 느낄 수 없었다”고 말했다.
기사출처 [인하뉴스] |