수화를 실시간으로 번역해 주는 AI를 인도 학생이 개발

근래에는, 화상 통화나 온라인 회의가 일을 하는데 있어서 빠뜨릴 수 없는 것이 되고 있다.

그러나 영상 통화 서비스의 대부분은, 수화를 사용하는 사람을 위해 개발되어 있지 않다. 그래서 인도 벨로르공과대학(VIT) 공대에 소속된 학생 프리안젤리 굽타 씨는, 미국 수화(ASL)를 실시간으로 번역해 주는 AI를 개발했다.

온라인 통화 화면상에, 수화의 의미를 영어로 표시해주는 것.

 


■ 인도 학생들이 청각장애인과 의사소통 갭을 메우기 위해 분투

굽타 씨가 새로운 AI를 개발한 계기가 된 것은, 엄마와의 대화였다. 그녀의 어머니는 굽타 씨에게, 공학부생으로서 뭔가 다른 것, 새로운 것에 도전하도록 격려했다.

이 격려를 통해 굽타 씨는, "내가 가진 지식과 기술로 도대체 무엇을 할 수 있는것일까"라고 깊게 생각하게 되었다는. 그리고 그녀는, 청각장애인 등 특별한 요구를 가진 사람들에게 도움이 되는 기술을 개발하고 싶었고, 이를 위한 좋은 아이디어도 떠올렸다.

굽타 씨가 초점을 맞춘 것은 미국 수화이다.

미국 수화는 미국과 캐나다, 중부 아프리카의 여러 나라에서 사용되고 있으며, 세계에서 가장 대중적인 수화 중 하나로 알려져 있다.


굽타 씨는, 최근 사융률이 증가하고 있는 영상 통화에 수화번역 기능을 추가함으로써, 수화를 사용할 수 있는 사람과 쓸 수 없는 사람의 의사소통의 울타리를 없애고 싶다고 생각.

그리고 실제로 "미국 수화의 실시간 번역 AI"를 만드는 데 성공.

 


■ 화면상의 미국 수화를 읽고 즉시 번역하는 AI

굽타 씨가 개발한 AI 모델은, 일반적인 온라인 통화의 화면상에 기능한다. 미국 수화를 사용하면, 웹캠이 그 이미지를 포착해서 실시간으로 영어로 번역해 주는 것이다.

번역된 영어는 화면에 주석의 형태로 표시되고, 수화를 모르는 사람이라도 화상통화에 참여하여 이해할 수 있도록 되어 있다.

그렇다고는 해도, 이 AI의 개발은 아직 초기단계에 있다.

현재, 번역할 수 있는 미국 수화는, "예, "아니오", "부탁합니다", "고맙습니다", "사랑합니다", "안녕하세요"의 6개뿐이고, 향후 기능 확대를 기대하고 있다고...

 


과제의 한가지는, "손의 움직임"을 검출하는 것이다.

현 단계에서 AI는, 손의 모양을 1매의 화상(싱글 프레임)으로 밖에 인식, 학습할 수 있다는 것. 그러나 수화의 대부분은 "일련의 손동작"으로 하나의 의미를 표현한다.

이를 AI로 번역하려면, 동영상(멀티프레임)을 인식, 학습할 수 있도록 업그레이드 해야 할 것이다. 현재 굽타 씨는, 해당 과제를 진행 중이며, 전문가의 도움을 받아 실용적인 수화번역 AI 개발을 진행하고 있다.

그런데 이와같이, 학생들이 자신이 할 수 있는 것을 진지하게 생각해 커뮤니케이션 갭등의 사회 문제에 임하는 것은, 지금 확실히 필요한 일이라고 말할 수 있다.

장차 굽타 씨와 같은 젊은 연구자가 더 큰 문제를 과학기술로 해결해 줄지도 모른다.