커넥트라이브가 다른 경쟁하는 라이브스트리밍 기술을 가장 크게 압도하는 것 중 하나가 풍부한 AI적용 기술입니다. 카카오엔터프라이즈는 카카오 공동체를 대표하는 AI전문 기술 업체이며 이러한 풍부한 AI 기술이 커넥트라이브에 자연스럽게 녹아들어갔습니다.
그렇다면 왜 커넥트라이브는 적극적으로 AI기술을 접목하게 되었을까요? 사실 이것은 지극히 당연한 것이기도 합니다. 경쟁력있는 라이브스트리밍 서비스에 AI기술이 없는 서비스는 없습니다. 이제 배경을 변경하거나 얼굴에 유쾌한 변화를 주는 정도는 너무나 기본인 시대가 왔습니다. 즉 사용자가 라이브스트리밍에 기대하고 있는 경험의 수준이 불과 몇 년 사이에 확연히 달라졌습니다.
흔히 생각하기를 대중적으로 인기를 끈 스노우 앱 덕분에 라이브스트리밍에서도 주로 쓰이는 AI기술은 얼굴 필터효과만을 떠올리지만 생각보다 매우 다양한 영역에서 AI기술을 필요합니다. 영상의 경우 대표적으로 얼굴과 몸 그리고 제스처등을 기본어로 인지하여 배경을 바꾸거나 얼굴에 다양한 효과를 입히거나 제스처를 통해서 다양한 커뮤니케이션 효과를 높이고 있습니다. 음성의 경우에도 음질을 좋게 하기 위해 Noise Cancellation기능이 들어가고 음성인식 기능이나 STT 등을 접목하여 회의록이나 음성명령을 바로 실행할 수 있는 것도 요구됩니다. 이 외에도 회의 참여자들의 다양한 반응들을 데이터화하여 학습 및 회의 경험 분석 용도로도 사용합니다.
얼마 전 서비스되었던 카카오 VX의 라이브 홈트에서는 흔한 라이브 홈트 방송을 뛰어넘어 실시간으로 시청자들의 운동 자세를 AI로 분석하하고 트레이너가 코치해주는 새로운 시도를 한 바 있습니다.
카카오 엔터프라이즈의 AI는 카카오나 국내를 넘어서 세계에서도 인정받는 최고 수준의 기술력을 인정받고 있습니다. (글로벌 AI업계는 지금 카카오엔터프라이즈 앓이 중 참고) 따라서 영상과 소리에 적용 가능한 AI기술이 매우 많습니다. 그 중에서도 고객이 가장 필요로 하는 기능을 엄선하여 차례 차례 적용시켜나갈 예정입니다. 현재 적용 예정인 기능부터 소개합니다.
커넥트라이브를 이용하여 라이브스트리밍 서비스를 개발하게 되면 별도로 STT기능을 고민할 필요가 없습니다. 옵션만 실행하면 회의나 수업에 참여한 모든 참여자들의 목소리를 Text로 실시간으로 수신할 수 있습니다. 단지 STT기능만이라면 그닥 놀랄 일이 아니지만 참여자가 몇 명이든 각 참여자의 목소리를 분리하여 각 Text마다 화자의 id를 같이 제공합니다. 따라서 회의록과 유사한 기능을 개발할 때에도 맥락을 더 잘 이해할 수 있는 기능을 추가할 수 있습니다.
Privacy때문에 혹은 좀 더 재미있게 하기 위해 배경을 흐리게 처리하거나 변경하는 기능은 최근 코로나19 팬데믹 이후 매우 필수로 요구되는 기능입니다. 커넥트라이브로 라이브스트리밍 서비스를 개발하면 특별한 수고없이 최적으로 튜닝되어 성능에 이슈가 없는 배경 변경 기능을 사용할 수 있습니다.
앞으로도 카카오의 AI기술을 기반으로 하는 챗봇 기능(헤이카카오)을 추가할 계획을 가지고 있으며 그외 다양한 AI기술을 접목하여 경쟁력있는 라이브스트리밍 서비스를 개발하는데 유리한 플랫폼이 될 예정입니다.
커넥트 라이브 2.0 업데이트 소식 (0) | 2022.09.14 |
---|---|
우리는 왜 직접 미디어서버를 개발했는가 (0) | 2022.08.03 |
커넥트라이브 5분 안에 시작하기 (0) | 2022.03.26 |
댓글 영역