오픈AI의 Voice Engine 기술 : 15초 목소리 샘플로 매우 흡사한 음성 생성 가능

오픈AI 보이스 엔진

Voice Engine은 텍스트 입력과 15초 분량의 오디오 샘플을 사용하여 본인의 목소리와 매우 흡사한 음성을 생성하는 기술입니다.

2022년 말 개발된 이 기술은 현재 텍스트 음성 변환 API, ChatGPT Voice, Read Aloud 등에 활용되고 있습니다.

OpenAI는 Voice Engine의 잠재적 오용 가능성을 인지하고 있으며,

이 기술의 대규모 배포에 앞서 사회적 책임과 안전성을 고려하고 있습니다.

이와 같은 기술이 범죄에 악용될 경우

보이스 피싱이나, 가짜뉴스 생산에 이용될 수 있으므로

인공지능 기술에 대한 관리가 필요해질 것으로 보입니다.

사전 설정 음성보다 더 자연스럽고 감성 넘치는 음성으로 비독자 및 어린이에게 독서 지원을 제공합니다.

제작자 및 기업이 전 세계 사람들에게 자신의 목소리로 콘텐츠를 전달할 수 있도록 비디오, 팟캐스트 등 다양한 콘텐츠를 번역합니다.

원격 지역에서 필수 서비스 제공을 개선하여 글로벌 커뮤니티를 연결합니다.

말을 할 수 없는 사람들에게 치료적 응용 프로그램을 제공하고, 학습 장애가 있는 사람들에게 교육적 향상을 제공합니다.

갑작스럽거나 퇴행성 언어 장애로 고통받는 환자의 목소리를 회복합니다.

은행 계좌 및 기타 민감 정보에 대한 액세스를 위한 보안 조치로서 음성 기반 인증을 사용하지 않도록 합니다.

AI 기술에서 개인의 목소리 사용을 보호하는 정책을 모색합니다.

AI 기술의 가능성과 한계, 특히 기만적인 AI 콘텐츠 가능성에 대한 대중 교육을 실시합니다.

상호 작용하는 대상이 실제 사람인지 AI인지 명확하게 구분할 수 있도록 시청각 콘텐츠 출처 추적 기술 개발을 촉진합니다.

OpenAI는 Voice Engine 기술의 미래에 대해 정책 입안자, 연구원, 개발자 및 창작자들과 지속적으로 논의하고 협력할 계획입니다.

위 링크로 이동하면 오픈AI 의 보이스 엔진을 테스트할 수 있습니다.

15초 음성으로 아래 텍스트를 읽는 보이스를 생성합니다.