OpenVoice е платформа со отворен код за клонирање на гласот и се издвојува по брзата обработка и напредните опции за прилагодување, што ја разликува од постоечките технологии за гласовно клонирање
Компанијата MyShell го претстави OpenVoice, платформа развиена од истражувачи од MIT, Tsinghua University во Пекинг и канадската компанија MyShell, која нуди клонирање на гласот врз основа на само неколку секунди оригинално снимање на говор и овозможува контрола на тонот, акцентот, емоциите и ритамот.
Станува збор за технологија со отворен код која поставува нови стандарди во областа на репликација на гласот со вештачка интелигенција, користејќи мал аудио клип, со прецизна контрола на тонот, емоциите, стресот, паузите и интонацијата.
Трениран е на различни гласовни обрасци, што му овозможува брзо да го препознае и да го забрза времето потребно за клонирање на нов глас, а се состои од два модели на вештачка интелигенција кои работат заедно за да го претворат текстот во говор и да го клонираат тонот на гласот, со кој можно е да се репродуцира гласот на корисникот и да се смени тонот или емоциите во говорот, наведува VentureBeat.
Today, we proudly open source our OpenVoice algorithm, embracing our core ethos – AI for all.
Experience it now: https://t.co/zHJpeVpX3t. Clone voices with unparalleled precision, with granular control of tone, from emotion to accent, rhythm, pauses, and intonation, using just a… pic.twitter.com/RwmYajpxOt
— MyShell (@myshell_ai) January 2, 2024
OpenVoice може да клонира гласови со многу малку податоци со комбинирање на универзален говорен модел со гласовен примерок обезбеден од корисникот, пишува AI News.
Овој модел на вештачка интелигенција може да се тестира на платформите LeptonAI и Hugging Face, со внесување текст или кратка снимка од вашиот сопствен глас и избирање на акцент, тон на гласот, емоции итн. Ќе биде интересно да се види како овие модели понатаму ќе се развиваат.