Sztuczna inteligencja izoluje ścieżki dźwiękowe
Na szybkie wyizolowanie wokalu i ścieżek instrumentalnych pozwala teraz oprogramowanie Spleeter opracowane przez serwis streamingowy Deezer. Firma udostępniła je jako pakiet open source. Teraz każdy zainteresowany przeróbkami muzycznymi może pobrać i wykorzystać odpowiedni kod Github.
Działanie Spleetera jest nieskomplikowane: po załadowaniu pliku audio zostanie on bardzo szybko podzielony na osobne ścieżki dźwiękowe: dwie (wokal i akompaniament muzyczny), cztery (wokal, perkusja, bas i dźwięki pozostałe) lub pięć (wokal, perkusja, bas, fortepian i pozostałe).
Wytrenowany model
Do stworzenia Spleetera zastosowano język programowania Python i bibliotekę TensorFlow. Firma bazowała na wcześniejszych badaniach wykorzystujących uczenie maszynowe do tego typu celów. Specjalista z Deezera przekazał portalowi The Verge informację, że oprogramowanie zostało wyszkolone na 20 tysiącach ścieżek muzycznych reprezentujących różne gatunki.
Działanie Spleetera przetestował bloger technologiczny Andy Baio. Porównanie wielu utworów pokazało bardzo niski poziom niedoskonałości izolowanego dźwięku w porównaniu z dotychczas dostępnymi programami, także komercyjnymi.
Korzystanie z udostępnionego przez firmę Deezer narzędzia wymaga jednak pewnej wiedzy technicznej, nie jest więc propozycją dla zupełnych amatorów.
Sztuczna inteligencja coraz śmielej wkracza do wszelkich branż – tym razem po jej możliwości sięgnął sektor rozrywkowy. Dla firmy Deezer stworzenie Spleetera jest elementem większego projektu badawczego, który ma doprowadzić do rozwoju między innymi usług przesyłania strumieniowego czy transkrypcji języka.
fot. CSTRSK – Pixabay