Back to Search
Start Over
Separace nástrojů a zpěvu z hudební nahrávky
-
Abstract
- Na separáciu zdrojov z hudobných nahrávok sa používajú neurónové siete. Jednou z takýchto sietí je Conv-TasNet. Cieľom práce je experimentovať s už existujúcou implementáciou tejto siete za účelom potenciálneho zlepšenia. Trénovanie modelov prebiehalo na dátovej sade MUSDB18. Postupne sa experimentovalo so zmenou štruktúry siete, transformáciou signálov z časovej domény do frekvenčnej pre účely počítania objektívnej funkcie, zámenou rôznych objektívnych funkcií za pôvodnú, hľadaním optimálneho koeficientu rýchlosti učenia pre každú objektívnu funkciu a jeho postupným zmenšovaním v priebehu učenia. Ako najlepšie experimenty podla metriky SDR vyšli trénovania s objektívnymi funkciami L1 a logaritmickou L2 v časovej doméne pri vyššom počiatočnom koeficiente rýchlosti učenia s jeho postupným zmenšovaním v priebehu učenia. V relatívnom porovnaní najlepších modelov oproti východziemu ide o viac ako 2,5% zlepšenie.<br />Neural networks are used for the problem of music source separation from recordings. One such network is Conv-TasNet. The aim of the work is to experiment with the already existing implementation of this network for the purpose of potential improvement. The models were trained on the MUSDB18 dataset. It was successively experimented with the change of the network structure, transforming signals from the time domain to the frequency domain for the purpose of calculating the loss function, replacing different loss functions with the original one, finding the optimal learning rate for each loss function and gradually decreasing the learning rate during the learning process. The best experiments according to the SDR metric were training with loss functions L1 and logarithmic L2 in the time domain with a higher initial learning rate with its gradual decrease during the learning process. In a relative comparison of the best models to the baseline, it is more than 2.5% improvement.
Details
- Database :
- OAIster
- Notes :
- Slovak
- Publication Type :
- Electronic Resource
- Accession number :
- edsoai.on1426425871
- Document Type :
- Electronic Resource