Метод для восстановления аудиосигнала с помощью свёрточных нейронных сетей
https://doi.org/10.25205/1818-7900-2022-20-3-38-50
Аннотация
В работе представлено исследование возможности восстановления искажённого аудио-сигнала. На основе полученных ранее результатов использования методов глубокого машинного обучения разработана концепция нейронной сети, предназначенная для коррекции искаженного звукового сигнала. На базе первоначально полученной разработано несколько новых архитектур нейронных сетей, ориентированных на восстановление аудиосигнала. В статье приведены описания разработанных архитектур с теоретическим обоснованием возможности их применения. Представленные архитектуры были протестированы для решения задачи восстановления партии конкретного инструмента в музыкальной композиции, из которой она была удалена.
Ключевые слова
Об авторах
К. И. ДементьеваРоссия
Дементьева Кристина Игоревна, ассистент кафедры прикладной математики и кибернетики, аспирант
Новосибирск
А. А. Ракитский
Россия
Антон Андреевич Ракитский, кандидат техническиъ наук, доцент кафедры прикладной математики и кибернетики, научный сотрудник, старший научный сотрудник
Новосибирск
Список литературы
1. Mokrý O., Rajmic P. Audio inpainting: Revisited and reweighted //IEEE/ACM Transactions on Audio, Speech, and Language Processing. 2020. Vol. 28. Pp. 2906–2918.
2. Heo H. S., So B. M., Yang I. H., Yoon S. H., Yu, H. J. Automated recovery of damaged audio fles using deep neural networks //Digital Investigation. 2019. Vol. 30. Pp. 117–126.
3. Kwon B., Gong M., Huh J. and Lee S. Identifcation and Restoration of LZ77 Compressed Data Using a Machine Learning Approach. 2018 Asia-Pacifc Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Honolulu, HI, USA, 2018, pp. 1787–1790. DOI: 10.23919/APSIPA.2018.8659755
4. Mousavi A., Patel A. B., Baraniuk R. G. A deep learning approach to structured signal recovery. 2015 53rd Annual Allerton Conference on Communication, Control, and Computing (Allerton), Monticello, IL, 2015, pp. 1336–1343. DOI: 10.1109/ALLERTON.2015.7447163
5. Zhang Z., Rao B. D. Sparse Signal Recovery with Temporally Correlated Source Vectors Using Sparse Bayesian Learning. IEEE Journal of Selected Topics in Signal Processing. 2011. Vol. 5, no. 5. Pp. 912–926. DOI: 10.1109/JSTSP.2011.2159773
6. Bellasi D., Maechler P., Burg A., Felber N., Kaeslin H., Studer C. Live demonstration: Real-time audio restoration using sparse signal recovery. 2013 IEEE International Symposium on Circuits and Systems (ISCAS), Beijing, 2013, pp. 659–659. DOI: 10.1109/ISCAS.2013.6571929.
7. Adler A. et al. Audio inpainting //IEEE Transactions on Audio, Speech, and Language Processing. 2011. Vol. 20, no. 3. Pp. 922–932.
8. Doshi S. Various Optimization Algorithms For Training Neural Network. Towards Data Science. 2019 Jan. 13.
9. Diederik P. Kingma and Jimmy Lei Ba. Adam : A method for stochastic optimization. 2014. arXiv:1412.6980v9
Рецензия
Для цитирования:
Дементьева К.И., Ракитский А.А. Метод для восстановления аудиосигнала с помощью свёрточных нейронных сетей. Вестник НГУ. Серия: Информационные технологии. 2022;20(3):38-50. https://doi.org/10.25205/1818-7900-2022-20-3-38-50
For citation:
Dementyeva K.I., Rakitsky A.A. Method for Restoring Audio Signal Using Convolutional Neural Networks. Vestnik NSU. Series: Information Technologies. 2022;20(3):38-50. (In Russ.) https://doi.org/10.25205/1818-7900-2022-20-3-38-50