Preview

Вестник НГУ. Серия: Информационные технологии

Расширенный поиск

Метод для восстановления аудиосигнала с помощью свёрточных нейронных сетей

https://doi.org/10.25205/1818-7900-2022-20-3-38-50

Аннотация

В работе представлено исследование возможности восстановления искажённого аудио-сигнала. На основе полученных ранее результатов использования методов глубокого машинного обучения разработана концепция нейронной сети, предназначенная для коррекции искаженного звукового сигнала. На базе первоначально полученной разработано несколько новых архитектур нейронных сетей, ориентированных на восстановление аудиосигнала. В статье приведены описания разработанных архитектур с теоретическим обоснованием возможности их применения. Представленные архитектуры были протестированы для решения задачи восстановления партии конкретного инструмента в музыкальной композиции, из которой она была удалена.

Об авторах

К. И. Дементьева
Новосибирский государственный университет
Россия

 Дементьева Кристина Игоревна, ассистент кафедры прикладной математики и кибернетики, аспирант

Новосибирск 



А. А. Ракитский
Сибирский государственный университет телекоммуникаций и информатики; Новосибирский государственный университет
Россия

 Антон Андреевич Ракитский, кандидат техническиъ наук, доцент кафедры прикладной математики и кибернетики, научный сотрудник,  старший научный сотрудник

Новосибирск 



Список литературы

1. Mokrý O., Rajmic P. Audio inpainting: Revisited and reweighted //IEEE/ACM Transactions on Audio, Speech, and Language Processing. 2020. Vol. 28. Pp. 2906–2918.

2. Heo H. S., So B. M., Yang I. H., Yoon S. H., Yu, H. J. Automated recovery of damaged audio fles using deep neural networks //Digital Investigation. 2019. Vol. 30. Pp. 117–126.

3. Kwon B., Gong M., Huh J. and Lee S. Identifcation and Restoration of LZ77 Compressed Data Using a Machine Learning Approach. 2018 Asia-Pacifc Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC), Honolulu, HI, USA, 2018, pp. 1787–1790. DOI: 10.23919/APSIPA.2018.8659755

4. Mousavi A., Patel A. B., Baraniuk R. G. A deep learning approach to structured signal recovery. 2015 53rd Annual Allerton Conference on Communication, Control, and Computing (Allerton), Monticello, IL, 2015, pp. 1336–1343. DOI: 10.1109/ALLERTON.2015.7447163

5. Zhang Z., Rao B. D. Sparse Signal Recovery with Temporally Correlated Source Vectors Using Sparse Bayesian Learning. IEEE Journal of Selected Topics in Signal Processing. 2011. Vol. 5, no. 5. Pp. 912–926. DOI: 10.1109/JSTSP.2011.2159773

6. Bellasi D., Maechler P., Burg A., Felber N., Kaeslin H., Studer C. Live demonstration: Real-time audio restoration using sparse signal recovery. 2013 IEEE International Symposium on Circuits and Systems (ISCAS), Beijing, 2013, pp. 659–659. DOI: 10.1109/ISCAS.2013.6571929.

7. Adler A. et al. Audio inpainting //IEEE Transactions on Audio, Speech, and Language Processing. 2011. Vol. 20, no. 3. Pp. 922–932.

8. Doshi S. Various Optimization Algorithms For Training Neural Network. Towards Data Science. 2019 Jan. 13.

9. Diederik P. Kingma and Jimmy Lei Ba. Adam : A method for stochastic optimization. 2014. arXiv:1412.6980v9


Рецензия

Для цитирования:


Дементьева К.И., Ракитский А.А. Метод для восстановления аудиосигнала с помощью свёрточных нейронных сетей. Вестник НГУ. Серия: Информационные технологии. 2022;20(3):38-50. https://doi.org/10.25205/1818-7900-2022-20-3-38-50

For citation:


Dementyeva K.I., Rakitsky A.A. Method for Restoring Audio Signal Using Convolutional Neural Networks. Vestnik NSU. Series: Information Technologies. 2022;20(3):38-50. (In Russ.) https://doi.org/10.25205/1818-7900-2022-20-3-38-50

Просмотров: 100


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-7900 (Print)
ISSN 2410-0420 (Online)