Специалисты научили нейросеть озвучивать изображения

Программа анализирует фотографии и картины и добавляет к ним подходящие звуки.

Японская компания Qosmo разработала нейросеть Imaginary Soundscape, которая анализирует картинки и фотографии и подбирает к ним подходящее звуковое сопровождение.

Например, если нейросеть распознает на снимке собаку, то включит собачий лай, а к городским пейзажам подберет соответствующий гул машин и разговоры людей.

Неплохо справляется программа и с абстрактными картинами, но лучше всего ей удаются простые сюжеты, там точность подобранных звуков близится к 100%.

Всего в коллекции нейросети около 52 тысяч различных звуковых дорожек. Так что выбрать ей есть из чего.