МОСКВА, 31 марта. /ТАСС/. ML-разработчики (ML — machine learning, машинное обучение) Школы анализа данных (ШАД) «Яндекса» создали и выложили в открытый доступ нейросеть, которая умеет определять объем, массу и виды мусора на побережьях водоемов. Об этом ТАСС рассказали в пресс-службе компании Yandex Cloud.
Нейросеть анализирует аэрофотоснимки побережья и делит мусор на шесть типов: рыболовные сети, железо, резина, крупный пластик, бетон и древесина. Точность классификации — выше 80%. Модель отмечает координаты расположения мусора на карте, указывает его состав и массу. Эти данные помогают рассчитать размер необходимой группы людей и количество техники для уборки. Решение уже успешно испытали на территориях Кроноцкого заповедника и Южно-Камчатского заказника на Камчатке.
Как рассказал ТАСС консультант по машинному обучению Yandex Cloud и технический директор лаборатории генеративного ИИ НИУ ВШЭ Дмитрий Сошников, в ходе обучения модели команда проекта собрала и разметила около 2 тыс. реальных фотографий из Кроноцкого заповедника, разделив их на две группы: снимки с мусором и без него. Это было сделано с помощью классификатора, разработанного студентами ШАД. «Полученные снимки использовались для генерации более 500 тысяч искусственных изображений с мусором и чистыми участками. Обучение нейросети проходило в среде Yandex Datasphere, где модель училась распознавать мусор и вычислять процент замусоривания на полученном смешанном наборе данных, включающем как реальные, так и сгенерированные изображения», — рассказал Сошников.
С помощью нейросети специалисты выяснили, что больше всего побережье загрязнено пластиковой тарой и упаковкой (33−39%), а также отходами промышленного рыболовства (27−29%). Эксперты рассчитали, что для очистки берега потребуется группа в 20 волонтеров, 2 самосвала, 2 квадроцикла и фронтальный погрузчик. Благодаря использованию дронов и нейросети организовать уборку 5 тонн отходов удалось в 4 раза быстрее, чем без использования технологии. Сейчас тестирование продолжается в Арктике и других регионах. Доступ к нейросети и код разработки выложены в открытый доступ и могут применяться по всему миру для организации мониторинга разных видов отходов, отметили в «Яндексе».