Нейронные сети научились узнавать свыше 90% фотографий растений России

Международная платформа iNaturalist представила новую модель автоматического распознавания живых организмов по фотографиям с использованием нейронных сетей. Модель включает 38 тыс. видов, что в полтора раза больше, чем в прошлом году. В неё включены 2680 видов флоры нашей страны, найденные участниками проекта МГУ «Флора России».

Для включения в обучающий набор данных у того или иного вида растений, грибов или животных должно быть более 100 фотонаблюдений в базе, половина наблюдений при этом должна быть верифицирована вручную. Из 7407 видов, отмеченных в проекте «Флора России», 36% видов растений надёжно узнаются нейросетевыми алгоритмами. Однако эти виды покрывают 94,5% всех загруженных пользователями находок.
 
«Разработка алгоритмов распознавания биологических видов по фотографиям – это результат работы большой команды под руководством американских коллег из Силиконовой долины, – рассказал ведущий научный сотрудник биологического факультета МГУ, доктор биологических наук Алексей Серегин. – Задача нашей группы заключается в постоянном мониторинге тысяч фотографий, поступающих от российских пользователей платформы, и их надёжном определении. Именно рост числа достоверных находок по редким и эндемичным видам флоры России, в том числе из труднодоступных мест, позволил столь радикально увеличить покрытие системы».
 
Впрочем, географическое покрытие данными пока неравномерно. Так, модель автоматического распознавания видов охватывает уже свыше 99% наблюдений из регионов Средней России, 97% из Свердловской области и 93% из Алтайского края. В то же время горы и другие места концентрации биологического разнообразия, столь интересные учёным, пока хуже знакомы искусственному интеллекту. Так, в Краснодарском крае и Крыму нейронная сеть может распознать около 83% изображений, в Горном Алтае – 76%, а в Дагестане только 61%. В богатейшей флоре юга Приморского края, которая включает виды тропического происхождения, пока распознается лишь половина фотографий.
 
В 2021 году пройдет масштабный конкурс для специалистов по машинному обучению iNat Challenge 2021. Цель конкурса: применить современные подходы к автоматической классификации изображений для реальных данных в виде миллионов фотографий живых существ, определенных экспертами. Лучшие команды будут приглашены для презентации своей работы…