Агроном в смартфоне: умная онлайн-платформа распознает болезни растений по фото

По оценкам Продовольственной и сельскохозяйственной организации ООН, каждый год на планете до трети урожая погибает от вредителей и болезней. Поэтому над решением этой острой проблемы бьются лучшие умы мира.

Современные устройства и технологии искусственного интеллекта (ИИ) стали постоянными спутниками ученых в их изысканиях. Дроны с гиперспектральными камерами над полями, роботы с датчиками в теплицах, умные приложения для садоводов в смартфоне помогают увеличить урожайность и уменьшить потери в сельском хозяйстве.

В Лаборатории информационных технологий Объединенного института ядерных исследований (ОИЯИ) разработали онлайн-платформу, которая буквально с одного «взгляда» на фото может определить, что не так с вашими домашними орхидеями и драценами, или чем больны розы, огурцы, яблони и другие растения на дачном участке.


Виртуальный ботаник

Архитектура платформы pdd.jinr.ru способна с точностью более 95 % распознавать различные болезни и вредителей. На начало 2023 года количество классов общей модели платформы увеличили до 60. Появились новые специализированные модели для таких популярных домашних растений, как драцена и спатифиллум, сообщает пресс-служба института.

В 2017 году группа сотрудников лаборатории выиграла грант Российского Фонда Фундаментальных Исследований (РФФИ) на разработку комплексной системы диагностирования болезней представителей флоры по изображениям и текстовому описанию.

Ученым удалось создать платформу, которая продолжает развиваться до сих пор и имеет несколько точек входа пользователей. Обрабатывая запрос, алгоритм сначала использует общую модель по болезням и вредителям. Затем нейросеть определяет вид растения. Если для этой культуры уже имеется своя модель, пользователь получит, кроме общего, еще и частный прогноз.

«При выдаче результата показываются три наиболее близких класса к загруженному изображению. В большинстве случаев все это позволяет правильно определить болезнь и получить рекомендации по ее лечению», — рассказал соавтор исследования, ведущий программист ЛИТ ОИЯИ Александр Ужинский.

Ученье — свет

«Пользователи должны иметь разные инструменты взаимодействия с платформой. Задачи распознавания могут быть запущены через веб-портал, но основной точкой входа пользователей стало мобильное приложение DoctorP для операционной системы Android», — пояснил Александр Ужинский. С момента запуска приложения им воспользовались более 10 тысяч человек. Сейчас ученые разрабатывают приложение и для ОС iOS.

При классификации изображений нередко используют хорошо зарекомендовавшую себя свёрточную нейронную сеть, уже обученную на большом количестве изображений. Ее последний слой, отвечающий за классификацию, заменяют на новый с последующим дообучением на фотографиях из предметной области. Как правило, для использования метода нужны сотни изображений. Здесь исследователи столкнулись с серьезным вызовом — набрать достаточное количество фотографий растений, чтобы нейросети было на чем учиться. В имевшихся на тот момент открытых базах хранились синтетические изображения, сильно отличающиеся от того, что мы видим в реальной жизни: каждый листок отрезан, расправлен и одинаково освещен.

«Эти изображения удобно использовать для научных целей, и мы получили хороший результат — 99 % распознавания, но затем на фотографии, сделанной пользователями в реальной жизни, модель в 50 % случаев ошибалась. Перед нами встала задача самим собирать базу изображений», — уточнил ученый.

В полевых условиях

Исследователи должны были собрать как можно больше снимков в полевых условиях: при разном освещении, положении, различном масштабе съемки и пр. Обычно в таких случаях требуются сотни, а лучше — тысячи изображений.

В открытых источниках на каждый класс болезней имелось лишь от 20 до 50 изображений, и разработчикам пришлось применять особые методы, чтобы в условиях малой обучающей выборки все равно получить хороший результат. Здесь им помогла сиамская (двойная) нейронная сеть, которая не применялась до этого для классификации болезней растений, но лица людей различала хорошо.

«В данной технологии используются одинаковые сети, на вход которым подаются пары изображений одинакового или разных классов, и в результате обучения сеть должна научиться хорошо разносить многомерные вектора изображений различных классов в пространстве свойств. В итоге при определении болезней растений удалось добиться точности в 98 %», — отметил Александр Ужинский.

Новым шагом по улучшению архитектуры и процесса обучения стало использование алгоритмов поиска оптимальных настроек аугментации (AutoAugment) — искусственного изменения изображений, на которых учится нейросеть, если этих изображений мало (меняются, например, угол наклона объекта, яркость, часть объекта отрезается, и т. п.). Кроме того, базовой нейронной сетью в платформе стала сеть, специально обученная на множестве изображений растений. В результате в системе поддерживается точность моделей свыше 95 %.

Урожай в кармане

Сейчас в pdd.jinr.ru есть модели для 19 сельскохозяйственных и декоративных культур: барбариса, винограда, вишни, голубики, клубники, кукурузы, огурцов, перца, пшеницы, смородины, томатов, хлопка, яблок, орхидей, роз и т. д. Для всей изученной флоры распознается больше полусотни различных болезней и вредителей. В базе собрано более четырех тысяч изображений, а на платформу пришло более 40 тысяч запросов от пользователей. Использовать ее интерфейс могут все, начиная от агрохолдингов и заканчивая начинающими садоводами, для которых важно получить рекомендации по лечению растений, верифицированные профессиональными агрономами.

Авторы разработали программный интерфейс, который предоставляет стороннему пользователю возможность использовать ресурсы платформы, например, в своем мобильном приложении. В частности, в рамках совместного проекта с НЦМУ «Агротехнологии будущего» на базе Тимирязевской академии нейросетевые модели pdd.jinr.ru использовали для отслеживания влияния освещения на развитие растений. Это позволяло подбирать оптимальные схемы выращивания сельскохозяйственных культур.

Платформа продолжает развиваться. База данных пополняется снимками пользователей, это улучшает точность моделей. Летом в нее чаще всего попадают изображения сельскохозяйственных культур: огурцов, помидоров, клубники и других, зимой — по большей части фотографии комнатных растений.

В перспективе в базу платформы добавят возможность обработки видеопотока, модели для определения нехватки основных элементов — азота, фосфора, кальция, железа и других, а еще платформа сможет давать рекомендации по выращиванию наиболее востребованных сельскохозяйственных культур.