Автоматизированная идентификация животных в исследованиях дикой природы
Для исследования животных в дикой природе внедряются автоматизированные методы анализа цифровых фотографий. Животных, например, жирафов можно идентифицировать по уникальным пятнам. Для ввода данных о конкретном животном фотоматериал ранее требовал специальной ручной обработки. Биолог из Университета штата Пенсильвания (Pennsylvania State University) совместно с учёными из Microsoft Azure, сервиса облачных вычислений, создали новый автоматизированный метод подготовки цифровых фотографий для анализа, использовав технологию машинного обучения.
«В большинстве исследований нужно найти и собрать данные об отдельных индивидах для работы, например, оценить, как животные выживают, воспроизводятся и передвигаются, — говорит Дерек Ли (Derek E.Lee), профессор биологии в Университете штата Пенсильвания и руководитель исследования в Институте дикой природы (Wild Nature Institute). — Вместо того, чтобы помечать животных или делать другие обозначения, что может повлиять на их поведение, многие исследователи фотографируют уникальные пятна на животных. У нас есть программа распознавания узоров, она помогает анализировать фото, но фотографии готовятся для анализа вручную. Поскольку зачастую у нас в работе сотни фотографий, которые необходимо изучить, это нас серьёзно ограничивает».
Фотографии составляют часть обширного исследования Ли, проводимого им для того, чтобы узнать, как живут, почему умирают и как передвигаются более чем 3000 жирафов в Восточной Африке. Он и его команда делают цифровые фотографии уникального для каждого животного и неизменного узора их пятен, чтобы в дальнейшем идентифицировать их по ним. Но перед тем как изображения будут обработаны программой для распознавания узоров, чтобы опознать отдельных жирафов, исследовательская группа должна вручную обрезать каждое фото или обозначить область, которая их интересует.
Ли в сотрудничестве с учёными из Microsoft, предложившими новый сервис для автоматизации этого важного и трудоёмкого процесса, использовали технологию машинного обучения, развёрнутую в облаке Microsoft Azure.
Взяв за основу компьютерный алгоритм для распознавания объектов, группа из Microsoft научила его распознавать туловище жирафа, используя фото, подписанные вручную. Программа несколько раз улучшалась, использовав процесс активного обучения, система показывала предсказанное ею кадрирование новых изображений людям, которые могли быстро проверить, корректны ли результаты. Новые изображения снова давали ей для тренировки алгоритма и дальнейших обновлений и улучшений программы. В результате система распознавала с высокой точностью местонахождение корпуса жирафа на изображении, даже если жираф занимал мало места или был частично закрыт зеленью.
«Система достигает почти идеального распознавания корпуса жирафа без затратных требований к аппаратной составляющей, не нужно специальное, высокопроизводительное оборудование для обработки графики, — говорит Ли. — Удивительно, как группа из Azure автоматизировала такой трудоёмкий аспект нашей работы. Я привык, что обработка новых изображений занимает у меня неделю после полевой работы, а теперь это происходит за несколько минут. Эта система приближает нас к полностью автоматизированной идентификации животных по фото».
Новая система ускоряет исследования популяции жирафов, которая быстро уменьшается по всей Африке из-за потери среды обитания и нелегальной охоты.
«Жирафы — большие животные, они перемещаются на большие дистанции, поэтому, естественно, мы используем большие данные, чтобы узнать, всё ли у них идёт хорошо и почему у них возникают проблемы, мы можем защитить и объединить пространства, важные для сохранения жирафов, — говорит Ли. — Мы нуждаемся в новых инструментах и поэтому используем технологию Azure, которая сделала нашу работу возможной».
Такой процесс обработки будет также полезен для исследователей, изучающих других животных с уникальными идентифицирующими их узорами: диких кошек, слонов, саламандр, рыб, пингвинов и морских обитателей. Систему можно натренировать, чтобы идентифицировать и обрезать фото до определённой области, представляющей интерес у данного вида.