Цифровые натуралисты
Текст: Алексей Кириллов | 2020-02-27 | Фото на заглавной странице: © fauxels / pexels | 3281
Всё сильнее и сильнее проникающая в нашу жизнь цифровизация, естественно, не могла не затронуть и науку. О том, как этот процесс происходит в биологии и как, казалось бы, очень простые по функционалу приложения типа iNaturalist, позволяющие по фотографии идентифицировать растение или животное, меняют лицо науки, мы поговорили с биологами Алексеем Серёгиным и Дмитрием Щигелем.

— Скажите, кто такие современные натуралисты, и почему они этим занимаются? Как вообще зарождалась гражданская наука, и почему она стала столь популярна сегодня?

Алексей Серёгин (А.С.): В течение очень длительного времени растения изучались учёными путём сбора биологических коллекций. Это традиционный способ познания действительности — мы до сих пор собираем огромное количество гербарных образцов. Так Гербарий Московского университета ежегодно растёт на 20 тысяч образцов — и это много. Но пик гербарных данных пришёлся на период с 1983 по 1985 год, после чего число вновь собираемых биологических образцов во всём мире постепенно пошло на убыль. Это было связано с развитием в биологии новых направлений, прежде всего — молекулярно-генетических исследований. Появление Интернета, а затем и цифрового фотоаппарата стало переломным моментом, когда из сбора гербарных материалов окончательно ушли любители, которые удовлетворяли своё любопытство в растениях, собирая гербарии, а в животных — коллекционируя жуков и бабочек. Поэтому примерно с 2003 года сбор коллекций снова стал сугубо профессиональной областью деятельности. Но вот, спустя 15 с лишним лет, я могу точно сказать, что любитель снова массово подключился к исследованиям, но уже через цифровые платформы — базы данных наблюдений «гражданской науки», такие как iNaturalist.

В итоге за очень короткий срок любительство в биологии, в сборе данных о биоразнообразии, во многих аспектах уже фактически заместило профессионалов, хотя многие учёные этого пока не понимают. Поэтому, когда кто-то из моих коллег с гордостью продолжает считать себя, условно говоря, единственным исследователем флоры Архангельской области, я говорю: «Дружище, у нас есть уже несколько тысяч фотографий, и они все структурированы в формате базы данных. Любители выполнили значительную часть твоей работы, собрав огромный объём информации. Не отворачивайся от неё, используй в своей работе». Но я думаю, что пройдёт ещё несколько лет, прежде чем мы преодолеем консерватизм и некоторую буферность сознания нашего учёного сообщества, и осознаем, сколь сильные изменения произошли в нашей науке с появлением цифровых платформ, что теперь со всем этим надо работать, и что в этом наше будущее. При этом любители, конечно, не заместят профессионалов: всё-таки наука — это не только сбор данных, но и их анализ и синтез с целью получить новые научные знания.

Дмитрий Щигель (Д.Щ.): Рост популярности «гражданской» науки и приток в неё любителей произошли благодаря революции смартфонов, потому что в них присутствует всё, что нужно, чтобы сделать точное профессиональное научное наблюдение. Только если раньше оно делалось в виде записи карандашом в дневнике, то теперь — путём лёгких постукиваний по экрану. Когда этот инструментарий был осознан, стали появляться такие системы как iNaturalist. Свойства смартфона, которые позволяют использовать его как очень эффективный полевой дневник — это наличие GPS, то есть способность определять координаты того места, где находится этот смартфон; часов, автоматически добавляющих дату сбора, и, конечно, камеры, с помощью которой фиксируется наблюдение. Кроме того, смартфон — вещь личная, как правило привязанная к какому-то определённому человеку, а значит, у нас появляются ещё и контактные данные сборщика.

Развитие социальных сетей и неугасающее любопытство людей к природе вокруг нас привело к тому, что люди стали использовать обычные соцсети, такие как Facebook и Instagram для того, чтобы задавать вопросы: «А что это такое? Помогите определить». До сих пор Facebook в группах обсуждений полон таких вопросов. На этой волне iNaturalist возник как проект, который решил направить поток этого интереса в тематическую платформу, позволяющую людям, которые делают наблюдения, и людям, которые способны определить вид организма по фотографии, встретить друг друга.

На самом деле, «гражданская наука» в её биологическом сегменте и такие платформы, как iNaturalist, никакой аналитической науки напрямую, конечно, делать не позволяют. Это системы, которые дают возможность непрофессионалу делать профессиональные наблюдения, и в этом их главная ценность — в демократизации процесса сбора научных данных. Наверно неплохо, что это называется громким словом «наука», но наука — это аналитическая, в крайнем случае — описательная деятельность, которая требует определённых навыков. Дополнительный важный момент заключается в том, что iNaturalist объединяет людей с профессиональными знаниями, с богатым опытом в каких-то группах видов и навыком определения, и людей, которым просто интересно, что живёт вокруг них.


©msu.ru

Работа с гербарными образцами.

— Отношение научного сообщества к таким платформам в целом единое, либо всё-таки есть разные мнения?

Д.Щ.: Единым отношение назвать трудно. Но здесь есть ещё и такой важный фактор: до последнего времени в науке (я вспоминаю моменты со своего обучения на биофаке МГУ) было принято полагаться на свои собственные данные — те, которые ты собрал самостоятельно. Хотя, конечно, в такой работе, как ревизия какой-то группы, описание каких-то видов, это невозможно — нужно изучать коллекции, в которых кроме собственных материалов будут и другие.

Надо сказать, что iNaturalist — относительно новый игрок на этом поле — и в России, и за рубежом существует несколько других платформ: по птицам, по растениям, по грибам и так далее. Те, кто занимается микроскопическим или молекулярным анализом, смотрит на всё это очень свысока и часто считает глупостью, которая хорошо срабатывает только с бабочками и одуванчиками, но не с какими-то сложными вещами. Я и сам прошёл эволюционный путь от достаточно скептического отношения, что эта игрушка в телефоне мало чем отличается от ловли покемонов, к осознанию того, что огромные массивы данных в таком объёме и с такой скоростью силами профессионалов собрать невозможно в принципе. В мире в самых разных странах, в том числе и с очень мощной, развитой наукой, где её господдержка осуществляется на самом высоком уровне, профессионалов всё равно недостаточно — нет такого количества людей, которые могли бы собирать такие объёмы данных, будучи профессиональными учёными с грантовским или постоянным финансированием.

При этом огромному количеству людей страшно любопытно, что живёт вокруг них. Это любопытство может возникнуть на прогулке в ближайших окрестностях дома, но чаще всего люди начинают удивляться чему-то необыкновенному, увиденному, например, в отпуске, — они это фотографируют, выкладывают сначала в обычные соцсети, но рано или поздно приходят к более-менее тематическим системам, таким как iNaturalist.


©Inaturalist

Интерфейс Inaturalist.

— На это, наверное, влияет и тот факт, что сейчас меняется лицо туризма: люди стараются забираться в максимально недоступные места — туда, куда и учёные-то зачастую ещё на добрались.

Д.Щ.: Да, я думаю, что прирост увлечённых людей будет проявляться как раз через туризм. Чтобы делать наблюдения не нужно даже быть в этот момент онлайн — достаточно возможностей встроенного GPS и камеры. Делаешь несколько десятков кадров во время отпуска, и уже потом получаешь возможность понять, что ты, собственно, видел.

— Как именно учёные могут использовать информацию из iNaturalist?

А.С.: Самое главное, что даёт iNaturalist — это csv-выгрузки данных. Они содержат и гиперссылки на фотографии, хотя сами фотографии учёным нужны редко — только для того, чтобы при необходимости проверить определение. Чаще всего нужны данные о том, где растёт то или иное растение — это основной источник пространственных данных о биоразнообразии. Второй момент, очень важный — документация фенологических фаз (прим.ред.: этапы сезонного развития растения) в режиме реального времени. Ну и естественно, что есть такие простые вещи, как возможность посмотреть ареал вида, экспансию каких-то заносных видов и т.д.

Для учёных важно то, что все эти данные вливаются в GBIF (прим.ред.: Глобальная информационная система по биоразнообразию, www.gbif.org). Как правило, учёные берут данные для глобальных обобщений не из iNaturalist напрямую, а через портал GBIF, где агрегируются 50 тысяч баз данных, и где сейчас висит 1 миллиард 400 миллионов точек в свободном доступе. iNaturalist даёт туда только 13 миллионов точек (всего в iNaturalist 32 миллиона точек, но исследовательского уровня достигли только 13 миллионов). Также часть наблюдений блокируется настройками лицензий: пользователь может поставить на своём изображении «All rights reserved» и тогда в GBIF оно отображаться не будет. Но именно из GBIF берутся данные для моделирований, отслеживания влияния изменений климата на биоту, установления трендов по годам. Приведу пример. Вокруг Антарктики плавает криль — основная кормовая база китов. Благодаря тому, что накоплено достаточное количество наблюдений, подтверждающих, что в Южном океане живёт только один вид криля (в этом учёных убеждают все коллекции, все фотографии), были построены очень точные модели распространения этого вида, биомасса которого, кстати, является самой высокой из всех видов живых существ на Земле.

А вот другой пример, демонстрирующий подходы учёных к работе с цифровыми базами (в данном случае – с Цифровым гербарием МГУ). У любых данных есть так называемая ошибка отбора данных (bias). Где люди чаще всего фотографируют растения или животных? Очевидно, что в тех местах, которые наиболее доступны. Поэтому чтобы сделать из этой выборки, которая смещена в сторону более доступных мест, реально нормированную, случайную выборку, мы должны понять, какие параметры на неё влияют. Вводим туда сеть дорог — и видим положительную корреляцию с сетью дорог (можно даже детализировать до дорог 1,2,3-го уровня). В азиатской части России будет проявляться и отличная корреляция данных с долинами рек, потому что все населённые пункты располагаются вдоль них, и там данные смещены именно к рекам, а вот с водоразделов информации мало. Только после нормировки этих данных, которую можно сделать лишь имея гигантский массив информации (он сам про себя скажет, в какую сторону он смещён), мы можем переходить к научному анализу. Любой продвинутый учёный, после того, как он получит данные через GBIF, проводит огромную аналитическую работу, на основании которой делает вывод, можно ли эти данные использовать, а если нельзя — то как их «покрутить», чтобы было можно.

© Florida Fish and Wildlife / Andy Wraithmell

© Florida Fish and Wildlife / Andy Wraithmell

© Florida Fish and Wildlife / Andy Wraithmell

Ежегодно в течение нескольких дней iNaturalist проводит международный чемпионат City Nature Challenge. В прошлом году в нём приняли участие более 35 тысяч человек со всего мира. В 2020 году, в лице трёх городов (Москва, Курск, Севастополь) к чемпионату впервые присоединится и Россия. На фото: биоблиц, организованный Флоридской комиссией по охране рыб и дикой природы во время City Nature Challenge в 2019 году. Округ Леон, Флорида.

— А насколько достоверными вообще можно считать данные, появляющиеся в таких базах как iNaturalist? Кто, например, обеспечивает правильность определения видов загружаемых наблюдений?

А.С.: При загрузке изображения в систему, в первую очередь его анализирует искусственный интеллект. У него два входных параметра. Первый называется «визуально похожий» (англ. «visually similar»). Второй параметр — это точка съёмки, благодаря которой искусственный интеллект пересчитывает данные с соседних наблюдений — что из того, что похоже, может произрастать, бегать или прыгать в этой местности. В iNaturalist сейчас занесено 250 тысяч видов живых организмов и свыше 30 миллионов наблюдений разного уровня. На таком гигантском массиве данных система самообучается. Примерно в 80% случаев система даёт верную оценку вида. В случае с оставшимися 20% свои коррективы вносят эксперты, после чего система запоминает внесённые изменения. Теоретически экспертом может выступать любой человек. Но в основном это, конечно, учёные, потому что главное, что привлекает экспертов в этой монотонной, ежедневной, очень напряжённой работе по просмотру фотографий, которые люди загрузили в течение дня — это, чаще всего, научный интерес.

Д.Щ.: Участие экспертного сообщества здесь очень важно, потому что если два или больше участников iNaturalist соглашаются с какой-то интерпретацией наблюдения, то при наличии координат такая запись получает тот самый «исследовательский уровень». Это достаточно грубое деление на исследовательские и неисследовательские записи, но тем не менее, оно позволяет осуществлять первичную сортировку. В пределах этого исследовательского уровня, конечно, есть и ошибочные определения, но они есть и в любой коллекции — в любом гербарии и в любом зоологическом собрании. Мы, скорее всего, никогда не приблизимся здесь к абсолютным значениям, но зато можем постоянно это улучшать. И тот факт, что этот цифровой пул фотографий продолжает оставаться доступным, означает, что изначально какие-то неточные или размытые определения могут быть уточнены в будущем. А за счёт того, что это всё осуществляется через Интернет, смартфоны и компьютеры, то изменения и улучшения происходят с колоссальной, по сравнению с традиционными коллекциями, скоростью. Как правило, сбор данных делается при помощи смартфона или камеры с встроенным GPS приемником, а редактировать, определять и обсуждать наблюдения и проекты удобнее на компьютере.

А.С.: Здесь напрашивается сравнение — поскольку я работаю в московском гербарии, то можно сравнить те данные, которые мы получаем из iNaturalist и те данные, которые есть в гербарии. Существует некоторый набор требований, который мы предъявляем к сдаваемым исследователями гербарным сборам, и на сегодняшний день определение самих коллекций не является требованием, т.е. это не является обязательной информацией. Строго говоря, коллектор не обязан определять свои сборы, потому что мы в гербарии можем положить их по родам, по семействам или отправить в неопределённые, исходя из своих собственных знаний. Мы прекрасно понимаем, что эта научная обработка коллекций часто останавливает людей от быстрой передачи своих сборов в гербарий. Таким образом, где растение собрано, кем оно собрано, когда собрано — эта информация обязательна, а ответ на вопрос, что это за вид — является мнением, т.е. наука наукой, но любое определение по сути является мнением конкретного исследователя. Есть конвенция по поводу определения того или иного вида, но, тем не менее, в будущем это мнение может быть улучшено, уточнено в свете исторических исследований, молекулярных ревизий.

Д.Щ.: Тут важно вернуться к термину «гражданская наука», который мне не совсем нравится, но лучшей замены ему пока не найдено. Алексей сказал очень важное слово — «коллектор». Это довольно старомодный термин, но здесь он использован очень кстати. Для того, чтобы быть профессиональным коллектором физического материала, такого, как гербарий, поступающий в Гербарий МГУ, или цифрового материала, который накапливается в таких системах, как iNaturalist, вовсе необязательно быть профессиональным учёным. Конечно, «гражданский коллектор» звучит, может быть, не так гордо, как «гражданский учёный», но это более честный термин, и он более точно описывает суть этой деятельности, и в принципе для людей, которые этим занимаются, разницы большой в этом нет. Чувство общности и возможность относительно быстро получить какую-то реакцию на свои наблюдения или определения — это то, что работает в соцсетях: любой пост, любая фотография, короткий текст в Twitter вызывает достаточно быструю реакцию.

Людям, как мне кажется, свойственно интересоваться природой вокруг них, но при этом те, кто достаточно глубоко этим интересуется, если только они не живут в больших городах и имеют возможность общаться с такими же интересными людьми, ведут довольно одинокую жизнь. Я часто бываю в одной деревне в Псковской области, и там живёт мальчик лет девяти — очень увлечённый человек, который интересуется насекомыми. Но ни учительница биологии в местной школе, ни библиотекарь в библиотеке, ни его одноклассники, ни его родители в принципе не способны как-то поддержать его интерес. Скорее всего, с годами у него появится смартфон, и он наверняка рано или поздно доберётся до iNaturalist, и это позволит ему быть более счастливым «профессиональным коллектором», общаться в цифровой среде себе подобных, если уж совсем нет возможности общаться в среде реальных людей со схожими интересами. Мне кажется, что это очень важный фактор, особенно в условиях размера такой страны, как Россия.

©Florida Fish and Wildlife / David Moynahan

© Florida Fish and Wildlife / Liz Sparks

City Nature Challenge в Таллахасси, Флорида.

— Можно ли говорить о том, что для науки, в том числе в рамках исследования биоразнообразия, какая-то информация является совершенно бесполезной? Например, когда много людей загружают фотографии листка липы из Подмосковья, при том, что все и так прекрасно знают, что это липа, и что в данном регионе она произрастает.

А.С.: На мой личный взгляд, такая информация бесценна, да и цифровые данные «карман не тянут». Вы можете спросить любого ботаника: как только ты начинаешь заниматься каким-то вопросом, оказывается, что данных очень мало. Соответственно, эти фотографии, наблюдения находят своё место на карте, в базе данных, и в какой-то момент могут быть востребованы. Это очень важно, и тут дело в том, что мы не знаем (чаще это связывают с глобальным изменением климата), в какой момент какое-то обычное растение или обычное насекомое вдруг станет редким. Такие случаи есть: в Подмосковье в XX веке численность, казалось бы, самых обычных растений кардинальным образом изменилась в худшую сторону. И в обратном направлении это тоже работает: не было чего-то, например, американского клёна, а потом вдруг пошёл вал его находок.

Д.Щ.: Важно сказать, что даже если данные генерируются в рамках какого-то проекта и ясно, зачем эти наблюдения делаются, то когда они попадают в общий океан данных, их повторное и дальнейшее использование предсказать невозможно. Поэтому бесполезных данных в долгосрочной перспективе нет — где, когда и кому, в каком контексте понадобится какая-то точечная информация, предсказать нельзя.

— А бывает ли такое, что с помощью iNaturalist и ей подобных систем совершаются открытия каких-то новых видов животных или растений?

А.С.: Да. Новые виды, особенно из тропиков регулярно описывают по фотографиям с Flickr, с Facebook. Кто-нибудь сфотографировал редкую орхидею, выложил — люди начали выяснять, что это такое, определяют до рода, находят специалиста по роду, а тот говорит: «А у вас новый вид». Что касается открытий меньшего ранга, то за прошедший год в iNaturalist было загружено, если не ошибаюсь, 4 новых вида — и это только для флоры Москвы и области. Поскольку эта территория является одной из самых хорошо изученных в России, и на ней ведётся ежегодный постоянный мониторинг адвентивных видов (прим.ред.: то же, что и заносных — не свойственных данной местности), то 4 новых вида — это очень большое достижение. Именно после этого топ-эксперт нашего проекта на iNaturalist Сергей Майоров, который является автором «Адвентивной флоры Москвы и Московской области», сказал, что ради этих четырёх наблюдений не зря он определял остальные 50 тысяч.

© Bridger Teton NF / flickr

© Pavel Hrdlička / wikimedia

©Florida Fish and Wildlife / David Williams

Пользователи iNaturalist могут инициировать в системе собственные исследовательские проекты. Что любопытно, такой возможностью пользуются не только учёные, но даже дети, в рамках школьных заданий-проектов или просто потому, что им это жутко интересно.

— Алексей, насколько мы знаем, iNaturalist позволяет запускать ещё и собственные исследовательские проекты, и такой возможностью вы воспользовались. Расскажите, какие задачи вы при этом ставили и что интересного, неожиданного получили?

А.С.: Начну с того, что в области знаний о биоразнообразии сейчас меняется парадигма — каждый год в GBIF заливается в 2 раза больше данных, чем за предыдущий год. В какой-то момент окажется (году эдак в 2023-24), что за год в GBIF будет залито столько же данных, сколько за всю историю существования всех естественных наук (в этом смысле мы уже довольно близки к «точке технологической сингулярности»). И все эти данные имеют огромную ценность. Сейчас я довольно легко оперирую разными цифрами и фактами, но если бы мне 2 года назад рассказали, что вскоре я смогу так делать, то я бы просто по-хорошему рассмеялся, потому что тогда ничего этого ещё не было. В 2016 году iNaturalist был лишь калифорнийской «развлекухой», в 2017-м — стал внутриамериканским. Впервые я услышал о нём в августе 2017 года, будучи на Международном ботаническом конгрессе в Шэньчжэне (Китай). Я долго присматривался к iNaturalist, и где-то через год, когда понял, насколько грандиозны возможности системы, решил запустить там проект. Дело в том, что моя основная работа заключается в том, что мы на основе Гербария Московского университета создаём самую большую базу данных о биоразнообразии в России, которая называется «Цифровой гербарий МГУ». Это полностью моё детище, от начала и до конца — я живу этим каждый день, и все коллекции, которые мы привозим в Гербарий, проходят через оцифровку. Параллельно мы начали создавать атлас флоры России как некую гигантскую универсальную базу данных, и для пополнения информации запустили на iNaturalist проект по сбору данных по флоре Москвы. Позднее это вылилось в работу по созданию атласа флоры всей России — мы стали добавлять региональные проекты по всем 85 субъектам страны. Мы всячески старались сподвигнуть людей делать наблюдения и загружать фотографии на iNaturalist, организовывали соревнования между регионами. Это сработало, и вскоре у нас даже появились подражатели — запустились подобные нашему проекты по грибам, по заповедникам.

Если вы посмотрите на статистику, то увидите, что по количеству записей в нашем проекте лидирует Москва, имеющая свыше 25 тысяч наблюдений. Далее идут Подмосковье и Приморский край. Периодически кто-то кого-то опережает, но восьмёрка наиболее представленных регионов стабильна уже несколько месяцев, потому что там сформировались самые большие комьюнити. Но нам хотелось пробудить интерес и у тех, кто находится внизу списка, и мы придумали формат Кубка. Кубок по фотофиксации проходил по выходным: первые выходные мая — 1/32 финала, и так, постепенно, к августу мы дошли до финала. Кубок выиграла Брянская область, а в финале с ней боролись Омская и Ярославская области, а также Дагестан.

Но можно соревноваться не только между регионами, но и между странами. Не так давно Россия по объёму данных, загруженных в iNaturalist, обогнала Италию и вышла на 8-е место. Сейчас из России зарегистрировано свыше 500 тысяч наблюдений по всем видам живых организмов, в то время как в декабре 2018 года их было всего 34 тысячи, т.е. фактически за год мы увеличили объём данных в 15 раз. И это цифры, которых без этого проекта не было бы.

Д.Щ.: В заключение, хотел бы заметить, что цифровые инструменты управления данными и массовые инициативы, такие как iNaturalist — это чрезвычайно мощные возможности, как для науки, так и для удовлетворения любопытства. Поразительно, что собирать, определять, и получать доступ к данным о жизни на земле сегодня может каждый, а мобильные приложения открывают эти возможности как школьникам, так и профессионалам. Мы рассказали тут длинную, но неполную историю, и приглашаем всех желающих присоединиться к нашему сообществу цифровых натуралистов.


Подписаться на новыe материалы можно здесь:  Фейсбук   ВКонтакте


закрыть

Подписывайтесь на нас в Facebook и Вконтакте