Дорогие друзья!
Постепенно к сообществу проекта "Флора России" присоединяются всё новые пользователи. Изредка мы рассказываем о том, как взаимодействуют iNaturalist и GBIF.
Итак, Global Biodiversity Information Facility (https://www.gbif.org/) - это глобальная платформа-агрегатор данных о биоразнообразии. Их здесь очень много: 1 698 705 317 фактов присутствия того или иного вида в той или иной точке. Это и наблюдения, и образцы, и окаменелости, и литературные данные. Чтобы все эти данные оказались доступны в одном месте, 1677 организаций по всему миру объединили здесь свои 59 568 баз данных - больших и малых.
Любой пользователь может освоить несложную поисковую систему GBIF и найти то, что ему интересно. Система поисковых фильтров GBIF отличается богатым выбором настроек и стремительным отображением результатов, несмотря на гигантские объемы данных. Мой опыт показывает, что искать здесь отдельные наблюдения гораздо быстрее, чем на iNaturalist.
Конечно, среди баз данных о биоразнообразии есть очень большие массивы! Вот, как выглядит десятка самых больших:
А вот как выглядит другая десятка - с данными по сосудистым растениям.
Как видно из обоих списков, данные из iNaturalist являются одним из ведущих источников данных в GBIF - как по всем группам живых организмов, так и по сосудистым растениям.
На iNaturalist свыше 66 млн наблюдений, а в GBIF попадает лишь 28 млн. Почему? Дело в том, что одновременно:
Давайте сравним две ссылки на одно и то же наблюдение:
https://www.gbif.org/occurrence/2882925758
https://www.inaturalist.org/observations/61666594
Автор не указал своего настоящего имени в профиле, поэтому в GBIF он числится как "ctahkih". Не нужно менять ник - достаточно указать настоящее имя в профиле в соответствующем разделе. В паспорте наблюдения на iNaturalist есть ссылка на GBIF ("Это наблюдение размещено на 1 сайте: GBIF"), обратная ссылка на сайте GBIF имеется с момента заливки. Интересно и то, что это наблюдение было создано с помощью приложения Seek.
У GBIF своя номенклатура, которая автоматически стыкуется с названиями iNat, а также имеется в расширенном поиске фильтр по автору находки, так что можете выбрать и посмотреть, какие ваши наблюдения попали в GBIF. Недавно там появился поиск по административным единицам (правда, карта заложена 10-летней давности, так что границы Москвы и Подмосковья, например, старые).
Если вы хотите, чтобы ваши наблюдения попали в GBIF, то необходимо удостовериться, что у вас выставлена открытая лицензия. О том, как это сделать написано с иллюстрацией в этом посте: https://www.inaturalist.org/projects/flora-of-russia/journal/39331-obnovlen-massiv-dannyh-inaturalist-v-gbif-11-avgusta . Если у вас не проставлена лицензия, то в карточке каждого наблюдения у вас в правом нижнем углу написано "Все права защищены", если проставлена, то, как правило, - "Некоторые права защищены".
Отдельно отметим, что все топ-100 наблюдателей проекта "Флора России" перешли на свободные лицензии. Доля наблюдений проекта, заблокированных жёсткими лицензиями, сократилась до 11%! Это наше большое общее достижение в деле открытого доступа к данным о биоразнообразии. Большое спасибо, что не оставили без внимания предыдущие посты о GBIF. Возможно, в этот раз отклик будет еще шире.
Зачем всё это нужно?
Самый простой ответ заключается в том, что именно из GBIF исследователи выгружают данные о растениях, грибах и животных в удобном виде (csv-выгрузки). Каждая такая выгрузка получает doi, с помощью которого отслеживаются цитирования в научных исследованиях. Так, массив данных iNaturalist (https://www.gbif.org/dataset/50c9509d-22c7-4a22-a47d-8c48425ef4a7) процитирован через GBIF уже 1236 раз! Это рекорд среди всех участников GBIF.
ДОГОНЯЛКИ
Традиционно летом мы устраиваем догонялки с разными странами мира, глядя на оперативно обновляемые данные GBIF . Этим летом по разным поводам мы будем догонять Канаду, Мексику и США.
= Цель 1: догнать Канаду по числу наблюдений сосудистых растений из iNaturalist в GBIF =
Текущая раскладка такова:
Наше отставание 60,6 тыс. наблюдений. Посмотрим, что будет через недельку-другую.
= Цель 2: догнать Мексику по числу наблюдений сосудистых растений в GBIF (из всех баз) =
Здесь отрывы гигантские и, как кажется, за один полевой сезон не отыграются. Однако в этом зачёте участвуют все источники информации, поступающие в GBIF. Российские учреждения регулярно публикуют новые данные по флоре России (прежде всего, оцифрованные гербарные коллекции), поэтому разрыв будет быстро сокращаться. Пока наше отставание 1,4 млн записей.
= Цель 3: догнать США по числу наблюдений сосудистых растений из iNaturalist в GBIF на месячных отсечках =
Вот, что у нас за первые 13 дней мая:
Пока отставание в 3,8 раз. В прошлом году мы сокращали его до отметки в 1,6 раз. Посмотрим, что будет в этом году, особенно в летние месяцы.
На данный момент в GBIF индексируется уже 6,32 млн записей о биоразнообразии России - 6,17 млн с основной территории и 0,15 млн из Крыма. При этом, iNaturalist является самым большим по объему источником данных о природе России (занимает долю 22,3% по основной территории и 50,4% по Крыму). Эта доля постоянно растёт благодаря нашим усилиям.
Вот, какие массивы данных по биоразнообразию России являются крупнейшими сегодня:
Comentarios
Интересно, спасибо.
Agregar un comentario