Публикация научных статей.
Вход на сайт
E-mail:
Пароль:
Запомнить
Регистрация/
Забыли пароль?

Научные направления

Поделиться:
Статья опубликована в №4 (декабрь) 2013
Разделы: Биология, Информационные технологии
Размещена 29.12.2013. Последняя правка: 28.12.2013.
Просмотров - 3186

База данных биоразнообразия Богдинско-Баскунчакского заповедника: опыт решения проблемы представления топографических объектов в биологических базах данных

Гребенников Константин Алексеевич

нет

Федеральное государственное бюджетное учреждение "Государственный природный заповедник "Богдинско-Баскунчакский"

заместитель директора по научной работе

Аннотация:
В статье рассматриваются проблемы представления в существующих биологических базах данных топографических объектов и пути решения данных проблем, использованные при создании базы данных биоразнообразия Богдинско-Баскунчакского заповедника.


Abstract:
Recently present problems in biological databases in representation of topographic objects and means of solution of the problems, which was used in the building of biodiversity database of state reserve “Bogdinsko-Baskunchakskiy”, in the article are considered.


Ключевые слова:
биоразнообразие, базы данных, геоинформация, заповедник «Богдинско-Баскунчакский»

Keywords:
biodiversity, databases, geoinformation, state reserve “Bogdinsko-Baskunchakskiy”



УДК 574.9:004.652

Изучение и сохранение естественного разнообразия живых организмов – одна из важнейших задач современности, что отражено во всех основополагающих нормативных актах природоохранной направленности, начиная с Конвенции о биологическом разнообразии, принятой в Рио-де-Жанейро в 1992 г. и ратифицированной Российской Федерацией в 1995. Особое значение эта задача имеет на особо охраняемых природных территориях, в первую очередь – территориях с заповедным режимом, к которым относится государственный природный заповедник «Богдинско-Баскунчакский», созданный в 1997 году. В современную цифровую эпоху основным инструментом накопления и анализа данных о существующем биоразнообразии и его изменениях служат соответствующие электронные базы данных (далее в тексте – БД) различного масштаба и специализации.

Чрезвычайно важным атрибутом любого объекта биоразнообразия, сведения о котором вносятся в базу данных, является его пространственное размещение. Современные системы глобального позиционирования (GPS, Глонасс) общедоступны и позволяют с высокой точностью проводить позиционирование положения объекта либо наблюдателя в географической системе координат. Однако, не смотря на широкое внедрение таких технологий в практику исследования биоразнообразия, представление в существующих биологических БД геоинформационных данных в текущий момент не может быть признано удовлетворительным.

Прежде всего – отсутствует общепринятая единая архитектура данных о биоразнообразии – БД создаются, как правило, стихийно и без связи с какими-либо уже существующими информационными ресурсами и вне контекста последующей автоматизированной обработки данных. Соответственно, это относится и геоинформационным данным, включаемым в БД. Однако в представлении информации о геопозиционировании объекта биоразнообразия, на наш взгляд, существует еще более принципиальная проблема, которая не может быть решена практически ни в одной из существующих структур данных.

Принципиальной ошибкой, на наш взгляд, является представление топографического объекта, каковым является указываемая практически во всех существующих биологических БД исключительно точка с координатами, как атрибута объекта биоразнообразия. Таким образом, топографический объект лишен самостоятельности в представлении данных и не может иметь своего набора атрибутов. В действительности же все наблюдения, проводимые в природе, относятся не к точечному, а площадному либо линейному топографическому объекту (популяции организмов или учетной площадке, занимающей определенный объем пространства; учетному маршруту или трансекте определенной протяженности, направленности и формы). Очевидно, что такой объект имеет свой набор атрибутов, не связанных напрямую со свойствами собственно объекта биоразнообразия. Попытки создания в БД «атрибута атрибута» (такого, как «точность координат») принципиально не решают данную проблему.
Указанная проблема касается, в частности, БД редких и охраняемых растений Волгоградской области, в разработке и внедрении которой автор принимал участие ранее [1]. В указанной БД пространственное размещение популяции растений рассматривается как ее атрибут и представляется двумя полями БД – широта и долгота. При указанной в БД площади ряда популяций, составляющей несколько километров (и в натуре соответствующей площадному объекту сложной формы) такой подход сильно усложняет принятие природоохранных решений (для чего данная БД, в первую очередь, и была создана). Становится невозможным определить, на каких именно участках должны быть проведены соответствующие мероприятия по сохранению популяции.

Во вновь создаваемой БД биоразнообразия Богдинско-Баскунчакского заповедника на основе анализа современной практики и существующих технологий автор предпринял попытку устранения данных недостатков. Безусловно, наилучшим решением при разработке архитектуры новой БД было бы использование уже широко используемых структуры и формата данных. В настоящее время существуют подробно документированные схемы данных и соответствующие языки разметки на основе стандарта XML (eXtensible Markup Language) [4], так или иначе представляющие данные о биоразнообразии. Гибкость стандарта XML, совместимость его с большинством существующих систем управления базами данных – делают вполне разумной использование его при создании БД как формата для хранения и передачи данных. Однако ни в одной из разработанных схем данных не решается проблема, сформулированная выше.

Наиболее проработанные и получившие широкое распространение (однако почти не используемые в России) схемы данных носят название Darwin Core [3] и Access to Biological Collections Data (ABCD) [8]. Данные схемы разрабатываются и поддерживаются международной ассоциацией «Biodiversity Information Standards (TDWG)». Эти схемы используются во многих международных и национальных научных проектов. Например, в Global Biodiversity Information Facility (GBIF) [5] – международной структуре, накапливающей данные о биоразнообразии и предоставляющей к ним доступ с помощью портала в информационной сети Интернет. При всех достоинствах указанных форматов данных их наибольшим и не исправимым, по мнению автора, недостатком является именно привязка наблюдения вида к точечному топографическому объекту. Следует отметить, что разработчики стандартов понимают ограниченность такого подхода и пытаются решить проблему упомянутым «традиционным способом» - вводя в схему данных элементы, подобные «AccuracyStatement» (описание степени точности координат) и «CoordinateErrorDistanceInMeters» (ошибка координат в метрах) в ABCD. В случаях, когда нахождение объекта имеет привязку к значительному по площади либо протяженности топографическому объекту (что особенно характерно для записей БД, являющихся интерпретацией литературных данных – что часто имеет место в БД GBIF), данный подход приводит к существенному искажению данных. Привязка находки (встречи) объекта биоразнообразия к административной или географической области превращается в привязку к кругу на местности, выходящему далеко за пределы территории, где наблюдался объект. Увеличение числа точек координат до определенного дискретного количества (используемое как в некоторых других стандартах, так и в прикладных БД) также не является решением рассматриваемой проблемы, лишь превращая произвольный круг на местности в столь же произвольный многоугольник. Следует отметить, что использование подобных стандартов во вновь создаваемых сетях учета и мониторинга (например, сети мониторинга биоразнообразия в Арктике [2]) представляется автору «миной замедленного действия», закладываемой в них разработчиками. Результатом такой практики неизбежно становится накопление большого объема данных, не пригодных для принятия адекватных управленческих (прежде всего – природоохранных) решений по причине невозможности адекватной интерпретации данных служебных БД.

Таким образом, подобные архитектуры данных, не отражающие естественной связи объекта биоразнообразия и объема пространства, в котором он был найден – автор не может считать приемлемыми. Решение поставленной проблемы путем интеграции БД биоразнообразия с общей геопространственной БД также представляется автору не оптимальным решением, так как при этом не обеспечивается целостность данных о биоразнообразии в их полноте. Кроме того, архитектура единой геопространственной БД служит решению более широкого круга задач и не всегда соответствует нуждам специализированных видов работ, к каковым относится изучение разнообразия биологических организмов. То есть даже в случае использования такого подхода автор считает более рациональным создание отдельного раздела (модуля) пространственной БД с соответствующей архитектурой.

В силу вышеизложенного, при создании архитектуры БД биоразнообразия Богдинско-Баскунчакского заповедника с целью устранения рассматриваемой проблемы была разработана собственная оригинальная схема данных. Прежде всего, основными принципами, на которых основана архитектура созданной БД, являются модульность и расширяемость. Каждый класс объектов (коллекционные образцы, литературные указания, наблюдения, учетные площадки и маршруты и др.) представлен независимым модулем БД, связанным с другими модулями лишь ссылкой на идентификаторы их объектов. По мнению автора, это единственный подход, позволяющий в рамках одной БД объединить сведения о динамически изменяющемся множестве разнородных объектов. Соответственно, БД может быть в любой момент ее эксплуатации дополнена новым классом объектов путем добавления нового модуля, не внося изменений в уже существующие модули. В данной структуре самостоятельным модулем является и модуль геоинформационных данных, содержащий наборы данных о топографических объектах, связанных с объектами других модулей (атрибутом объектов в других модулях является идентификатор топографического объекта).

Внутренняя структура данного модуля (как и прочих) построена также на принципах сохранения естественной структуры накапливаемых данных и возможности расширения этой структуры в дальнейшем. В БД используются имена классов, объектов и атрибутов, записанные буквами латинского алфавита в кодировке UTF-8 стандарта Юникод. Содержимое базы может быть представлено символами национальных алфавитов (прежде всего - кириллицы) в той же кодировке. Базовым классом модуля является класс «раздел» (partition), имеющий атрибуты «имя» (name – уникальное имя) и «описание» (description – произвольное текстовое описание). Каждый из таких классов имеет дочерний класс «местонахождение», представляющий собой собственно топографический объект. Его атрибутами являются:
1. Номер (location) – уникальный идентификатор объекта.
2. «Описание» (description) – произвольное текстовое описание объекта.
3. «Иерархия» (hierarchy) – описание положения объекта в иерархии административного деления.

Традиционное представление этой информации в виде фиксированного набора атрибутов «страна-область-район» и так далее, на наш взгляд, не практично, так как объект может располагаться в двух и более соответствующих выделах. Кроме того, для части объектов может возникнуть необходимость отнесения их к какой-либо области, не имеющей принципиального значения для других объектов. Следует также отметить, что данный атрибут носит лишь справочный характер, и действительное вхождение участка в какую-либо географическую область следует определять соотнесением топографических объектов с использованием пространственных функций, имеющихся во всех распространенных системах управления БД. Для использования этих функций в БД существуют отдельные топографические объекты, соответствующие границам заповедника, его участков, прилегающего заказника и т.д. на определенный момент времени. Это позволяет, на наш взгляд, в будущем (при возможном изменении административных границ) избежать разночтений в толковании административного положения объектов.

4. «Источник» (source) – способ получения исходных данных о границах топографического объекта. Содержит наименование аппаратуры, с помощью которой проводилось позиционирование, либо описание способа иного получения данных (по карте, космическому снимку, имеющему привязку к системе географических координат, и т.п.). Здесь же может содержаться информация о возможной степени отклонения в исходных данных. Создание отдельного атрибута «точность» автор считает не целесообразным, так как объективное определение действительного отклонения полученных данных от положения объекта на местности, как правило, не возможно. Соответственно, такой атрибут носит исключительно субъективный характер и не сообщает новых объективных сведений об объекте.

5. «Автор» (author) – сокращенное имя автора, создавшего объект, его описание и определившего координаты границ объекта. Данный атрибут является ссылкой на модуль БД, содержащий сведения о специалистах, принимавших участие в формировании представленных в ней данных.

Каждое «местонахождение» может состоять из одного или нескольких элементарных неделимых топографических объектов, представленных дочерним классом «место» (placemark). В свою очередь данный класс имеет ряд атрибутов (дочерних классов не имеет):
1. Номер (placemark) – уникальный идентификатор объекта.
2. «Тип» (type) – указание одного из допустимых типов объекта: Point (точечный объект), LineString (линейный объект), Polygon (площадной объект).
3. «Координаты» (coordinates) – набор координат точек объекта. Наборы координат точек даются в соответствии со стандартом Keyhole Markup Language (KML) [6] – языком разметки стандарта XML – широко используемым стандартом, совместимым с большинством используемых геоинформационных систем (ГИС). Хранение данных в такой форме обеспечивает возможность интеграции БД биоразнообразия с локальной ГИС заповедника. Кроме того, данный стандарт предполагает унифицированное представление геоинформационных данных. Данные представляются в системе координат World Geodetic System 1984 (WGS-84) [7], высоты указываются относительно высоты над уровнем моря. Поддержка различных систем координат, включая местные (предусмотренная в рассмотренных выше существующих архитектурах данных) – представляется автору не целесообразной, искусственно создающей лишние сущности и нарушающей целостность данных, в связи с чем соответствующий атрибут объекта в структуре данных отсутствует.

Описанная выше схема данных может быть реализована как в виде текстового файла стандарта XML с соответствующей разметкой, так и в виде реляционной БД любой из распространенных систем управления базами данных. Структура данных позволяет описывать пространственные объекты любой сложности в трехмерной системе координат, включая составные объекты (представляющие собой массив точек и (или) линий, полигонов). Таким образом, обеспечивается возможность точного описания объема пространства, в котором находится либо наблюдался объект биоразнообразия, что особенно важно для небольших по площади территорий – таких, как территория Богдинско-Баскунчакского заповедника. Гибкость структуры данных при строгой стандартизации представления отдельных блоков информации позволяют, с одной стороны – использовать архитектуру для самого различного круга задач (в том числе выходящих за пределы области изучения биоразнообразия), с другой – гарантируют универсальность передачи данных и их совместимость с другими БД и вычислительными системами.

Следует отметить, что, не смотря на то, что данные о высоте расположения топографических объектов собственно на территории Богдинско-Баскунчакского заповедника имеют не большое значение в связи с малыми перепадами высот – данный параметр может иметь принципиальное значение на иных территориях. В связи с этим автор посчитал необходимым учесть этот параметр при разработки архитектуры, которая может быть использована в иных областях либо масштабирована на большую площадь.

Таким образом, можно утверждать, что при разработке архитектуры БД биоразнообразия Богдинско-Баскунчакского заповедника было получено оригинальное решение проблемы представления геопространственной информации, существующей в большинстве используемых архитектур данных, включая наиболее распространенные. Описанная в статье масштабируемая гибкая структура данных может быть использована как при описании состава, структуры и распределения биоразнообразия, так и при решении более широкого круга управленческих и природоохранных задач. Соответствие используемых форматов представления информации универсальным открытым международным стандартам в значительной степени решают проблему поддержки информационных систем, построенных с использованием такой архитектуры, и свободного обмена данными в целях координации работ по изучению и сохранению биоразнообразия.

Библиографический список:

1. Агеева С.Е., Круглова Л.Н., Гребенников К.А., О.И. Коротков О.И. Ведение учета редких и исчезающих растений Волгоградской области. // Вестник Балтийского федерального университета им. И. Канта. Калининград: Изд-во БФУ им. И. Канта, 2012. Вып. 7. С. 118-121.
2. Создание комплексной устойчивой сети мониторинга биоразнообразия в Арктике [Электронный ресурс] // CAFF CBMP Report No. 14. Март 2008. URL: http://library.arcticportal.org/1527/1/CBMP_Implementation_Plan_RUSS.pdf (дата обращения: 26.12.2013)
3. Darwin Core [Электронный ресурс] URL: http://rs.tdwg.org/dwc/ (дата обращения: 26.12.2013)
4. Extensible Markup Language (XML) [Электронный ресурс] URL: http://www.w3.org/XML/ (дата обращения: 26.12.2013)
5. GBIF Portal - Home [Электронный ресурс] URL: http://www.gbif.org/ (дата обращения: 26.12.2013)
6. KML | OGC(R) [Электронный ресурс] URL: http://www.opengeospatial.org/standards/kml (дата обращения: 26.12.2013)
7. NGA: DoD World Geodetic System 1984 [Электронный ресурс] URL: http://earth-info.nga.mil/GandG/publications/tr8350.2/tr8350_2.html (дата обращения: 26.12.2013)
8. TDWG: Access to Biological Collections Data [Электронный ресурс] URL: http://www.tdwg.org/activities/abcd/ (дата обращения: 26.12.2013)




Рецензии:

30.12.2013, 9:29 Сорокопудов Владимир Николаевич
Рецензия: Статья Гребенникова К.А, посвящена актуальной теме, написана грамотно, представлена единая архитектура данных о биоразнообразии для создания баз данных по заповедникам России. Считаю, что статья соответствует для публикации в данном журнале. Рецензент: д-р с.-х.наук, проф. В.Н.Сорокопудов

31.12.2013, 19:32 Назарова Ольга Петровна
Рецензия: Грамотно изложен материал. Рекомендуется к печатию

16.07.2014, 15:52 Остапенко Ольга Валериевна
Рецензия: Рекомендую статью печати.



Комментарии пользователей:

Оставить комментарий


 
 

Вверх