Цифровой Почвенный Музей: концепт (2015)

Авторский архив научных публикаций по почвоведению и наукам о Земле
Ответить
Аватара пользователя
Ortstein
Администратор форума
Сообщения: 84
Зарегистрирован: Сб фев 23, 2013 5:28 pm

Цифровой Почвенный Музей: концепт (2015)

Сообщение Ortstein »

Код: Выделить всё

Рыбальский Н. Н., Долгинова В. А. Цифровой почвенный музей: концепт // Использование и охрана природных ресурсов в России. — 2015. — № 3. — С. 25–29.

УДК 631.4
ЦИФРОВОЙ ПОЧВЕННЫЙ МУЗЕЙ: КОНЦЕПТ

Н.Н. Рыбальский, В.А. Долгинова
Факультет почвоведения МГУ им. М.В. Ломоносова

Анонотация: В статье дается обоснование острой необходимости сохранения и публикации почвенных данных, как исторических, так и современных. Рассматривается open source концепция работы с данными. Дается обзор состояния почвенных ресурсов в интернете. Поставлен вопрос об использовании медиатехнологий для популяризации почвоведения. Проанализированы основные средства работы с большими объемами почвенных данных. Проведен обзор возможностей представления почвенных данных в интернете виртуальными музеями и другими ресурсами. Представлена концепция Цифрового Почвенного Музея.

Ключевые слова: Цифровой почвенный музей, почвенный музей, почвенная информационная система, почва, почвоведение, база данных, музей, IT, интернет, архив, хранилище, медиа, коллекция, сбор данных, хранение данных, форма хранения, формализация, оцифровка, модель, почвенное наследие, open source, философия.


Введение

Научная эпоха накопления данных перешла в эру их обработки при помощи информационных технологий (ИТ). Благодаря интернету представители разных областей знаний получили доступ к данным своих коллег и, применяя синергетический подход, способны решить задачи, которые до недавнего времени считались фантастическими.

К сожалению, в почвоведении новая эра еще не наступила – существующие сетевые электронные средства работы с большими объемами данных в рамках данной предметной области оказались уделом узкого круга специалистов и пока что не в силах предоставить удобных инструментов для публикации научных данных и коммуникации ученых. Речь идет в первую очередь об исходных, первичных ("измеренных" данных), которые как раз и представляют наибольшую ценность для научного сообщества.

Отсутствие открытой интернет-платформы с архивом почвенных данных приводит к тому, что огромное количество информации, накопленной несколькими поколениями почвоведов, является "неактивным" – пылится в архивах и лежит в "столах", без доступа к ним других исследователей. Конечно, результаты исследований по собранным данным зачастую опубликованы, но их потенциал, их польза для научного прогресса остается раскрытой не полностью. Исходные данные не могут быть использованы научным сообществом, пока они не являются общественным достоянием или хотя бы доступными широкому кругу экспертов.


Философия open source в научных исследования

В ИТ существует термин "open source", который означает свободный доступ к данным, исходному коду компьютерных программ, алгоритмам расчета или другим составляющим того или иного проекта; при этом отсутствуют ограничения по применению, распространению и изменению исходного кода программы и данных. Широкую практику получила технология управления подобными проектами при помощи специальных репозиториев и систем контроля версий (например, github.com), которые позволяют избежать хаоса и способствуют быстрому росту количества участников проекта.

Многие научные центры переводят исследования на open source проекты. С недавних пор NASA позиционирует себя как кузницу open source и на их сайте агрегировано более 20 открытых научных проектов [1]. Open source проекты успешно применяются в смежных с почвоведением областях, например, в биологии [2]. Речь идет в первую очередь о формате распространения компьютерных программ, но за понятием open source стоит более глубокая, философская концепция.

Любая программа с закрытым исходным кодом являются неким черным ящиком, выдающим результат, который никто не в силах проверить, кроме узкого круга разработчиков. Нарушается принцип повторяемости эксперимента, появляются проблемы связанные с достоверностью результатов [3]. Точно также происходит и в научных исследованиях – отсутствие доступа к исходной информации делает полученные и опубликованные результаты непроверяемыми. Чтобы проверить ту или иную гипотезу иногда почвоведам необходимо проделать всю работу "с нуля", т.е затратить большое количество ресурсов – вместо того, чтобы напрямую обратиться к исходным данным, проверить и если нужно дополнить их.

Open source – это философия, которая очень близка к принципам исследований в фундаментальной науке, а значит, и к почвоведению. Как говорил Д.И. Менделеев: "Наука есть достояние общее". Конечно, случается, что исследования проводятся при поддержке определенных грантов, запрещающих публикацию исходных данных; однако, это лишь малая часть от общего количества неопубликованной информации, накопившейся за многие десятилетия.

Идеи open source необходимо активно популяризировать среди почвоведов и в научном сообществе в целом. Целесообразно взглянуть на open source не как на философию распространения компьютерных программ, а как философию научной работы ученых и добытых ими знаний.


Почвоведение и интернет

Буквально десять лет назад – сущие пустяки по меркам почвообразования, интернет воспринимался прежде всего как инструмент для общения по электронной почте; даже само слово "интернет" с трепетом писалось с заглавной буквы и не склонялось по падежам. Сегодня количество компьютеров, подключенных к сети World Wide Web, подошло к трем миллиардам, а развитие мобильных платформ дает возможность работать с информационными системами, находясь "в поле", и записывать результаты измерений в электронном виде в реальном времени. Социальные сети и интернет-сообщества вытесняют традиционные СМИ, позволяя ученым напрямую информировать население об актуальных проблемах и достигнутых результатах. Рунет (русский сегмент интернета) растет очень быстрыми темпами – по данным w3techs в 2014 году русский язык стал вторым по популярности в интернете после английского – на нем представлено около 6% информации в сети [4].

Не смотря на это, представленность русских почвоведов в сети остается неудовлетворительной. Крайне слабо представлена информация о деградации почвенного покрова и экологических угрозах; ощущается нехватка профильных порталов, связанных с почвами и земельными ресурсами; практически нет почвенных сайтов ориентированных на детей и подростков. При этом данные google trends и yandex wordstat показывают, что по многим ключевым запросам ("почва", "почвоведение", "чернозем" и др.) намечается рост интереса пользователей сети к почвенной тематике [5,6].

Возможно, дело в том, что интернет до сих пор воспринимается многими почвоведами как инструмент поиска, электронной почты и развлечений. На самом же деле интернет сегодня является крупнейшим средством получения информации с множеством независимых источников. Большинство СМИ существенно сократили тираж бумажных изданий, и основные доходы получают от показа рекламы на веб-сайтах. Аудитория веб-пространства огромна – к примеру, анализ посещаемости сайта факультета почвоведения МГУ показал, что за год сайтом пользуются 60000 человек из более чем 1500 городов мира.

Другая проблема – нехватка веб-сервисов. Несмотря на то, что сообщество почвоведов активно осваивает ИТ-инструментарий и использует такие технологии как БД, ГИС и статистический аппарат, в сети (особенно в ее русскоязычном сегменте) ощущается острая нехватка веб-сервисов для почвоведов, фермеров, управленцев и заинтересованных лиц. Подобные сервисы активно разрабатываются в смежных областях. К примеру, разработана карта лесов мира Global Forest Watch – этот сервис предоставляет оперативную информацию о вырубке лесов по всему миру на основании данных со спутников NASA за последние несколько лет [7]. Почвоведы пока в этом плане сильно отстают.

Здесь опять стоит вспомнить о концепции open source, но уже в ее практическом, не философском контексте. Многие зарубежные почвенные ИС являются открытыми, что позволяет работать с ними большому количества пользователей по всему миру. В частности, проект SOTER [8] в данный момент де-факто является международным стандартом (большинство существующих почвенных ИС выполнено по методологии и архитектуре SOTER) именно за счет того, что его инструментарий и данные выложены в открытый доступ.


Популяризация почвоведения

Отдельной больной темой является популяризация почвоведения. В связи с приближающимся с каждым днем аграрным и экологическим кризисом, крайне важной задачей становится информирование населения, просвещение и упрощение научной мысли до уровня широкой общественности. Речь идет не столько о популяризации почвоведения, как науки; важно хотя бы донести до людей знание об элементарных вещах – экологической функции и плодородии почв, уникальности и необходимости их охраны, фатальной опасности деградации почвенного покрова.

В 70-80х годах информация о почвах активно распространялись среди населения "сверху"; государство поддерживало выпуск научно-популярных материалов, связанных с почвами, в частности кинопродукции (Центрнаучфильм, Школфильм и др.). Сейчас таких работ ведется недостаточно, социальная реклама в этой сфере практически отсутствует, а предыдущие разработки устарели.

Кризис просветительской работы в данном направление стал настолько чувствителен, что привлек внимание Генеральной Ассамблеи ООН, которая провозгласила 2015 – Международным годом почв. Цель года почв – повышение информированности и понимания важности почв для продовольственной безопасности и функционирования экосистем [9].

В данный момент активно развиваются медиатехнологии – информационно-коммуникационные технологии, взаимодействующие с данными, представленными в виде аудиовизуальных образов. Термин "медиа" (от лат. medium – среда) трактуется весьма размыто. Мы видим это определение как процесс передачи информационных сущностей, которые могут быть выражены самым разным образом – от текстового (медиатекст) до аудиозаписей, анимации, видео и проч. С появлением информационных технологий (ИТ) появился термин "мультимедиа" – совмещение нескольких форм информационных сущностей с возможностью интерактивного взаимодействия.

Смысл медиатехнологий – донесение информации в максимально понятной и быстроусваиваемой человеком форме. Наиболее эффективный способ для этого – видеозаписи. Популярный видеохостинг youtube использует уже более миллиарда человек; ежеминутно на него загружают более 300 часов видео [10]. Существует возможность создавать прямые видеотрансляции без каких-либо значимых ресурсозатрат. Появление социальных медиа, дающих возможность пользователям создавать содержимое (контент) самостоятельно, публиковать и обмениваться информацией в реальном времени – позволяет поставить вопрос о распространении информации о почвах на совершенно новый уровень.

Вопреки существующим огромным возможностям распространения проблемной и обзорной информации, медиапространство, связанное с почвами остается на уровне конца 90-х. Медиаобраз почвы в сознании обывателя сводится в лучшем случае к земле, в которую можно сажать картошку. К сожалению, нередко можно встретить людей, которые называют почву "грязью" и не имеют даже примерных представлений о том, что обязаны ей своим существованием.

Сегодня интернет впервые позволяет решить насущные проблемы популяризации почвоведения. Накоплен колоссальный пласт знаний, который необходимо донести до людей. Но сделать это можно только действуя сообща. Для этого нужна интернет-платформа, в рамках которой почвоведы смогут скоординировать свои усилия.


Невосполнимые потери

Существует еще одна критически важна проблема – каждый день российское и мировое сообщество почвоведов теряет драгоценные материалы – почвенные описания, карты, схемы, образцы. К сожалению, никто не застрахован от пожаров, наводнений и других бедствий; иногда данные прошлых лет просто напросто выбрасывают или теряют при переезде или транспортировке. Бывает, что теряются даже двухметровые почвенные монолиты [11].

Эти проблему можно существенно разрешить при помощи оцифровки данных в электронный вид, который "не горит" – благодаря небольшому размеру хранящейся в электронном виде информации легко создаются резервные копии и применяются дублирующие друг друга "облачные" хранилища.

Несмотря на то, что отдельные попытки перевода данных в цифровой вид практикуются различными организациями, особенно библиотекам, невозможно говорить о переводе в электронный вид даже сотой части существующих материалов. Ресурсы, выделяемые на эту работу ничтожны и зачастую все держится на одном человеке.

Встает острый вопрос срочного перевода огромных массивов данных в электронный вид. Сделать это можно только при помощи краудсорсинга, т.е. привлекая к работе широкий круг ученых и интересующихся наукой лиц. Но прежде, опять же необходимо создать интернет-платформу, которая смогла бы совмещать в себе функции архива исходной информации, хранилища медийных файлов и исторических данных. Рассмотрим основные способы организации больших объемов данных в электронном виде.


Почвенные информационные системы и базы данных

Период 90-х и начала 2000-х годов был весьма непростым для отечественных почвоведов. В то время как за рубежом активно осваивали третье поколение информационных технологий (ИТ), дававших возможность совершенно новым образом работать с данными, накопленную почвоведами за 100 лет, Россию постиг тяжелый социально-экономический кризис, который особенно явственно отразился на научном сообществе.

Но тем сильнее есть повод гордиться отечественными исследователями, которые за последние годы смогли не только сократить образовавшийся разрыв, а кое-где и выйти на передовую почвенных исследований с применением ИТ. Во многом благодаря успешному опыту прошлых разработок [12], за последние годы в России были инициированы работы по созданию разномасштабных программных продуктов работы с данными – почвенных информационных систем (почвенные ИС) и баз данных (БД), позволяющих хранить и обрабатывать большие объемы информации [13].

К сожалению, несмотря на появление новых программных продуктов для работы с почвенными данными, зачастую их пользователи сталкиваются с крайним неудобством, порой и невозможностью работы с ними. Привычная запись данных в "человеческом" виде – описаний почвенных разрезов на бумажных носителях, физико-химических исследований в таблицах Excel и проч. – зачастую не могла быть внесена в БД в полном объеме, т.к. традиционная организация данных в электронной форме не способна сохранить подразумеваемые человеком логические связи. Эта проблема не была решена в том числе и в за рубежных системах.

В 2008 году научной группой ф-та почвоведения МГУ были начаты работы по созданию новой модели хранения данных, которая позволила бы переводить данные с "вербального" языка в цифровой вид без потерь [14]; и в 2014 году была создана семантическая модель хранения данных, которая позволила приблизиться к решению описанной проблемы и дала возможность "квантовать" информацию на простейшие логические элементы, тем самым обеспечив максимальную формализацию данных при переводе в цифровой вид [13].

Но даже возможность сохранения данных в максимально полном объеме пока что не позволяет справиться с огромным количеством информации, накопленной почвоведами за столетие. При "квантовании" почвенных описаний требуется тратить немалые усилия при вводе данных, что с текущим количеством ресурсов делает невозможным в ближайшее время оцифровать даже небольшую часть имеющейся информации. В тоже время почвенные ИС, использующие традиционную модель хранения данных и эффективные при решении узкоспециализированных задач, хоть и могут быть наполнены гораздо быстрее, страдают от потерь части исходных данных при оцифровке, что значительно уменьшает ценность хранящейся в подобной системе информации и зачастую обуславливает невозможность ее использования в глобальных проектах.

Таким образом, становится очевидной необходимость поиска альтернативы традиционным БД и почвенным ИС – единой системы, призванной хранить большие объемы исходных почвенных данных. Фактически, речь идет о создании глобального почвенного архива. Подобный интернет-сервис принципиально отличаясь от существующих цифровых систем, будет собирать оцифрованные почвенные данные и объекты в их первозданном виде, делая их доступными широкому кругу пользователей, в том числе существующим почвенным ИС и БД.


Цифровой Почвенный Музей

Все сказанное выше приводит к необходимости создания интернет-платформы, построенной на принципах открытости и краудсорсинга. Цели проекта:

1) сохранение почвенного наследия;
2) создание независимого научного сообщества;
3) просветительская деятельность;
4) популяризация почвоведения.

Подобные цели хорошо вписываются в концепцию музея, так как задуманный проект совмещают в себе функции сбора, архивации, создание среды изучения и экспонирования объектов и информации, связанной с почвами и почвоведением.

В настоящий момент существует несколько цифровых "музейных" проектов. В почвоведении подобные "виртуальные музеи" можно разделить на два основных направления – представление мультимедийных материалов в качестве части экспозиции в реальном мире [15,16] и электронные филиалы данных музеев в интернете в виде сайтов, где представлена информация о музейных фондах [17,18]. Таким образом, существующие виртуальные музеи представляют собой интернет-витрину, созданную для демонстрации экспонатов того или иного музея – не рассматривается вопрос пополнения "коллекции" через интернет, привлечение к работе сторонних лиц, создание сообщества. Реакция на подобное положение дел уже наступила и постепенно начинают появляться отдельные проекты энтузиастов; например, галерея фотографий почвенных разрезов [19].

Другое направление близких по духу проектов – интернет-библиотеки и электронные архивы. Наиболее представительным почвенным ресурсом является библиотека Международного информационно-справочного центра по почвам (ISRIC) [20]. К сожалению, подобные библиотеки и архивы редко являются независимыми проектами и сильно ограничены в ресурсах, поэтому в свободном доступе оказывается лишь малая часть материалов, многие из которых представлены всего лишь короткой аннотацией. Большинство материалов этих библиотек до сих пор находятся в "аналоговом", бумажном виде без доступа к ним широкого круга лиц.

Подобные проблемы являются следствием того, что существующая методология по созданию подобных ресурсов не включает в себя направление краудсорсинга и не следует принципу открытости. Работы ведутся узким кругом специалистов в закрытом виде, далеком от философии "open source". Кроме того, отсутствие единой платформы для коммуникации между разнопрофильными учеными-почвоведами ограничивает возможность достижения синергетического подхода в почвенных исследованиях.

Это приводит к необходимости создания независимого интернет-ресурса о почвах и почвоведении. Проект назван "Цифровой Почвенный Музей" (ЦПМ) и будет совмещать в себе следующие элементы:

1) "Почвенный архив" – хранение фактических морфологических, физико-химических и других численных и текстовых исходных данных в цифровом виде;
2) "База знаний о почвах и почвоведении" – создание электронного интерактивного учебника; в том числе отдельный портал по истории почвоведения;
3) "Медиагалерея" – фотографии, 3-d коллекция почвенных объектов и др. медиа;
4) "Виртуальная экспозиция" – эталонные почвенные профили и самые интересные экспонаты почвенного архива;
5) "Мир почвенных музеев" – виртуальные прогулки по почвенным музея мира;
6) "Песочница" – раздел цифрового почвенного моделирования свойств и процессов;
7) "Популярное почвоведение" – раздел, посвященный научно-популярным и детским проектам, связанным с почвенной тематикой.

Для реализации проекта был выбрана программный комплекс ("движок") MediaWiki, на котором работает, в частности, Википедия. MediaWiki является свободной программой и распространяется на условиях Общественной лицензии GNU, что позволяет ее модифицировать. MediaWiki позволяет использовать систему истории правок, что делает ее устойчивой к вандализму, а значит пригодной для открытого проекта. Каждый материал можно обсуждать; общение сообщества происходит в back-end интерфейсе. Разделы музея будут выполнены в виде отдельных порталов-подсайтов, связанных между собой. Основной язык проекта – русский, в разработке англоязычная, интернациональная версия.

Более подробная информация находится на сайте проекта – http://soilmuseum.org Приглашаем всех желающих обсудить проект на научном интернет-форуме по почвоведению – http://soilforum.org


Литература

1) Open.NASA, URL: http://open.nasa.gov
2) Maurer S. M. Open Source Drug Discovery: Finding a Niche (or Maybe Several), 76 UMKC L. Rev. 405 (2007).
3) Ince D., Hatton L., Graham-Cumming J. The case for open computer programs // Nature, 2012. 482. – Pp. 485–488
4) Web Technology Surveys, URL: http://w3techs.com
5) Google Trends, URL: http://google.com/trends
6) Статистика ключевых слов в Яндексе, URL: http://wordstat.yandex.ru
7) Global Forest Watch, URL: http://globalforestwatch.org
8) Van Engelen V.W.P., Wen T.T. Global and National Soils and Terrain Digital Databases (SOTER): Procedures Manual. International Soil Reference and Information Centre, 1995. – 126 p.
9) Food and Agriculture Organization: http://www.fao.org/soils-2015
10) Youtube Statistics, URL: https://www.youtube.com/yt/press/statistics.html
11) Muggler C.C., Spaargaren O., Hartemink A. The Glinka Memorial Soil Monolith Collection: a treasure of Soil Science // Geophysical Research Abstracts, 2012. Vol. 14, p. 14239.
12) Рожков В.А. Почвенная информатика. – М.: ВО "Агропромиздат", 1989. – 222 с.
13) Иванов А.В., Рыбальский Н.Н. Семантическая модель описания почв и почвенная информационная система // Использование и охрана природных ресурсов в России, 2012. №2 (122).
14) Иванов А.В., Рыбальский Н.Н. Информационная профильно-географическая модель почвы как основа почвенной информационной системы // Использование и охрана природных ресурсов в России, 2010. №6 (114). – С. 25-28.
15) Chai Min, Guo Zhi-xing, Wei Xiu-guo. Research on the System Architecture and Key Technologies of Digital Soil Museum, Journal of System Simulation, 2009, Vol.21:276.
16) Spaargaren O.C., Wien J.E., Roosenschoon O.R, Jansen W.J. An interactive virtual soil museum: a pilot project of the International Soil Reference and Information Centre with focus on arid soils. In: Assessing capabilities of soil and water resources in drylands: the role of information retrieval and dissemination technologies: IALC Conference & Workshop Proceedings, 20-25 October, 2002, Tucson, Arizona. p. 84-92.
17) Всемирный Почвенный Музей, URL: http://www.isric.org/services/world-soil-museum
18) Центральный музей почвоведения им. В.В. Докучаева, URL: http://музей-почвоведения.рф
19) Фотогалерея почвенных профилей на Panoramio, URL: http://panoramio.com/user/4107231
20) Библиотека ISRIC, URL: http://www.isric.eu/content/search-library-and-map-collection

Код: Выделить всё

Рыбальский Н. Н., Долгинова В. А. Цифровой почвенный музей: концепт // Использование и охрана природных ресурсов в России. — 2015. — № 3. — С. 25–29.
Digital Soil Museum: concept

N.N. Rybalskiy, V.A. Dolginova
Faculty of Soil Science Lomonosov Moscow State University

Summary:
The article explains the urgent need of soil data conservation and sharing both of the historical and contemporary ones. We discuss the open source concept of operating with soil data . Provided an overview of existed online soil resources. Suggested the usage of media technologies due to promote soil science. Analyzed the basic tools to work with a huge amounts of soil data. Given an overview of the representation of soil data on the Internet as a virtual museums and other online resources. Intriduced the concept of the Digital Soil Museum.

Key Words:
Digital Soil Museum, soil museum, soil information system, soil, soil science, database, museum, IT, internet, archive, storage, collection, media, data collection, data storage, storage form, formalization, digitizing, model, soil heritage, open source, philosophy.
Ответить