Фонд Wikimedia анонсировал новый проект - Wikidata, в рамках которого планируется подготовить доступную для совместного наполнения структурированную базу данных, в которой будут собраны разнообразные сведения и знания. Это первый значительный проект Wikimedia за последние 7 лет. Wikidata станет центральным сервисом для доступа к структурированным данным из всех статей свободной энциклопедии, примерно как в настоящее время Wikimedia Commons выступает в роли хранилища мультимедиа файлов.

Например, в Wikidata может быть сохранена численность населения определённого города, к которой в дальнейшем можно обращаться из статей Wikipedia по ключу с названием города и атрибутом, ассоциированным с численностью населения. При необходимости изменения данных, достаточно будет поправить запись в БД, после чего во всех статьях энциклопедии, упоминающих численность населения города N, будут использоваться новые сведения, без необходимости ручного выявления и правки этих статей. Кроме численности населения, можно сопоставить с городом различные географические и политические сведения, такие как имя мэра города, телефонный код, города-спутники и т.п.

Данные будут доступны не только для ручного редактирования, но и для полностью автоматизированной машинной обработки. Таким образом, данные могут быть задействованы в разнообразных сторонних приложениях, таких как системы аннотирования научных статей. Система будет поддерживать гибкие средства локализации, позволяющие хранить единые представления фактов на всех языках, поддерживаемых в Wikipedia (даже если статья не переведена, для всех языков можно будет вывести типовые факты). Данные будут предоставляться на условиях лицензии Creative Commons.

На разработку начального прототипа проекта выделено 1.3 млн евро, половина из которых пожертвовано Институтом решения проблем искусственного интеллекта (AI²), созданного Полом Алленом. Остальную часть финансирования предоставила компания Google и фонд Gordon and Betty Moore Foundation. По мнению вице-президента института AI² проект Wikidata является следующим шагом эволюции Wikipedia, трансформируя способ размещения энциклопедических данных, делая их доступными более широкой аудитории. Проект Wikidata будет основан на семантических технологиях, которые позволят упростить выявление нужных сведений.

Разработка проекта разделена на три фазы. Первую фазу планируется завершить в августе нынешнего года. На данной стадии будет проведена работа по централизации ссылок между версиями Wikipedia на разных языках. На второй стадии, результаты которой планируется представить в декабре 2012 года, редакторы получат возможность добавления и использования данных в Wikidata. Финальная фаза ознаменует собой появление средств для автоматического создания списков и схем, основанных на данных в Wikidata.

Источник: http://www.opennet.ru/opennews/art.shtml?num=33511