SKOS

Материал из Свод знаний по информационному моделированию
Перейти к навигации Перейти к поиску

Это не официальный перевод руководства по SKOS Simple Knowledge Organization System Reference

SKOS Simple Knowledge Organization System Reference

W3C Recommendation 18 August 2009

This version: http://www.w3.org/TR/2009/REC-skos-reference-20090818/ Latest version: http://www.w3.org/TR/skos-reference Previous versions: http://www.w3.org/TR/2009/PR-skos-reference-20090615/ Editors: Alistair Miles, STFC Rutherford Appleton Laboratory / University of Oxford Sean Bechhofer, University of Manchester Please refer to the errata for this document, which may include some normative corrections.

Copyright © 2009 W3C® (MIT, ERCIM, Keio), All Rights Reserved. W3C liability, trademark and document use rules apply.


Введение

Этот документ определяет Простую систему организации знаний (SKOS), общую модель данных для обмена и связывания систем организации знаний через Интернет.

Многие системы организации знаний, такие как тезаурусы, таксономии, схемы классификации и системы тематических рубрик, имеют схожую структуру и используются в аналогичных приложениях. SKOS отражает большую часть этого сходства и делает его явным, чтобы обеспечить обмен данными и технологиями между различными приложениями.

Модель данных SKOS обеспечивает стандартный, недорогой путь миграции для переноса существующих систем организации знаний в Семантическую сеть. SKOS также предоставляет легкий, интуитивно понятный язык для разработки и обмена новыми системами организации знаний. Он может использоваться сам по себе или в сочетании с языками представления формальных знаний, такими как язык веб-онтологий (OWL).

Этот документ представляет собой нормативную спецификацию Системы организации простых знаний. Он предназначен для читателей, которые занимаются проектированием и внедрением информационных систем и которые уже хорошо разбираются в технологиях семантического веба, особенно в RDF и OWL.

Для получения информативного руководства по использованию SKOS см. [SKOS-PRIMER].

Краткий обзор

Используя SKOS, понятия могут быть идентифицированы с помощью URI, помечены лексическими строками на одном или нескольких естественных языках, им назначены обозначения (лексические коды), задокументированы различными типами примечаний, связаны с другими понятиями и организованы в неформальные иерархии и ассоциативные сети, объединены в концептуальные схемы, сгруппированы в помеченные и/или упорядоченные коллекции и сопоставлены с понятиями в других схемах.


Статус этого документа

В этом разделе описывается статус этого документа на момент его публикации. Другие документы могут заменить этот документ. Список текущих публикаций W3C и последнюю редакцию этого технического отчета можно найти в индексе технических отчетов W3C по адресу http://www.w3.org/TR/.

Этот документ является рекомендацией W3C, разработанной Рабочей группой по развертыванию семантического веба, частью деятельности W3C Semantic Web. Этот документ отражает редакционное изменение, возникшее в ходе рассмотрения Предлагаемой рекомендации: был удален ненормативный пример и предыдущий текст, в котором предлагалось одно из средств ссылки на систему обозначений (например, символическую запись) в ярлыке, где система обозначений не соответствует естественному языку. Это предложение было сочтено несовместимым с передовой текущей практикой IETF 47 по использованию тегов для идентификации языков. Пользователям следует рассмотреть словарь расширения SKOS для поддержки альтернативных систем обозначения. Отчет о внедрении документирует известное использование SKO в течение периода рассмотрения рекомендаций кандидатов. Одновременно с этой рекомендацией публикуется обновленный учебник по SKOS.

Изменения, Внесенные С 15 Июня 2009 Года Предлагаемая Рекомендация:

Удалены заключительный абзац и пример из раздела 6.5.4 об использовании подтегов языка частного использования. Редакционные изменения в разделе "Ссылки" и цитирование учебника SKOS. Комментарии к этому документу можно направлять по адресу public-swd-wg@w3.org с публичным архивом.

Этот документ был подготовлен группой, действующей в соответствии с Патентной политикой W3C от 5 февраля 2004 года. W3C ведет открытый список любых раскрытий патентов, сделанных в связи с результатами деятельности группы; на этой странице также содержатся инструкции по раскрытию патента. Физическое лицо, обладающее фактическими знаниями о патенте, который, по его мнению, содержит Основную формулу(формулы), должно раскрыть информацию в соответствии с разделом 6 Патентной политики W3C.

Этот документ был рассмотрен членами W3C, разработчиками программного обеспечения и другими группами W3C и заинтересованными сторонами и одобрен Директором в качестве рекомендации W3C. Это стабильный документ, и его можно использовать в качестве справочного материала или цитировать из другого документа. Роль W3C в вынесении Рекомендации заключается в привлечении внимания к спецификации и содействии ее широкому внедрению. Это повышает функциональность и совместимость Интернета.

1. Введение

1.1. Предпосылки и мотивация

Простая система организации знаний-это стандарт обмена данными, объединяющий несколько различных областей знаний, технологий и практики.

В области библиотечных и информационных наук долгое и выдающееся наследие посвящено разработке инструментов для организации больших коллекций предметов, таких как книги или музейные экспонаты. Эти инструменты обычно известны как "системы организации знаний" (KOS) или иногда как "контролируемые структурированные словари". Со временем появилось несколько похожих, но отличных традиций, каждая из которых поддерживается сообществом практиков и набором согласованных стандартов. Различные семейства систем организации знаний, включая тезаурусы, схемы классификации, системы тематических рубрик и таксономии, широко признаны и применяются как в современных, так и в традиционных информационных системах. На практике может быть трудно провести абсолютное различие между тезаурусами и схемами классификации или таксономиями, хотя некоторые свойства могут быть использованы для широкой характеристики этих различных семейств (см., например, [BS8723-3]). Важным моментом для SKOS является то, что, помимо их уникальных особенностей, каждое из этих семейств имеет много общего и часто может использоваться аналогичными способами [SKOS-UCR]. Однако в настоящее время не существует широко распространенного стандарта для представления этих систем организации знаний в виде данных и обмена ими между компьютерными системами.

Деятельность семантической сети W3C [SW] стимулировала новую область интегративных исследований и разработки технологий на границах между системами баз данных, формальной логикой и Всемирной паутиной. Эта работа привела к разработке основополагающих стандартов для семантического веба. Структура описания ресурсов (RDF) обеспечивает общую абстракцию данных и синтаксис для Интернета [RDF-ПРАЙМЕР]. Язык описания словаря RDF (RDFS) и язык веб-онтологий (OWL) вместе предоставляют общий язык моделирования данных (схемы) для данных в Интернете [RDFS] [РУКОВОДСТВО OWL]. Язык запросов и протокол SPARQL предоставляют стандартные средства для взаимодействия с данными в Интернете [SPARQL].

Эти технологии применяются в различных приложениях, поскольку многим приложениям требуется общая структура для публикации, совместного использования, обмена и интеграции ("объединения") данных из разных источников. Возможность связывать данные из разных источников мотивирует многие проекты, поскольку различные сообщества стремятся использовать скрытую ценность данных, ранее распределенных по изолированным источникам.

Одним из аспектов видения семантической сети является надежда на лучшую организацию огромного объема неструктурированной (т. е. читаемой человеком) информации в Сети, предоставляя новые пути для обнаружения и обмена этой информацией. RDFS и OWL являются формально определенными языками представления знаний, предоставляющими способы выражения значения, которые поддаются вычислению, то есть дополняют и структурируют информацию, уже присутствующую в Интернете [RDF-ПРАЙМЕР] [OWL-РУКОВОДСТВО]. Однако для фактического применения этих технологий к большим объемам информации требуется создание подробных карт конкретных областей знаний в дополнение к точному описанию (т. е. аннотированию или каталогизации) информационных ресурсов в больших масштабах, большая часть которых не может быть выполнена автоматически. Накопленный опыт и передовая практика в области библиотечных и информационных наук в отношении организации информации и знаний, очевидно, дополняют и применимы к этому видению, как и многие существующие системы организации знаний, уже разработанные и используемые, такие как Тематические рубрики Библиотеки Конгресса [LCSH] или Тезаурус AGROVOC Продовольственной и сельскохозяйственной организации Объединенных Наций [AGROVOC].

Таким образом, Простая система организации знаний призвана обеспечить связь между различными сообществами практиков в области библиотечных и информационных наук, участвующих в разработке и применении систем организации знаний. Кроме того, SKOS стремится обеспечить мост между этими сообществами и Семантической сетью, перенося существующие модели организации знаний в контекст технологии семантической сети и предоставляя недорогой путь миграции для переноса существующих систем организации знаний в RDF.

Заглядывая в будущее, SKOS занимает позицию между использованием и анализом неструктурированной информации, неформальной и социально опосредованной организацией информации в больших масштабах и формальным представлением знаний. Делая накопленный опыт и мудрость организации знаний в библиотечных и информационных науках доступными, применимыми и переносимыми в технологический контекст Семантической сети таким образом, чтобы дополнять существующую технологию Семантической сети (и, в частности, формальные системы представления знаний, такие как OWL), можно надеяться, что SKOS позволит использовать множество новых и ценных приложений, а также приведет к новым интегративным направлениям исследований и разработок как в технологии, так и на практике.

1.2. Обзор SKOS

Простая система организации знаний-это общая модель данных для систем организации знаний, таких как тезаурусы, схемы классификации, системы тематических рубрик и таксономии. Используя SKOS, система организации знаний может быть выражена в виде машиночитаемых данных. Затем им можно обмениваться между компьютерными приложениями и публиковать в машиночитаемом формате в Интернете.

Модель данных SKOS формально определена в этой спецификации как полная онтология OWL [OWL-СЕМАНТИКА]. Данные SKOS выражаются в виде троек RDF [RDF-КОНЦЕПЦИИ] и могут быть закодированы с использованием любого конкретного синтаксиса RDF (например, RDF/XML [RDF-XML] или Turtle [ЧЕРЕПАХА]). Для получения дополнительной информации об отношениях между SKOS, RDF и OWL см. Следующий подраздел ниже.

Модель данных SKOS рассматривает систему организации знаний как концептуальную схему, включающую набор концепций. Эти концептуальные схемы SKOS и концепции SKOS идентифицируются URI, что позволяет любому пользователю однозначно ссылаться на них из любого контекста и делает их частью Всемирной паутины. См. Раздел 3. Класс skos:Концепция для получения дополнительной информации об определении и описании концепций SKOS и Раздел 4. Концептуальные схемы подробнее о концептуальных схемах.

Понятия SKOS могут быть помечены любым количеством лексических строк (в ЮНИКОДЕ), таких как "романтическая любовь" или "れんあい", на любом естественном языке, таком как английский или японский (написано здесь на хирагане). Одна из этих меток на любом заданном языке может быть указана как предпочтительная метка для этого языка, а другие-как альтернативные метки. Метки также могут быть "скрытыми", что полезно в тех случаях, когда система организации знаний запрашивается с помощью текстового индекса. См. Раздел 5. Лексические метки для получения дополнительной информации о свойствах лексических меток SKOS.

Понятиям SKOS может быть присвоено одно или несколько обозначений, которые представляют собой лексические коды, используемые для уникальной идентификации понятия в рамках данной концептуальной схемы. В то время как URI являются предпочтительным средством идентификации концепций SKOS в компьютерных системах, обозначения обеспечивают связь с другими системами идентификации, которые уже используются, такими как классификационные коды, используемые в библиотечных каталогах. См. Раздел 6. Обозначения для получения дополнительной информации о обозначениях.

Концепции SKOS могут быть задокументированы с примечаниями различных типов. Модель данных SKOS предоставляет базовый набор свойств документации, вспомогательные примечания к области применения, определения и редакционные примечания, среди прочего. Этот набор не предназначен для того, чтобы быть исчерпывающим, а скорее для обеспечения основы, которая может быть расширена третьими сторонами для обеспечения поддержки более конкретных типов заметок. См. Раздел 7. Свойства документации для получения дополнительной информации о примечаниях.

Концепции SKOS могут быть связаны с другими концепциями SKOS через свойства семантических отношений. Модель данных SKOS обеспечивает поддержку иерархических и ассоциативных связей между концепциями SKOS. Опять же, как и в любой части модели данных SKOS, они могут быть расширены третьими сторонами для обеспечения поддержки более конкретных потребностей. См. Раздел 8. Семантические отношения для получения дополнительной информации о связывании концепций SKOS.

Концепции SKOS могут быть сгруппированы в коллекции, которые могут быть помечены и/или упорядочены. Эта функция модели данных SKOS предназначена для обеспечения поддержки меток узлов в тезаурусах и для ситуаций, когда упорядочение набора понятий имеет смысл или предоставляет некоторую полезную информацию. Подробнее о коллекциях см. Раздел 9. Концептуальные коллекции.

Концепции SKOS могут быть сопоставлены с другими концепциями SKOS в различных концептуальных схемах. Модель данных SKOS обеспечивает поддержку четырех основных типов связи отображения: иерархической, ассоциативной, близкого эквивалента и точного эквивалента. См. Раздел 10. Свойства сопоставления для получения дополнительной информации о сопоставлении.

Наконец, дополнительное расширение для SKOS определено в Приложении B. Расширение SKOS для этикеток (SKOS-XL). SKOS-XL обеспечивает дополнительную поддержку для идентификации, описания и связывания лексических сущностей.

1.3. SKOS, RDF и OWL

Элементами модели данных SKOS являются классы и свойства, а структура и целостность модели данных определяются логическими характеристиками и взаимозависимостями между этими классами и свойствами. Это, пожалуй, один из самых мощных и в то же время потенциально запутанных аспектов SKOS, потому что SKOS можно также использовать в более продвинутых приложениях бок о бок с OWL для выражения и обмена знаниями о домене. Однако SKOS не является формальным языком представления знаний.

Чтобы понять это различие, учтите, что "знание", явное в формальной онтологии, выражается в виде наборов аксиом и фактов. Тезаурус или схема классификации имеют совершенно иную природу и не утверждают никаких аксиом или фактов. Скорее, тезаурус или схема классификации идентифицируют и описывают с помощью естественного языка и других неформальных средств набор различных идей или значений, которые иногда удобно называть "концепциями". Эти "концепции" также могут быть организованы и организованы в различные структуры, чаще всего в иерархии и ассоциативные сети. Эти структуры, однако, не имеют никакой формальной семантики и не могут быть надежно интерпретированы ни как формальные аксиомы, ни как факты об окружающем мире. На самом деле они никогда не предназначались для этого, поскольку служат лишь для предоставления удобной и интуитивно понятной карты некоторой предметной области, которую затем можно использовать в качестве вспомогательного средства для организации и поиска объектов, таких как документы, которые имеют отношение к этой области.

Чтобы сделать "знания", встроенные в тезаурус или схему классификации, явными в любом формальном смысле, требуется, чтобы тезаурус или схема классификации были переработаны в формальную онтологию. Другими словами, кто-то должен выполнить работу по преобразованию структуры и интеллектуального содержания тезауруса или схемы классификации в набор формальных аксиом и фактов. Эта работа по преобразованию является как интеллектуально сложной, так и трудоемкой и, следовательно, дорогостоящей. Многое можно извлечь из использования тезаурусов и т. Д. как есть, в качестве неформальных, удобных структур для навигации в предметной области. Использование их как есть не требует какой-либо реинжиниринга и, следовательно, намного дешевле. Кроме того, некоторые КО по замыслу не предназначены для представления логического представления своей области. Преобразование таких KOS в представление, основанное на формальной логике, на практике может повлечь за собой изменения, которые приведут к представлению, которое больше не соответствует первоначально намеченной цели.

Однако OWL предоставляет мощный язык моделирования данных. Поэтому мы можем использовать OWL для построения модели данных для представления тезаурусов или схем классификации как есть. Это именно то, что делает SKOS. При таком подходе "понятия" тезауруса или схемы классификации моделируются как отдельные лица в модели данных SKOS, а неформальные описания и связи между этими "понятиями", как указано в тезаурусе или схеме классификации, моделируются как факты об этих людях, а не как аксиомы класса или свойства. Обратите внимание, что это факты о самом тезаурусе или схеме классификации, такие как "концепция X имеет предпочтительную метку" Y "и является частью тезауруса Z"; это не факты о том, как устроен мир в определенной предметной области, как это может быть выражено в формальной онтологии.

Затем данные SKOS выражаются в виде троек RDF. График RDF ниже (в [TURTLE], как описано в разделе 1.7.3) выражает некоторые факты о тезаурусе.

<A> rdf:type skos:Concept ; skos:prefLabel "love"@en ; skos:altLabel "adoration"@en ; skos:broader <B> ; skos:inScheme <S> . <B> rdf:type skos:Concept ; skos:prefLabel "emotion"@en ; skos:altLabel "feeling"@en ; skos:topConceptOf <S> . <S> rdf:type skos:ConceptScheme ; dct:title "My First Thesaurus" ; skos:hasTopConcept <B> .

Этот момент жизненно важен для понимания формального определения модели данных SKOS и того, как она может быть реализована в программных системах. Этот момент также жизненно важен для более продвинутых приложений SKOS, особенно там, где SKOS и OWL используются в сочетании как часть гибридного формального/полуформального дизайна.

Однако с точки зрения пользователя различие между формальной системой представления знаний и неформальной или полуформальной системой организации знаний может естественным образом стать размытым. Другими словами, для пользователя может быть не важно, что <A> и <B> на графике ниже являются отдельными лицами (экземпляры skos:Концепция), а <C> и <D> являются классами (экземпляры owl:Класс) .

<A> rdf:type skos:Concept ; skos:prefLabel "love"@en ; skos:broader <B> . <B> rdf:type skos:Concept ; skos:prefLabel "emotion"@en . <C> rdf:type owl:Class ; rdfs:label "mammals"@en ; rdfs:subClassOf <D> . <D> rdf:type owl:Class ; rdfs:label "animals"@en .

Однако информационная система, которая имеет какое-либо представление о модели данных SKOS, должна будет оценить это различие.

Схемы RDF для SKOS и расширение SKOS для меток (SKOS-XL) описаны в Приложении C. Документы пространства имен SKOS и SKOS-XL. Обратите внимание, что, поскольку существуют ограничения, которые не могут быть полностью отражены в схеме, документ RDF/XML предоставляет нормативное подмножество этой спецификации.

1.4. Последовательность и целостность

В соответствии с полной семантикой RDF и OWL формальным значением (интерпретацией) графа RDF является значение истинности [RDF-СЕМАНТИКА] [OWL-СЕМАНТИКА], т. е. граф RDF интерпретируется либо как истинный, либо как ложный. В общем, график RDF считается непоследовательным, если он не может быть истинным. Другими словами, график RDF является непоследовательным, если он содержит противоречие. Используя только словари RDF и RDFS, практически невозможно сделать противоречивое утверждение. Когда также используется словарь OWL, есть много способов указать на противоречие, например, рассмотрим график RDF ниже.

<Dog> rdf:type owl:Class . <Cat> rdf:type owl:Class . <Dog> owl:disjointWith <Cat> . <dogcat> rdf:type <Dog> , <Cat> .

На графике указано, что <Собака> и <Кошка> являются обоими классами и что они не пересекаются, т. Е. Что у них нет общих членов. Этому противоречит утверждение, что <dogcat> имеет тип как <Собака>, так и <Кошка>. Не существует полной интерпретации OWL, которая могла бы удовлетворить этому графику, и поэтому этот график не является полностью согласованным с OWL.

Когда OWL Full используется в качестве языка представления знаний, понятие несоответствия полезно, поскольку оно выявляет противоречия внутри аксиом и фактов, которые утверждаются в онтологии. Устраняя эти несоответствия, мы узнаем больше о области знаний и приходим к лучшей модели этой области, из которой можно сделать интересные и обоснованные выводы.

Когда OWL Full используется в качестве языка моделирования данных (т. Е. схемы), понятие несоответствия снова полезно, но по-другому. Здесь нас не интересует логическая последовательность самого человеческого знания. Мы просто заинтересованы в формальном определении модели данных, чтобы мы могли с уверенностью установить, соответствуют ли некоторые данные (т. Е. соответствуют) данной модели данных. Если данные не соответствуют модели данных, то данные не подходят.

Здесь нас не интересует, соответствуют ли какие-либо данные реальному миру, т. е. Являются ли они истинными или ложными в каком-либо абсолютном смысле. Нас просто интересует, соответствуют ли данные модели данных, потому что совместимость в рамках данного класса приложений зависит от данных, соответствующих общей модели данных.

Другой способ выразить эту точку зрения-через понятие целостности. Условия целостности - это утверждения в рамках формального определения модели данных, которые используются для установления того, согласуются ли данные с моделью данных, например, утверждение о том, что <Собака> и <Кошка> являются непересекающимися классами, можно рассматривать как условие целостности модели данных. Учитывая это условие, приведенные ниже данные не являются согласованными.

<dogcat> rdf:type <Dog> , <Cat> .

Определение модели данных SKOS, приведенное в этом документе, содержит ограниченное количество утверждений, которые предназначены в качестве условий целостности. Эти условия целостности включены для обеспечения совместимости путем определения обстоятельств, при которых данные не согласуются с моделью данных SKOS. Затем могут быть реализованы инструменты, которые проверяют, выполняются ли некоторые или все из этих условий целостности для данных, и, следовательно, соответствуют ли данные модели данных SKOS.

Эти условия целостности являются частью формального определения классов и свойств модели данных SKOS. Однако они представлены отдельно от других частей формального определения, поскольку служат другой цели. Условия целостности служат в первую очередь для определения того, соответствуют ли данные модели данных SKOS. Все остальные утверждения в определении модели данных SKOS служат только для поддержки логических выводов. (См. также следующий подраздел.)

Условия целостности определяются для модели данных SKOS таким образом, чтобы они не зависели от стратегий их реализации, насколько это возможно. Это связано с тем, что существует несколько различных способов реализации процедуры поиска несоответствий с моделью данных SKOS. Несоответствия могут быть обнаружены с помощью рассуждения СОВЫ. В качестве альтернативы, некоторые несоответствия могут быть обнаружены путем поиска определенных закономерностей в данных или с помощью гибридной стратегии (например, путем построения выводов с использованием RDFS или рассуждения OWL, а затем поиска закономерностей в выводимом графике).

Условия целостности модели данных SKOS меньше, чем можно было бы ожидать, особенно для тех, кто привык работать в закрытом мире систем баз данных. См.также следующий подраздел и примечания в разделах 3-10 ниже.

1.5. Вывод, зависимость и Предположение об Открытом мире

Этот документ определяет модель данных SKOS как полную онтологию OWL. Существуют и другие способы определения модели данных SKOS, например, как модели отношений сущностей или модели классов UML. Хотя OWL Full как язык моделирования данных во многом интуитивно похож на эти другие подходы к моделированию, существует важное фундаментальное различие.

RDF и OWL Full предназначены для систем, в которых данные могут быть широко распространены (например, в Интернете). По мере того как такая система становится больше, становится непрактичным и практически невозможным узнать, где находятся все данные в системе. Поэтому, как правило, нельзя считать, что данные, полученные из такой системы, являются полными. Если некоторые данные кажутся отсутствующими, в целом следует предположить, что эти данные могут существовать где-то еще в системе. Это предположение, грубо говоря, известно как предположение об открытом мире [OWL-GUIDE].

На практике это означает, что для модели данных, определенной как полная онтология OWL, некоторые определения могут иметь противоречивое значение. Из отсутствующих данных нельзя сделать никаких выводов, и удаление чего-либо никогда не сделает оставшиеся данные противоречивыми. Это иллюстрируется, например, определением skos:семантическая связь в разделе 8 ниже. Свойство skos:Семантическая связь определяется как имеющее домен и диапазон skos:Понятие. Эти определения домена и диапазона дают право на выводы. Рассмотрим график ниже.

<A> skos:semanticRelation <B>.

В этом случае приведенный выше график влечет за собой следующий график.

<A> rdf:type skos:Concept . <B> rdf:type skos:Concept .

Таким образом, нам не нужно здесь явно указывать, что <A> и <B> являются экземплярами skos:Concept, поскольку такие утверждения вытекают из определения skos:semanticRelation.

В модели данных SKOS большинство определений не являются условиями целостности, а являются утверждениями о логической зависимости между различными элементами модели данных, которые (в предположении открытого мира) дают право на ряд простых выводов. Это иллюстрируется, например, утверждением в разделе 7 ниже, что skos:broader и skos:narrower являются обратными свойствами. Это утверждение означает, что

<A> skos:narrower <B> .

влечет за собой

<B> skos:broader <A> .

Оба этих двух графика сами по себе согласуются с моделью данных SKOS.

Системы организации знаний, такие как тезаурусы и схемы классификации, применяются в широком спектре ситуаций, и отдельная система организации знаний может использоваться во многих различных информационных системах. Определив модель данных SKOS как полную онтологию OWL, Семантическая сеть может затем использоваться в качестве среды для публикации, обмена, обмена и связывания данных с участием этих систем организации знаний. По этой причине, для выразительности OWL Full как языка моделирования данных, а также для возможности использования тезаурусов, схем классификации и т.д., Наряду с формальными онтологиями, OWL Full использовался для определения модели данных SKOS. Таким образом, предположение об открытом мире является фундаментальной предпосылкой модели данных SKOS, и его следует иметь в виду при чтении этого документа.

См. также [RDF-ПРАЙМЕР] и [OWL-РУКОВОДСТВО].

1.6. Обоснование проекта

Как обсуждалось выше, понятие Системы организации знаний охватывает широкий спектр артефактов. Таким образом, существует опасность чрезмерного использования схемы SKOS, что может препятствовать использованию SKOS в некоторых приложениях. Чтобы смягчить это, в ситуациях, когда есть сомнения относительно включения формального ограничения (например, см. Обсуждение skos:hasTopConcept), ограничение не было указано формально. В некоторых случаях, хотя никаких формальных ограничений не указано, рекомендуются соглашения об использовании. Приложения, требующие более ограниченного поведения, могут определять расширения словаря SKOS. См. также [SKOS-ПРАЙМЕР].

1.7. Как читать этот документ

Этот документ формально определяет модель данных системы организации простых знаний как полную онтологию OWL. Элементами модели данных SKOS являются классы и свойства OWL, и для каждого из этих классов и свойств предоставляется Единый идентификатор ресурса (URI), чтобы их можно было однозначно использовать в Интернете. Этот набор URI является словарем SKOS.

Полный словарь SKOS приведен в разделе 2 ниже. Разделы 3-10 затем формально определяют модель данных SKOS. Определение модели данных разбито на несколько разделов исключительно для удобства. Каждый из этих разделов с 3 по 10 соответствует общей компоновке:

Преамбула — основные идеи, рассмотренные в этом разделе, представлены неофициально. Словарь — приведены URI из словаря SKOS, которые определены в разделе. Определения классов и свойств — логические характеристики и взаимозависимости между классами и свойствами, обозначаемыми этими URI, формально определены. Условия целостности — если есть какие-либо условия целостности, они даны. Примеры — приведены некоторые канонические примеры, как данных, которые соответствуют модели данных SKOS, так и (при необходимости) данных, которые не соответствуют модели данных SKOS. Примечания — любые дополнительные примечания и обсуждения представлены.

1.7.1. Формальные Определения

Большинство определений классов и свойств, а также условий целостности, указанных в этом документе, могут быть указаны в виде троек RDF с использованием словарей RDF, RDFS и OWL. Однако небольшое число не может этого сделать либо из-за ограничений в выразительности OWL Full, либо из-за отсутствия стандартного URI для некоторого класса. Чтобы улучшить общую читабельность этого документа, вместо того, чтобы смешивать тройки RDF и другие обозначения, формальные определения и условия целостности изложены в прозе.

Стиль этой прозы в целом соответствует стилю, используемому в [RDFS], и должен быть понятен читателю, обладающему практическими знаниями RDF и OWL.

Так, например, "ex:Person является экземпляром owl:Class" означает

ex:Person rdf:type owl:Class .

"ex:hasParent и ex:hasMother являются экземплярами owl:ObjectProperty" означает: ex:hasParent rdf:type owl:ObjectProperty . ex:hasMother rdf:type owl:ObjectProperty .

"ex:hasMother является вложенным свойством ex:hasParent" означает

ex:hasMother rdfs:subPropertyOf ex:hasParent .

"rdfs:range значений ex:hasParent это класс ex:Person" означает:

ex:hasParent rdfs:range ex:Person .

В тех случаях, когда некоторые формальные аспекты модели данных SKOS не могут быть сформулированы в виде троек RDF с использованием словарей RDF, RDFS или OWL, читателю, обладающему базовым пониманием семантики RDF и OWL, должно быть ясно,как эти утверждения могут быть переведены в формальные условия интерпретации словаря RDF (например, из раздела 5 "Ресурс имеет не более одного значения skos:prefLabel на языковой тег" означает, что для любого ресурса x нет двух членов набора { y | <x, y> в IEXT(I(skos:prefLabel)) } использовать один и тот же языковой тег, где I и IEXT-функции, определенные в [RDF-SEMANTICS]).

1.7.2. Сокращения URI

Полные URL-адреса указаны в тексте этого документа моноширинным шрифтом, заключенным в угловые скобки, например, <http://example.org/ns/example>. Относительные URL-адреса цитируются таким же образом и относятся к базовому URI <http://example.org/ns/>, например, <пример> и <http://example.org/ns/example> являются одним и тем же URI.

URI также приводятся в тексте этого документа в сокращенной форме. Сокращенные URL-адреса цитируются моноширинным шрифтом без угловых скобок и должны быть расширены с помощью приведенной ниже таблицы сокращений.


Table 1. URI Abbreviations
URI Abbreviation
http://www.w3.org/2004/02/skos/core# skos:
http://www.w3.org/1999/02/22-rdf-syntax-ns# rdf:
http://www.w3.org/2000/01/rdf-schema# rdfs:
http://www.w3.org/2002/07/owl# owl:

Так, например, skos:Concept это аббревиатура <http://www.w3.org/2004/02/skos/core#Concept>.

1.7.3. Примеры

Примеры графиков RDF приведены с использованием краткого тройного языка RDF (Turtle) [TURTLE]. Во всех примерах предполагается, что им предшествуют следующие директивы префикса и базы URI:

@префикс rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @префикс rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @префикс сова: <http://www.w3.org/2002/07/owl#> . @префикс skos: <http://www.w3.org/2004/02/skos/core#> . @база <http://example.org/ns/> . Поэтому пример, приведенный ниже

Example 1 <MyConcept> rdf:type skos:Concept .

эквивалентно следующему документу Turtle

@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> . @prefix owl: <http://www.w3.org/2002/07/owl#> . @prefix skos: <http://www.w3.org/2004/02/skos/core#> . @base <http://example.org/ns/> . <MyConcept> rdf:type skos:Concept . что эквивалентно следующему документу RDF/XML [RDF-XML] <?xml version="1.0" encoding="UTF-8"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#" xmlns:skos="http://www.w3.org/2004/02/skos/core#" xmlns:owl="http://www.w3.org/2002/07/owl#" xml:base="http://example.org/ns/"> <skos:Concept rdf:about="MyConcept"/> </rdf:RDF>

что эквивалентно следующему документу N-ТРОЙКИ [NTRIPLES] <http://example.org/ns/MyConcept> <http://www.w3.org/1999/02/22-rdf-syntax-ns#type> <http://www.w3.org/2004/02/skos/core#Concept> . Обратите внимание на использование в Черепахе символов ";" и "," для сокращения нескольких троек с одним и тем же подлежащим или сказуемым. В некоторых примерах также используется синтаксис Turtle "(...)", представляющий коллекцию RDF.

1.8. Соответствие требованиям

Эта спецификация не определяет формальное понятие соответствия.

Однако график RDF будет несовместим с моделью данных SKOS, если этот график и модель данных SKOS (как формально определено ниже), взятые вместе, приведут к логическому противоречию.

Если URI используются для идентификации ресурсов типа skos:Концепция, skos:Концептуальная схема, skos:Коллекция или skosxl:Метка, эта спецификация не требует определенного поведения при разыменовании этих URI через Веб [1]. Однако настоятельно рекомендуется, чтобы издатели данных SKOS следовали рекомендациям, приведенным в [COOLURIS] и [RECIPES].


2. SKOS Namespace and Vocabulary

The SKOS namespace URI is:

http://www.w3.org/2004/02/skos/core#

The SKOS vocabulary is a set of URIs, given in the left-hand column in the table below.

Все URI в словаре SKOS создаются путем добавления локального имени (например, "prefLabel") к URI пространства имен SKOS.

См. также обзор SKOS в Приложении B и панель быстрого доступа.


3. Skos:Концептуальный класс

3.1. Преамбула

Класс skos:Концепция-это класс концепций SKOS.

Концепцию SKOS можно рассматривать как идею или понятие; единицу мышления. Однако то, что составляет единицу мышления, является субъективным, и это определение должно быть наводящим на размышления, а не ограничивающим.

Понятие концепции SKOS полезно при описании концептуальной или интеллектуальной структуры системы организации знаний, а также при обращении к конкретным идеям или значениям, установленным в рамках KOS.

Обратите внимание, что, поскольку SKOS предназначен для представления полуформальных KOS, таких как тезаурусы и схемы классификации, в формальное определение этого класса была заложена определенная гибкость.

Смотрите [SKOS-PRIMER] для получения дополнительных примеров определения и описания концепций SKOS.