Введен в действие
Приказом Ростехрегулирования
от 31 октября 2007
г. N 287-ст
МЕЖГОСУДАРСТВЕННЫЙ СТАНДАРТ
СИСТЕМА СТАНДАРТОВ ПО ИНФОРМАЦИИ,
БИБЛИОТЕЧНОМУ И ИЗДАТЕЛЬСКОМУ ДЕЛУ
ТЕЗАУРУС ИНФОРМАЦИОННО-ПОИСКОВЫЙ МНОГОЯЗЫЧНЫЙ
СОСТАВ, СТРУКТУРА И ОСНОВНЫЕ ТРЕБОВАНИЯ К ПОСТРОЕНИЮ
System of standards on
information, librarianship
and publishing.
Multilingual thesaurus for information
retrieval. Composition,
structure and basic requirements
for development
ГОСТ 7.24-2007
Группа Т62
Предисловие
Цели, основные
принципы и основной порядок проведения работ по межгосударственной
стандартизации установлены ГОСТ 1.0-92 "Межгосударственная система
стандартизации. Основные положения" и ГОСТ 1.2-97 "Межгосударственная
система стандартизации. Стандарты межгосударственные, правила и рекомендации по
межгосударственной стандартизации. Порядок разработки, принятия, применения,
обновления и отмены".
Сведения о
стандарте
1. Разработан Всероссийским институтом научной и технической
информации Российской академии наук.
2. Внесен Федеральным агентством по техническому регулированию
и метрологии.
3. Принят
Межгосударственным советом по стандартизации, метрологии и сертификации
(Протокол N 31 от 8 июня 2007 г.).
За принятие
проголосовали:
┌────────────────────┬────────────────────┬───────────────────────────────┐
│Краткое
наименование│ Код страны по │
Сокращенное наименование │
│ страны по │МК (ИСО 3166) 004-97│ национального органа │
│МК
(ИСО 3166) 004-97│
│ по
стандартизации │
├────────────────────┼────────────────────┼───────────────────────────────┤
│Азербайджан │ AZ │Азстандарт │
│Армения │ AM │Армстандарт │
│Беларусь │ BY │Госстандарт Республики
Беларусь│
│Грузия │ GE │Грузстандарт │
│Кыргызстан │ KG
│Кыргызстандарт │
│Молдова │ MD │Молдова-Стандарт │
│Российская
Федерация│ RU │Федеральное агентство по │
│ │ │техническому регулированию │
│ │ │и метрологии │
│Таджикистан │ TJ │Таджикстандарт │
│Туркменистан │ TM │Главгосслужба │
│ │ │"Туркменстандартлары" │
│Узбекистан │ UZ │Агентство "Узстандарт"
│
│Казахстан │ KZ │Госстандарт Республики │
│ │ │Казахстан │
└────────────────────┴────────────────────┴───────────────────────────────┘
4. Настоящий
стандарт разработан с учетом основных нормативных положений международного
стандарта ИСО 5964:1985 "Документация. Руководство по построению и разработке многоязычных тезаурусов" (ISO 5964:1985
"Guidelines for the establishment and development of multilingual
thesauri", IDT).
5. Приказом
Федерального агентства по техническому регулированию и метрологии от 31 октября
2007 г. N 287-ст межгосударственный стандарт ГОСТ 7.24-2001 введен в действие в
качестве национального стандарта Российской Федерации с 1 июля 2008 г.
6. Взамен ГОСТ
7.24-90.
1. Область
применения
Настоящий
стандарт распространяется на многоязычные информационно-поисковые тезаурусы
(далее - МИПТ) и устанавливает состав, структуру и основные требования к
построению МИПТ, применяемых в информационно-поисковых системах.
2.
Нормативные ссылки
В настоящем
стандарте использованы ссылки на следующие межгосударственные стандарты:
ГОСТ 7.25-2001.
Система стандартов по информации, библиотечному и издательскому делу. Тезаурус
информационно-поисковый одноязычный. Правила разработки, структура, состав и
форма представления
ГОСТ 7.74-96.
Система стандартов по информации, библиотечному и издательскому делу.
Информационно-поисковые языки. Термины и определения.
Примечание. При
пользовании настоящим стандартом целесообразно проверить действие ссылочных
стандартов по указателю "Национальные стандарты", составленному по
состоянию на 1 января текущего года, и по соответствующим информационным
указателям, опубликованным в текущем году. Если ссылочный стандарт заменен
(изменен), то при пользовании настоящим стандартом следует руководствоваться
заменяющим (измененным) стандартом. Если ссылочный стандарт отменен без замены,
то положение, в котором дана ссылка на него, применяется в части, не
затрагивающей эту ссылку.
3. Термины
и определения
В настоящем
стандарте применены термины по ГОСТ 7.74, а также следующие термины с
соответствующими определениями:
3.1. Многоязычный
информационно-поисковый тезаурус: информационно-поисковый тезаурус, содержащий
лексические единицы, взятые из нескольких естественных языков и представляющий
эквивалентные по смыслу понятия на каждом из этих языков.
Примечание. Предназначен для обработки документов (запросов) и
информационного поиска с целью обмена информацией на различных естественных
языках.
3.2. Одноязычный
информационно-поисковый тезаурус: информационно-поисковый тезаурус, содержащий
лексические единицы, взятые из одного естественного языка.
3.3. Язык-компонент
МИПТ: язык, на основе которого разработана какая-либо
из одноязычных версий.
3.4. Дескриптор
МИПТ: основная лексическая единица МИПТ, представляющая собой совокупность
эквивалентных дескрипторов одноязычных версий, связанных средствами для
указания эквивалентности.
4. Состав и
структура тезауруса
4.1. Обязательными
составными частями МИПТ являются:
- вводная часть;
- алфавитные
лексико-семантические указатели, включающие средства для указания эквивалентности
дескрипторов одноязычных версий (см. 4.4). Допускается в состав тезауруса
вводить систематические, пермутационные,
иерархические и другие указатели и списки специальных категорий лексических
единиц, а также приложения, содержащие дополнительные сведения о разработке и
использовании МИПТ.
4.2. Вводная часть
включает титульный лист и введение, составленные
согласно ГОСТ 7.25 и изложенные на одном или нескольких языках-компонентах.
На титульном листе
следует указывать все языки-компоненты. Рекомендуется наименование тезауруса на
титульном листе формулировать на одном языке, а дополнительно к основному
титульному листу включать во вводную часть титульные листы на всех
языках-компонентах. Введение должно содержать краткое описание методических
принципов установления эквивалентности дескрипторов одноязычных версий, а также
указание на то, что тезаурус разработан в соответствии с настоящим стандартом.
Рекомендуется в состав вводной части включать полный или сокращенный перевод
введения на всех языках-компонентах.
4.3. Алфавитный
лексико-семантический указатель в каждой из одноязычных версий содержит
перечень тезаурусных статей, расположенных в алфавитном порядке заглавных
лексических единиц на соответствующем языке-компоненте. Состав и структура
тезаурусных статей в лексико-семантических указателях одноязычных версий - по
ГОСТ 7.25.
4.4.
Средства для указания эквивалентности дескрипторов одноязычных версий
реализуются введением в тезаурусную статью кода эквивалентности дескрипторов
(идентификационного кода) и (или) эквивалентных дескрипторов на
языках-компонентах.
При использовании
идентификационных кодов в дополнение к алфавитному лексико-семантическому
указателю МИПТ составляют указатель идентификационных кодов, в котором каждому
коду приписывают соответствующие дескрипторы одноязычных версий.
4.5.
Систематические, иерархические и пермутационные
указатели строятся по ГОСТ 7.25 на языках-компонентах и содержат средства для
указания эквивалентности дескрипторов одноязычных версий. Примеры использования
средств для указания эквивалентности дескрипторов
приведены в Приложении А.
4.6. Состав и
структура одноязычных версий должны соответствовать следующим требованиям:
- в каждой
одноязычной версии должны содержаться все дескрипторы, необходимые для
представления онтологии предметной области с целью поиска и обмена информацией
между системами, использующими различные языки;
- классы условной
эквивалентности лексических единиц одноязычных версий должны соответствовать
друг другу по объему выражаемых понятий;
- соответствующие
друг другу дескрипторы отдельных одноязычных версий должны иметь по возможности максимально совпадающие парадигматические
отношения.
Одноязычные версии
допускается дополнять дескрипторами, не являющимися необходимыми для
межъязыкового обмена и отсутствующими в других одноязычных версиях; при этом
указывают иерархическую подчиненность их какому-либо дескриптору МИПТ.
Одноязычные версии
могут включать парадигматические отношения, отсутствующие в других одноязычных
версиях, если они на данном языке-компоненте уточняют понятия, выраженные
дескриптором МИПТ, и не противоречат его пониманию в других языках-компонентах.
5. Основные
требования к построению многоязычных
информационно-поисковых
тезаурусов
5.1. Содержание
работ по формированию одноязычных версий определяют наличием или отсутствием
одноязычных тезаурусов по данной тематике на языках-компонентах.
5.1.1. При
отсутствии одноязычных тезаурусов по данной тематике на языках-компонентах, как
правило, сначала создают одну одноязычную версию и на ее основе строят
остальные.
Возможна также
совместная разработка одновременно всех или нескольких одноязычных версий при
взаимном согласовании состава дескрипторов и их парадигматических связей.
5.1.2. При наличии
тезауруса по данной тематике на одном из языков-компонентов, как правило, его
берут за основу разрабатываемого МИПТ. Другие одноязычные версии формируют
подбором эквивалентов дескрипторов этого тезауруса на языках-компонентах. При
этом возможны различные степени семантического соответствия эквивалентов
дескрипторов на различных языках.
5.1.3. При наличии
нескольких исходных тезаурусов по данной тематике на языках-компонентах
разработка МИПТ ведется подбором эквивалентных дескрипторов в данных тезаурусах
(см. 5.2.1 и 5.2.2). Дескрипторы, не имеющие эквивалентов в отдельных
одноязычных версиях, переводят на соответствующие языки и включают в
одноязычные версии, в которых этот дескриптор первоначально отсутствовал. При
этом следует вносить в исходные тезаурусы изменения, необходимые для согласования
одноязычных версий.
5.1.4.
Рекомендуется одну из одноязычных версий выбирать в качестве базовой и
устанавливать эквивалентность дескрипторов других одноязычных версий по
отношению к дескрипторам базовой версии.
5.2. При
установлении эквивалентности дескрипторов различных одноязычных версий
необходимо различать на разных языках-компонентах следующие степени
эквивалентности терминов:
- полная;
- неполная;
- частичная;
- отсутствие
эквивалентного термина.
5.2.1. При
наличии в языках-компонентах полностью эквивалентных терминов их считают
представителями одного дескриптора МИПТ.
5.2.2. При
отсутствии в языках-компонентах полных эквивалентов для выражения одного и того
же понятия в качестве дескриптора МИПТ в одноязычных версиях используют
неполные и частичные эквиваленты.
Неполными
эквивалентами являются термины, для которых объемы выражаемых ими понятий
пересекаются.
Частичными
эквивалентами являются термины, для которых объем понятия, выражаемого одним
эквивалентом, входит в объем понятия, выражаемого другим эквивалентом.
5.2.2.1. Если
различие в объеме понятий между неполными или частичными эквивалентами
несущественно для данного МИПТ, то их можно использовать для представления
дескриптора МИПТ в разных одноязычных версиях, например:
ru: АННОТАЦИЯ
fr:
5.2.2.2. Если
различие в объеме понятий между неполными или частичными эквивалентами
существенно, то при представлении дескриптора МИПТ в одноязычных версиях
значение используемого термина уточняют одним из следующих способов:
- добавлением релятора (см. 5.2.2.3);
- добавлением
примечания (см. 5.2.2.4);
- включением
термина в уточняющее словосочетание с определяющими словами (см. 5.2.2.5);
- введением условно
эквивалентных аскрипторов в тезаурусную статью
дескриптора одноязычной версии (см. 5.2.2.6);
- использованием
комбинации двух или более терминов (см. 5.2.2.7).
5.2.2.3.
Добавление релятора, который является частью
дескриптора, применяют в тех случаях, когда для более полного соответствия содержанию
дескриптора необходимо ограничивать объем понятия, выражаемого термином,
например:
англ. русск.
TREE ДЕРЕВО (РАСТЕНИЕ)
WOOD (MATERIAL) ДЕРЕВО (МАТЕРИАЛ)
WOOD (LANDSCAPE) ЛЕС (ЛАНДШАФТ)
5.2.2.4.
Добавление примечания, которое не является частью дескриптора, используют в
случаях уточнения объема понятия, выраженного соответствующими дескрипторами на
разных языках-компонентах, например:
франц. русск.
AFFILIATION
МЕСТО РАБОТЫ (как элемент библиографического
описания, обозначающий место работы автора
публикации)
5.2.2.5.
Включение термина в уточняющее словосочетание применяют в тех случаях, когда
требуется ограничивать объем понятия и данное словосочетание устойчиво
употребляется в документах, например:
англ. русск.
CRANE
(MACHINE) ПОДЪЕМНЫЙ КРАН
5.2.2.6.
Введение условно эквивалентных аскрипторов в
тезаурусную статью дескриптора одноязычной версии применяют в тех случаях,
когда они необходимы для однозначного представления понятия в данной версии,
например:
англ. русск.
GRAPH ГРАФИК
UF diagram chart
5.2.2.7.
Если исходный дескриптор обозначает понятие, не выраженное в виде единого
термина на другом языке-компоненте, то допускается использовать в одноязычной
версии в качестве эквивалента комбинацию двух и более дескрипторов одноязычной
версии, например:
франц.
русск.
CARTE
PERFOR
E +
SELECTION ПЕРФОКАРТА РУЧНОГО
MANUELLE ОБРАЩЕНИЯ
REFERER ANALYTIQUE +
LABORATION РЕФЕРИРОВАНИЕ
5.2.3. При
отсутствии лексического эквивалента в одном из языков-компонентов допускаются
решения, приведенные в 5.2.3.1 - 5.2.3.5.
5.2.3.1. Создание
нового термина переводом или калькированием иноязычного дескриптора, например:
англ. франц. русск.
FIVE-YEAR
PLAN PLAN
QUINQUENNAL ПЯТИЛЕТНИЙ ПЛАН
5.2.3.2.
Использование в качестве эквивалента словосочетания, например:
англ. русск.
CORER МАШИНА ДЛЯ УДАЛЕНИЯ
СЕРДЦЕВИНЫ ПЛОДА
5.2.3.3.
Заимствование иноязычного термина, например:
англ. русск.
FILE ФАЙЛ
5.2.3.4.
Использование в качестве эквивалента термина с близким значением, например:
франц. русск.
OUTILS
LINGUISTIQUES ЛИНГВИСТИЧЕСКОЕ
ОБЕСПЕЧЕНИЕ
англ. русск.
TEENAGER
ПОДРОСТОК
5.2.3.5.
Использование в качестве эквивалента термина, более широкого по значению и не
входящего в лексический состав данной тематической области, например в МИПТ по
библиотечному делу:
франц. русск.
ANIMATEUR
ОРГАНИЗАТОР КУЛЬТМАССОВОЙ РАБОТЫ
5.3. По
окончании разработки МИПТ представляют для регистрации в национальный и/или
международный центр ведения информационно-поисковых языков. МИПТ представляют в
составе всех его одноязычных версий.
Каждая одноязычная
версия МИПТ может быть представлена как одноязычный тезаурус с иноязычными
эквивалентами.
Национальные и
международные центры ведения информационно-поисковых языков предоставляют
заинтересованным лицам сведения о зарегистрированных
МИПТ на условиях, определяемых разработчиком.
Форма представления
одноязычных версий - по ГОСТ 7.25 и 4.4.
5.4. Процесс
ведения МИПТ сводят к ведению его одноязычных версий и к обеспечению их
согласованности. Изменения вносят одновременно во все одноязычные версии после
их согласования на уровне языков-компонентов.
Рекомендуется не
реже чем через пять лет обновлять сведения о МИПТ, зарегистрированных по 5.3.
Приложение А
(справочное)
ПРИМЕРЫ
ИСПОЛЬЗОВАНИЯ СРЕДСТВ УКАЗАНИЯ ЭКВИВАЛЕНТНОСТИ
ДЕСКРИПТОРОВ В
ОДНОЯЗЫЧНЫХ ВЕРСИЯХ
Примеры
1.
Использование цифровых идентификационных кодов, не зависящих
от языка:
STA
A - дескриптор на польском языке
086210 -
идентификационный код
а CHARAKTERYSTYKA
INDEKS
MODUL
STA
Y
WSKAZNIK (LICZBA)
2.
Использование эквивалентов дескрипторов на другом языке:
КОНСТАНТА - дескриптор
на русском языке
STA
A - дескриптор на польском языке
с Постоянная
а КОЭФФИЦИЕНТ
МОДУЛЬ
ПОКАЗАТЕЛЬ
ХАРАКТЕРИСТИКА
3.
Использование эквивалентов дескрипторов на других языках
и идентификационных кодов:
БЕНЗИНЫ - дескриптор на
русском языке
fre: ESSENCE MOTEUR - дескриптор на французском языке
eng: GASOLINE -
дескриптор на английском языке
pol: BENZYNA -
дескриптор на польском языке
011420 -
идентификационный код
в НЕФТЕПРОДУКТЫ СВЕТЛЫЕ
ТОПЛИВО ЖИДКОЕ
ТОПЛИВО КАРБЮРАТОРНОЕ
н БЕНЗИНЫ АВИАЦИОННЫЕ
БЕНЗИНЫ АВТОМОБИЛЬНЫЕ
БЕНЗИНЫ АЛКИЛИРОВАННЫЕ
4.
Использование совместного расположения статей на двух языках:
русский язык немецкий
язык
АМАЛЬГАМА СЕРЕБРА
SILBERAMALGAM
в МЕТАЛЛЫ OB METALLE
н КУПРОАРКВЕРИТ UB CUPROARQUERIT