Додати наукову роботу | Статистика | Правила | Контакти |



Навігація
Наше опитування
Які інформаційні топіки, по-вашому, недостатньо висвітлені в мережі Internet?
мистецтво
політологія
маркетинг
сексопатологія
менеджмент
юриспруденція
музика
будівництво
медицина
філософія
психоаналіз
література
Друзья
Пошук

Пошук по сайту:


14 серпня 2009

Увага! У вас немає прав для перегляду схованого тексту.




Ірина Антоненко, Юрій Голубєв

Інформаційна технологія створення і ведення бази авторитетних даних найменувань колективних авторів

Проблема розробки системи авторитетного контролю (АК) багатогранна й складна. Одним із важливіших питань щодо її розв’язання є розробка інформаційної технології створення і ведення бази авторитетних даних (БАД) з найменувань колективних авторів.
Традиційна технологія передбачає нормалізацію форми найменування колективного автора тільки за умови його обрання заголовком бібліографічного запису, тому пошук за ознакою «колективний автор» у картковому каталозі обмежений. На відміну від традиційної, комп’ютерна технологія потребує нормалізації всіх найменувань колективних авторів незалежно від того, в якій області бібліографічного опису воно присутнє: взаголовку чи у відомостях про відповідальність. Це зумовлюється принциповими відмінами побудови електронного каталогу (ЕК) від карткового, зокрема, точками доступу стають усі найменування колективного автора, наявні в бібліо¬графічному записі, а не тільки ті, що стали заголовками.
АК як засіб, що забезпечує додаткові точки доступу до каталогізаційних записів та нормалізує їх подання, не тільки сприяє вдосконаленню функціональності ЕК, а й означає поступове просування до нових досягнень у сфері організації інформаційного пошуку з метою підвищення його повноти за рахунок отримання й використання при пошуку довідкових відомостей про такі елементи даних, як індивідуальний і колективний автор, уніфікована назва, географічна та предметна рубрики.
Головним фактором, що потребує обов’язкового створення й постійної підтримки БАД у системі ЕК, є незіставленість змісту елементів бібліографічних записів, що виникає на основі розбіжностей при їх складанні. Як засвідчив проведений аналіз даних, накопичених в інформаційному масиві ЕК НБУВ, ці розбіжності групуються за такими ознаками: змістовна (перейменування, абревіатура, інверсія, скорочення, псевдонім), графічна (мова наведення елементу бібліографічних даних), синтаксична (наявність пробілів), орфографічна (помилки). Вони призводять до розпорошеності в інформаційному масиві ЕК даних, що можуть бути уніфіковані засобами АК і, таким чином, доступними під єдиною уніфікованою точкою доступу.
БАД функціонально призначено для кумуляції в одному записі варіантів найменувань того самого елементу бібліографічних даних, який користувач може застосувати як ключовий термін у процесі пошуку.
Так, у БАД найменувань колективних авторів – це такі формулювання їх найменувань: 
1) уніфікований (авторитетний) заголовок (формулювання, що має застосовуватися без змін (поки не змінеться офіційна назва установи або організації) у заголовках бібліографічних записів і є тою формою, до якої будуються посилання типу «дивись»). Наприклад, «Національна бібліотека України імені В.І.Вернадського»;
2) т. зв. «пов’язаний» уніфікований заголовок (формулювання, котре містить уніфіковану форму колективного автора до його перейменування та є об’єктом посилань типу «див. також»). Наприклад, «Центральна наукова бібліотека АН УРСР»;
3) варіантний заголовок (формулювання, що відрізняється від прийнятого для уніфікованого заголовка і, як правило, створюється на основі найменування, наведеного в першоджерелі самою установою, а в бібліографічному записі – у відомостях про відповідальність бібліографічного запису, та є ¬об’єктом посилань типу «див.». Це може бути абревіатурна або інверсійна форма. Наприклад, «НБУВ».
Цінність такої БД з точки зору бібліотечно-інформаційної технології полягає в тому, що каталогізатору водночас доступні всі існуючи в ЕК точки доступу до уніфікованої (авторитетної) форми, і є можливість швидко внести зміни або виправлення, як, приміром, додавання нового варіанта форми найменування, необхідне при введенні інформації про нові надходження до ЕК. Щодо читачів, то вони отримують засіб, що сприятиме одержанню релевантної інформації з ЕК у найповнішому обсязі.
Отже, метою створення інформаційної технології підтримки системи АК є забезпечення навігації в ЕК при введенні, опрацюванні та пошуку каталогізаційних записів у ньому.
Основним принципом створення БАД є наявність у ній та в основній бібліографічній БД ЕК ряду властивостей, що збігаються. Так, формат подання авторитетних записів має бути структурно сумісним із форматом бібліографічних записів, оскільки ці типи записів являють собою взаємопов’язані елементи ЕК. 
Відзначимо, що при розробці формату введення записів до БАД використовується ідеологія формату UNIMARC/ AUTHORITIES. Це має позитивно вплинути на здійснення обміну авторитетними даними між бібліотеками. За взаємодії заголовків авторитетних і бібліографічних записів слід уникати обтяження різним змістом, бо ступінь узгодженості поміж ними має прямий вплив на результати пошуку релевантної інформації в ЕК. Отже, доцільно було б виробити таку систему правил щодо занесення інформації до ЕК, яка цілком виключить можливість їх суб’єктивного трактування. Було зведено до мінімуму вживання скорочень у полях, змістом яких є найменування колективних авторів. Це зумовлено необхідністю надати користувачеві ЕК, який не знає і не повинен знати правила скорочення при бібліографічному описі, комфортних умов пошуку.
Поелементний аналіз бібліографічних записів ЕК НБУВ сприяв прийняттю рішення щодо можливості автоматичного вилучення варіантів формулювань елементів бібліографічних записів із основного інформаційного масиву до БАД.
Практичні роботи з реалізації цього рішення були розпочаті з колективними авторами. Вилучалися такі види даних, як:
© найменування колективних авторів – із заголовків бібліографічних записів;
© варіанти найменувань колективних авторів – із відомостей про відповідальність бібліографічних записів;
© однакові відомості, подані в ЕК різними мовами.
Наступним методичним рішенням є одночасне створення авторитетних записів із бібліографічними записами на нові надходження.
Усі форми найменувань зберігаються в окремій БАД корпорацій CORP.
Термін «корпорація» визначає сукупність різних форм найменувань того самого колективного автора, відповідального за видання, що об’єдналися у ЕК під загальною ознакою – ідентифікаційним номером, який уможливлює виконання завдань навігації.
Технологія вирішує завдання підготовки даних з метою здійснення навігації користувача по корпораціях в ЕК та наповнення БД CORP. Підготовка даних полягає в додаванні до кожного бібліографічного запису ідентифікаційного номера корпорації та побудови точки доступу до запису за цим номером.
Наповнення здійснюється шляхом автоматичного перегляду бібліографічних записів нових надходжень і пошуку серед них нових форм найменувань колективного автора. Зі знайденої нової форми будується та додається новий запис до БД CORP.
Перегляд та пошук серед надходжень нових форм найменувань колективного автора виконується автоматично в окремій БД кожного каталогізатора по закінченню складання бібліо¬графічного запису. Вже сформовані записи з ідентифікаційним номером 00000 із кожної знайденої нової форми експортуються до проміжного файлу, з якого потрапляють до БД CORP. Кожний каталогізатор під час обробки нових записів у базі корпорацій «бачить» на екрані перелік «своїх» щойно сформованих форм найменувань колективного автора. По «гарячій» клавіші він має змогу вибрати будь-який запис та розпочати пошук в індексі корпорації, до якої зазначений запис може бути приєднаний. Під час перегляду існуючої корпорації користувач бачить на екрані перелік усіх форм найменувань колективного автора, що складають корпорацію та вибрану нову форму. Після прийняття рішення каталогізатор викликає меню маніпуляції та дає команду приєднати до вибраної чи сформувати нову корпорацію з поточного запису з автоматичною зміною ідентифікаційного номеру 00000 на номер обраної для приєднання або наступний для нової. Поточний запис несе в одному із своїх полів ідентифікаційний номер бібліографічного запису, з якого він був сформований (як джерело отримання форми найменування).
Схематично навігація в корпораціях здійснюється за таким алгоритмом: якщо користувач знайшов запис у 2 реєстрі індексу ЕК, де відображені всі найменування колективних авторів, що містяться в бібліографічних записах, то програма виводить на екран після бібліографічного запису перелік форм найменувань колективного автора, через точку доступу до якого він почав переглядати запис. Кожному елементу цього переліку відповідає і показана «гаряча» клавіша, при натисненні на котру програма встановлює вказівник індексу на записи, що мають точкою доступу обрану форму найменування колективного автора.
Технологія пройшла першу стадію побудови саме БД корпорацій, яка будувалася шляхом експорту до тимчасового файлу з ЕК кожного запису, що має поля колективного автора. Під час експорту запис формувався у форматі БД корпорацій. Потім тимчасовий файл сортувався, з нього вилучалися дублетні записи. З готового файлу будувалася БД корпорацій.
Другою стадією була розробка програмного забезпечення, спрямованого як на задоволення основних потреб технології, так і на виконання допоміжної функції: виправлення помилок у бібліографічних записах, знайдених під час роботи в БД CORP. Ця функція допомагає каталогізатору швидко знаходити серед великого масиву записів з одною точкою доступу та автоматично виправити помилку в знайденому записі. Помилковий запис після виправлення помилки отримує додаткове службове поле та точку доступу, що сприяє швидкому знаходженню цього запису і повторному його ¬перегляду.
Наступна стадія полягає в об’єднанні різних форм найменування однієї установи до корпорації під загальним ідентифікаційним номером та виправлення знайдених помилок. Цю роботу постійно проводить редактор.
Сподіваємося, що аналогічні технології будуть поширені на інші елементи бібліографічного запису, такі як індивідуальний автор, уніфікована назва тощо.


 (голосів: 0)
Коментарів: (0) Переглядів:1461 Автор: DiAnn Культура. Наука. Освіта Друк

Схожі новини



DNN.SU Дослідження новоі науки