1. Idea słownika synonimów

Idea tzw. synonimów ma na celu zwiększenie możliwości mechanizmu wyszukiwania zasobów w bibliotekach cyfrowych opartych na systemie dLibra. System dLibra w sposób automatyczny rozszerza zapytanie użytkownika o słowa/frazy przechowywane w słowniku synonimów. Dzięki takiemu postępowaniu użytkownik ma możliwość znalezienia większej liczby potencjalnie interesujących publikacji. Mechanizm ten został stworzony również aby zapytanie użytkownika mogło być niezależne od stosowanych w konkretnej bibliotece konwencji opisu obiektów cyfrowych (np. wykorzystanie różnych terminów na określenie tego samego pojęcia).

Aby lepiej zrozumieć zasadę działania słownika rozpatrzmy następujący przykład. Użytkownik podaje w zapytaniu w polu autor nazwisko Shakespeare. Przy pustym słowniku synonimów, zapytanie nie zostanie rozszerzone i odnalezione zostaną tylko te publikacje, których metadane (lub zawartość tekstowa) zawierają ciąg znaków Shakespeare. Jeżeli natomiast w słowniku synonimów dla słowa Shakespeare zdefiniowany zostanie synonim Szekspir, system będzie w stanie rozszerzyć zapytanie i przeszukać indeks wyszukiwawczy również pod kątem polskiej wersji pisowni tego nazwiska. Dzięki temu użytkownik nie musi wiedzieć, jakiej formy zapisu nazwiska użyli redaktorzy podczas opisywania publikacji. Należy podkreślić, że w powyższym przykładzie zapytanie zostanie rozszerzone zarówno dla zapytania Shakespeare (rozszerzenie o Szekspir) jak i w przypadku gdy użytkownik wpiszę Szekspir (rozszerzenie o Shakespeare).

Słowniki synonimów tworzone w dLibrze nie pozwalają na przechowywanie informacji o hierarchiach pojęć.

2. Konstrukcja słownika synonimów

Z jedną wartością można powiązać maksymalnie 4 synonimy.

System dLibra przechowuje tzw. słownik synonimów dla każdego z atrybutów w schemacie metadanych w każdym języku metadanych. W słowniku tym znajdują się co najmniej wszystkie wartości, które są użyte w metadanych zasobów biblioteki. Słownik może zawierać także słowa/frazy nieużywane bezpośrednio w metadanych. 

Słownik danego atrybutu dla konkretnego języka podzielony jest na grupy synonimów. Każda grupa może zawierać jedną lub więcej wartości atrybutów. W założeniu wartości należące do jednej grupy powinny być synonimami, wyrazami bliskoznacznymi lub być w jakikolwiek inny sposób powiązane ze sobą.

  1. W każdej grupie wyróżniona jest jedna wartość, zwana wartością bazową.
  2. Grupa zawsze bierze swoją nazwę od wartości bazowej.
  3. W obrębie danego słownika atrybutu dla konkretnego języka nie może istnieć więcej niż jedna grupa o tej samej nazwie.
  4. W obrębie danej grupy nie może być więcej niż jedna wartość o tej samej nazwie, natomiast wartości o tej samej nazwie mogą występować w różnych grupach dla tego samego atrybutu.

Słowniki synonimów mogą być modyfikowane z poziomu aplikacji redaktora bądź z poziomu aplikacji administratora systemu dLibra. Aby dodawać wartości do słownika synonimów konieczne jest posiadanie odpowiednich uprawnień (nie każdy redaktor musi posiadać takie uprawnienia).

Aplikacja administratora umożliwia zaawansowane zarządzanie słownikami synonimów jeśli przykładowo jakaś liczba publikacji została oznaczona w atrybucie Autor wartością Shakespeare i ta wartość nie miała przypisanego żadnego synonimu, to w prosty sposób można dopisać dowolną liczbę synonimów bez konieczności edytowania każdej publikacji osobno. Na przykład jeśli uprawniony redaktor do wartości Shakespeare doda w dowolnym momencie synonim Szekspir, to wszystkie publikacje oznaczone wartością Shakespeare będą również wyszukiwane po zadaniu zapytania Szekspir.

3. Słowniki kontrolowane

Każdy słownik synonimów może być oznaczony jako kontrolowany. Oznacza to, że redaktor będzie mógł tylko skorzystać z wartości wprowadzonych do tego słownika - nie będzie mógł dodać nowej wartości do tego słownika. Słowniki kontrolowane mają sens w atrybutach, które mają ograniczoną liczbę wartości, np. typ zasobu. W przypadku atrybutów typu tytuł lub autor zastosowanie słownika kontrolowanego z reguły nie ma uzasadnienia. 

  • No labels