Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Od wersji 6.0 dLibra pozwala dla każdego obiektu przechowywać i udostępniać pliki w różnych formatach. TODOSystem dLibra nie kontroluje tego, jakie faktycznie pliki trafią do konkretnego formatu (np. po rozszerzeniach), to redaktor musi o to zadbać.

Dostępne formaty są zdefiniowane w pliku conf/ms/formats.xml, którego przykład zaprezentowany jest poniżej:

Code Block
<?xml version='1.0' encoding='utf-8'?>
<formats>
    <format>
        <id>1</id>
        <name>DjVu</name>
        <index-priority>1</index-priority>
    </format>
    <format>
        <id>2</id>
        <name>PDF</name>
        <index-priority>2</index-priority>
    </format>
	....
</formats>

Dla każdego formatu przypisane są następujące wartości:

  • id - numer używany do przypisywania formatów w bazie danych. Każdy format musi mieć inną wartość, najlepiej jak są to kolejne liczby.
  • name - nazwa formatu, używana głównie w Aplikacji Redaktora. Standardowo jest to też nazwa podkatalogu w ramach obiektu cyfrowego, używana w ścieżce wszystkich plików należących do danego formatu. Nazwa ta nie jest bezpośrednio widoczna na stronach Aplikacji Czytelnika - tam są stosowane tłumaczenia, zdefiniowane w plikach WEB-INF/components/resources/WEBAPP_xx.xml
  • index-priority - priorytet formatu przy ekstrakcji warstwy tekstowej do celów indeksowania/wyszukiwania. System najpierw analizuje format o największej wartości index-priority, a w razie niepowodzenia (jeśli pliki w takim formacie nie istnieją lub nie znaleziono w nich tekstu), próbuje następne z coraz mniejszym priorytetem. Jeśli kilka formatów ma taki sam priorytet, to tekst ze wszystkich tych formatów zostanie zaindeksowany (o ile nie ma innego formatu z wyższym priorytetem, w którym udało się znaleźć tekst). Ujemna wartość index-priority oznacza, że dany format nigdy nie będzie używany do utworzenia warstwy tekstowej.

Zarządzanie atrybutami - konfiguracja eksportu metadanych
Anchor
export
export

...

  • dc - Dublin Core, najbardziej podstawowy format w bibliotekach cyfrowych. Dane w tym formacie są eksportowane przez stronę strony z opisem i treścią obiektu jako ukryte tagi meta, z których mogą korzystać różne systemy pobierające dane. Format ten jest również wykorzystywany przez protokół OAI-PMH. System dLibra wykorzystuje definicję tego formatu do rozpoznania, jakie role pełnią poszczególne atrybuty, np. który atrybut jest tytułem i powinien być wyszczególniony na stronie z opisem obiektu, a który zawiera tagi/słowa kluczowe, które powinny być wyświetlone w specjalny sposób pod opisem.
  • dcterms - rozszerzenie standardu DC. Format udostępniany przez OAI-PMH (prefix=oai_qdc)
  • bibtexris - formaty używane przez narzędzia do zarządzania bibliografią, dane udostępniane są na stronie z opisem obiektu, pod przyciskiem "Pobierz opis bibliograficzny".
  • highwire - format wykorzystywany głównie przez Google Scholar, udostępniany jako ukryte tagi meta na stronie z opisem obiektu.
  • edt - format wykorzystywany głównie przez organizację NDLTD, udostępniany przez OAI-PMH (prefix=aoi_etdms).

...