Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Configuring Multi-Format

Anchor
formats
formats

Od wersji 6.0 dLibra pozwala dla każdego obiektu przechowywać i udostępniać pliki w różnych formatach. System dLibra nie kontroluje tego, jakie faktycznie pliki trafią do konkretnego formatu (np. po rozszerzeniach), to redaktor musi o to zadbać.

Since version 6.0, it has been possible to store and share files in different formats for every object. The dLibra system does not control which files are ascribed to which format (for example, by filename extensions) – the editor must take care of that.

The available formats are defined in file Dostępne formaty są zdefiniowane w pliku conf/ms/formats.xml, którego przykład zaprezentowany jest poniżejwhich looks as follows:


Code Block
languagexml
titleformats.xml
<?xml version='1.0' encoding='utf-8'?>
<formats>
    <format>
        <id>1</id>
        <name>DjVu</name>
        <index-priority>1</index-priority>
    </format>
    <format>
        <id>2</id>
        <name>PDF</name>
        <index-priority>2</index-priority>
    </format>
	....
</formats>

Dla każdego formatu przypisane są następujące wartości:

The following values are assigned for each format:

  • id – identifiers for assigning formats in the database; every format must have a different value, preferably a subsequent number;
  • name – the name of a format, used mainly in the Editor Application; by default, it is also the name of a subdirectory in a digital object, which is used in the path of all files belonging to the given format; that name is not directly visible on the pages of the Reader Application (where translations, defined in files
  • id - numer używany do przypisywania formatów w bazie danych. Każdy format musi mieć inną wartość, najlepiej jak są to kolejne liczby.
  • name - nazwa formatu, używana głównie w Aplikacji Redaktora. Standardowo jest to też nazwa podkatalogu w ramach obiektu cyfrowego, używana w ścieżce wszystkich plików należących do danego formatu. Nazwa ta nie jest bezpośrednio widoczna na stronach Aplikacji Czytelnika - tam są stosowane tłumaczenia, zdefiniowane w plikach WEB-INF/components/resources/WEBAPP_xx.xml
  • index-priority - priorytet formatu przy ekstrakcji warstwy tekstowej do celów indeksowania/wyszukiwania. System najpierw analizuje format o największej wartości  – the priority of a format during text extraction for indexing/searching; first, the system analyzes the format with the greatest value of index-priority, a w razie niepowodzenia (jeśli pliki w takim formacie nie istnieją lub nie znaleziono w nich tekstu), próbuje następne z coraz mniejszym priorytetem. Jeśli kilka formatów ma taki sam priorytet, to tekst ze wszystkich tych formatów zostanie zaindeksowany (o ile nie ma innego formatu z wyższym priorytetem, w którym udało się znaleźć tekst). Ujemna wartość index-priority oznacza, że dany format nigdy nie będzie używany do utworzenia warstwy tekstowej.

...

Mimo że schemat atrybutów można modyfikować z poziomu Aplikacji Administratora, należy pamiętać, że po dodaniu nowych atrybutów warto uwzględnić je w konfiguracji eksportu metadanych. Konfiguracja ta znajduje się w katalogu serwera dLibra: conf/ms, w plikach o nazwach kończących się na -export.properties, np. dc-export.properties. Pierwszy człon nazwy pliku wskazuje format eksportowy, którego dotyczy plik:

  • and in the case of a failure (there are no files in that format, or they exist, but there is no them), the system proceeds to analyze the format which follows on the scale of priority (and so on). If several formats have the same priority, the text from all of them will be indexed (unless there is a format with a higher priority in which text has been found). A negative value of index- priority means that the format will never be used for creating a textula layer.

Managing Attributes – Configuring Metadata Export

Anchor
export
export

Although the attribute schema can be modified from the level of the Administrator Application, it is good to include new attributes in the metadata export configuration. That configuration is in the conf/ms directory of the dLibra server, in files ending with export.properties, for example, dc-export.properties. The first part of the name of such a file indicates the export format to which the file pertains:

  • dc – Dublin Core, the most basic format in digital libraries; data in that format are exported through pages with the description and content of an object as hidden meta tags for use by various data retrieval systems; that format is also used by the OAI-PMH; The dLibra system uses the definition of that format to identify the roles of particular attributes, for example, which attribute is a title and should be highlighted on the page with the description of an object and which contains tags/key words which should be displayed in a special manner below the description.
  • dcterms – an extension of the DC standard; the format is made available by
  • dc - Dublin Core, najbardziej podstawowy format w bibliotekach cyfrowych. Dane w tym formacie są eksportowane przez strony z opisem i treścią obiektu jako ukryte tagi meta, z których mogą korzystać różne systemy pobierające dane. Format ten jest również wykorzystywany przez protokół OAI-PMH. System dLibra wykorzystuje definicję tego formatu do rozpoznania, jakie role pełnią poszczególne atrybuty, np. który atrybut jest tytułem i powinien być wyszczególniony na stronie z opisem obiektu, a który zawiera tagi/słowa kluczowe, które powinny być wyświetlone w specjalny sposób pod opisem.
  • dcterms - rozszerzenie standardu DC. Format udostępniany przez OAI-PMH (prefix=oai_qdc);
  • bibtexris - formaty używane przez narzędzia do zarządzania bibliografią, dane udostępniane są na stronie z opisem obiektu, pod przyciskiem "Pobierz opis bibliograficzny".
  • highwire - format wykorzystywany głównie przez Google Scholar, udostępniany jako ukryte tagi meta na stronie z opisem obiektu.
  •  – formats used by bibliography management tools, data are made available on the page with the description of an object, by means of a button (“Download the catalog record”);
  • highwire – that format is used mainly by the Google Scholar web search engine and is made available as hidden meta tags on the page with the description of an object;
  • edt – that format is used mainly by the NDLTD organization and is made available through the edt - format wykorzystywany głównie przez organizację NDLTD, udostępniany przez OAI-PMH (prefix=aoi_etdms).

Przykładowy fragment pliku Here is a sample fragment of the “dc-export.properties” file:

Code Block
contributor = Contributor
coverage    = Coverage, Spatial, Temporal
creator     = Creator

Każda linijka zaczyna się od nazwy pola/atrybutu w eksportowanym formacie, a po znaku równości znajduje się nazwa RDF atrybutu w dLibrze, lub lista takich nazw rozdzielanych przecinkiem.

Every line begins with a field/attribute name in the exported format, and the equal sign is followed by the RDF name of the attribute in the dLibra system or by a list of such names, comma-separated.

Configuring

...

Self-Archiving
Anchor
selfarchiving
selfarchiving

Funkcja self-archiving w standardowej konfiguracji jest dostępna tylko dla tych użytkowników, którym ustawiono katalog domowy. W niektórych instytucjach może się przydać zmiana, żeby wszyscy użytkownicy mogli dodawać swoje obiekty. W tym celu należy zmienić w pliku In the standard configuration, he “Self-archiving” function is only available to those users for whom a home directory has been set. In some institutions, it may be advisable to change that setting so that all users can add their objects.  For that purpose, the value of the “wwwPublicationAllowed” entry in file /conf/ms/service.properties wartość wpisu wwwPublicationAllowed na true. W takim przypadku, dla każdego użytkownika, który skorzysta z self-archiving, a nie ma katalogu domowego, zostanie utworzony podkatalog w katalogu Publikacje Użytkowników i tam będą trafiały tworzone obiekty. Gdyby podkatalogi miały być tworzone w innym katalogu, wystarczy wstawić jego identyfikator w wartości publicDirectoryId file should be changed to true. In such a case, for every user who uses the “Self-archiving” function but does not have a home directory, a subdirectory will be created in the “User publications” directory, and the created objects will be put there. If subdirectories are to be created in another directory, the user just has to enter its identifier in the “publicDirectoryId” value.