Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Attribute weights are particularly important for the functioning of the general search (less so – for the advanced one) and make it possible to control how much the matching of the value of a particular attribute will influence the position of the object in the search results. For example, in the default configuration, attributes “Title” and “Creator” have the greatest weight, so after the “Tadeusz” word has been searched, objects which contain that name as a part of their title or author will appear at the beginning of the list, and objects which have that name in other attributes (for example, “Co-Creator”) or in their content will follow. In the case of some objects, the searched word may occur in their content or additional attributes so often that the strong match will take precedence over the set weights, and the object will have a better position than title-matched objects. The frequency of such an occurrence is one of the things which can be controlled by weight setting.

Wagi atrybutów ustawiane są w pliku serwera dLibra: Weight attributes are set in the conf/se/searchWeights.properties . Plik jest podzielony na sekcje:file of the dLibra server. The file is divided into sections:

  1. The weights of particular attributesWagi poszczególnych atrybutów:

    Code Block
    Title=25
    Creator=20

    W każdej linijce znajduje nazwa RDF atrybutu, oraz po znaku równości wartość przypisanej wagi. Im większa wartość, tym wyżej na liście wyników będą obiekty dopasowane po tym atrybucie. Ustawienie wagi na 0 spowoduje, że wyszukiwanie po takim atrybucie nie będzie możliwe.

    Every line contains the RDF name of an attribute and, after the equal sign, the value of the assigned weight. The higher the value, the higher the objects matched by that attribute will appear on the list. If the value of an attribute is set to 0, it will not be possible to search by that attribute.

  2. A special value for metadata in generalSpecjalna wartość dla metadanych w ogólności:

    Code Block
    dlibra_metadata=15

    Waga ta wpływa na wszystkie atrybuty, które nie zostały bezpośrednio zdefiniowane w poprzedniej sekcji. Pozwala na ustawienie priorytetu dopasowywania po metadanych względem wyszukiwania w treści.

    That weight has an impact on all attributes which have not been directly defined in the previous section. It makes it possible to set the priority of matching by metadata with respect to searching by content.

  3. A special value for searching by contentSpecjalna wartość dla wyszukiwania w treści:

    Code Block
    dlibra_content=1

    Waga ta wypływa na pozycję obiektów, w których udało się dopasować wyszukiwaną frazę do zawartości tekstowej plików z treścią obiektu.

    That weight has an impact on the position of objects for which the searched phrase has been matched to the text of the files with object content.

  4. Weights depending on the matching of date rangesWagi w zależności od dopasowania zakresów dat:

    Code Block
    date.match.perfect=100
    date.match.inside=50
    date.match.containing=20
    date.match.partial=1

    Atrybuty typu data pozwalają na przeszukiwanie ich po zakresach dat (np. przy pomocy formularza wyszukiwania zaawansowanego, lub po kliknięciu na wartość takiego atrybutu na stronie z opisem jakiegoś obiektu). Ta konfiguracja wpływa na to, że obiekty z przypisanym zakresem który jest dokładnie zgodny z wyszukiwanym zakresem (perfect, np. ten sam rok) znajdą się na początku listy wyszukiwania, dalej będą obiekty z zakresami zawierającymi się w wyszukiwanym zakresie (inside, np. jeden miesiąc w roku), zawierającymi wyszukiwany zakres (containing, np. dziesięciolecie zawierające rok) i pokrywające się z nim tylko częściowo (partial).

Listy stopwords

  1. Data-type attributes make it possible to search by date ranges (for example, with the use of the advanced search form or by clicking the value of such an attribute on a page with a description of an object). Thanks to that configuration, objects with an assigned range which corresponds precisely to the searched range (“perfect”, for example, the same year) will appear at the beginning of the search results list, followed by objects with ranges within the searched range (“inside”, for example, one month in the searched year), objects containing the searched range (“containing”, for example, a decade which contains the searched year), and objects with ranges which only partially overlap with the searched range (“partial”).

Stopwords Lists

Stopwords is a function of the search mechanism, which makes it possible to ignore certain words which are frequent in the given language but do not have any particular meaning, for example, connectives. Thanks to that function, search indexes take less space and operate faster, and search results are better matched to queries. In need, stopwords lists can be adjusted to the needs of a particular library. They are recorded in conf/soir Stopwords to funkcja mechanizmu wyszukiwania, która pozwala ignorować niektóre słowa, które często występują w danym języku, ale nie niosą konkretnej treści, np. spójniki. Dzięki niej, indeksy wyszukiwawcze zajmują mniej miejsca i szybciej działają, a wyniki wyszukiwania są lepiej dopasowane do intencji zapytania. W razie potrzeby listy stopwords można dostosować do potrzeb biblioteki - są zapisane w plikach conf/solr /main/conf/stopwords_**.txt oraz and conf/solrsoir/synonym/conf/stopwords_**.txt files, gdzie where ** to dwuliterowy kod językais a two-letter language code.