HeBIScocktail
Ausgabe: 1/2007

Neue CBS4-Version 3.0

Pica-System

Ende des Jahres 2006 konnte das Zentralsystem erfolgreich auf die neue Version 3.0 umgestellt werden. Ab dieser Version werden Zeichen intern im Unicode-Zeichensatz abgespeichert.

Für die Katalogisierung ändert sich damit erst einmal nichts; erst wenn die nächste WinIBW-Version (3.0) eingeführt werden kann, wird es auch möglich sein, andere Schriften als die lateinische oder weitere Sonderzeichen zu verwenden.
Das ist aber erst dann sinnvoll, wenn auch die Lokalsysteme von den neuen Möglichkeiten profitieren können. Derzeit werden aber alle Zeichen, die über den bisherigen Pica-Zeichensatz hinausgehen, beim Download ins LBS einfach übergangen und wären somit für die Nutzung durch lokale Module wie den lokalen OPAC, ACQ etc. verloren.
Pica wurde daher der dringende Wunsch vorgetragen, möglichst bald eine LBS-Version zu entwickeln, die die Möglichkeiten des CBS auch für die lokalen Anwender nutzbar macht. Mit einer entsprechenden Anpassung der LBS-Software ist frühestens im 2. Quartal 2007 zu rechnen.

Einige Änderungen sind im Zuge des Versionswechsels aber doch schon jetzt zu bemerken, und zwar hauptsächlich im Bereich der Indexierung.

A. Recherche

1.) Allgemeines

Zeichenumwandlung

Ab CBS4-Version 3.0 werden Zeichen intern im Unicode-Zeichensatz abgespeichert. Das macht sich aber nur an einigen wenigen Stellen wirklich bemerkbar:
Diakritika wurden für die Indexeinträge bislang "weggeworfen", bei der Suche konnten sie dann wahlweise mit eingegeben oder weggelassen werden.
In Zukunft bekommt man je nach Eingabevariante unterschiedliche Treffermengen. Läßt man die Diakritika weg, bekommt man _alle_ Titel, bei denen die sog. "normalisierte" Form, also die Form ohne irgendwelche Sonderzeichen, übereinstimmt. Gibt man Diakritika mit ein, erhält man nur die Titel, bei denen exakt das gleiche Sonderzeichen erfasst wurde.

Bsp.: f tit general -> alle Titel, in denen "General", "général" , "gèneral" u.ä. vorkommt f tit général -> nur die Titel, in denen das Wort "général" (oder auch "Général") enthalten ist

Alle Schreibweisen mit anderen Diakritika werden mit dieser Eingabe nicht gefunden!

Es empfiehlt sich daher i.d.R., Suchbegriffe normalisiert, also ohne Diakritika, einzugeben, um z.B. auch Datensätze mit falsch erfassten Sonderzeichen in die Treffermenge zu bekommen.

Außerdem müssen innerhalb eines Suchterms entweder alle Diakritika eingegeben oder alle komplett weggelassen werden. Mischformen führen zu Null-Treffer-Mengen: Bsp.:f tis republique américaine -> 0 Treffer f tis république américaine -> 2 Treffer f tis republique americaine -> 2 Treffer

Umlaut/Trema

Ein besonderes Problem gibt es derzeit noch bei der Behandlung von Umlauten einerseits, und Buchstaben mit Trema (also zwei übergesetzten Punkten) andererseits.

Bislang war es möglich, diese Unterscheidung für die nach RAK korrekte Indexierung zu nutzen: Umlaute erschienen im Index als Grundbuchstabe + e, bei Zeichen mit übergesetztem Trema wurde dieses für die Indexierung nicht beachtet.

Diese Unterscheidung ist z.Zt. in Pica nicht möglich.

So hatte man nur die Wahl, entweder alle Umlaute nur mit ihrem Grundbuchstaben zu indexieren (also z.B. "muller, josef" statt "müller, josef" zu verwenden), oder den entgegengesetzten Weg einzuschlagen: jedes Trema im dazugehörigen Indexbegriff in ein "e" umzuwandeln.

Da in unserem Datenbestand die Anzahl der Umlaute sicher größer ist als die der Buchstaben mit Trema (die z.B. bei französischen Wörtern, aber auch bei Transliterationen aus bestimmten Sprachen vorkommen können), haben wir uns für die letztere Variante entschieden, was dann allerdings in bestimmten Fällen zu fehlerhaften Indexeinträgen führt.

Bsp.:

 

Sortierzeichen

Bei den Phrasen-Suchschlüsseln für Titel und Körperschaften (TIS, SES, KOS) findet jetzt in allen den Fällen, in denen der String mit einem zu übergehenden Artikel beginnt, eine doppelte Indexierung statt: einmal mit, und einmal ohne den jeweiligen Artikel.

Diese Änderung wurde vor allem im Hinblick auf die später geplante Übernahme der neuen Indexierung für den Verbund-OPAC gemacht, um Benutzern in diesen Fällen mögliche 0-Treffer-Mengen zu ersparen.

Bsp.:

 

Nichtsortierzeichen

In der neuen Indextabelle gibt es zur Zeit einen Fehler bei der Behandlung von Nichtsortierzeichen.

Sie werden komplett ignoriert, was zur Folge hat, dass eigentlich zu übergehende Bestandteile aus Titeln oder Körperschaftsnamen momentan im Index zu finden sind.
Pica hat die Behebung des Fehlers in einer der nächsten CBS-Versionen zugesagt.

Bsp.: f tit instruktion hessen anhang -> 1 Treffer, obwohl vor „anhang“ ein Überlesungszeichen steht

2.) ADI

Es gibt einen neuen ADI: "SPR" für den Sprachcode.

Damit lässt sich zwar immer nur ein Sprachcode indexieren (ggf. vorliegende zweite und weitere Sprachcodes fallen also unter den Tisch), aber diese Lösung ermöglicht zum einen, dass wir später die sog. "Treffer-Analyse" des OPACs bedienen können und ist zum anderen auch die allgemein verwendete Variante unserer Pica-Partner.

Bsp.: f per kafka und spr cze -> findet alle Werke auf tschechisch von Kafka

3.) Nummern

Nummern werden in zwei verschiedene Indices aufgeteilt, einer für rein bibliothekarische Suchen, und einer, der auch von Benutzern evtl. gesuchte Nummern enthält. Dieser letztere enthält zudem auch alle die Nummern, die lt. Absprache mit der AG Gemeinsame Neukatalogisierung für eine verbundübergreifende Nummernsuche zur Verfügung stehen sollen.

Es gibt daher jetzt:

NUI (bibliothekarische Suche:

- ALD (Bibliographischer Nachweis alter Drucke)
- ALG (Allegro-ID-Nummer)
- BNR (Bestellnummer)
- BLI (Blackwell-ID-Nummer)
- DIA (BIBDIA-Nr.)
- FNR (Fremddaten-ID-Nr.)
- GKD (GKD-Nr.)
- LZI (Lizenzindikator)
- PND (PND-Nr.)
- SWD (SWD-Nr.)
- WVN (WV-Nr.)

NUM (Publikums-Suche):

- ADN (Amtliche Druckschriften-Nummer)
- DBN (DNB-Nummer)
- ISB (ISBN)
- ISS (ISSN)
- ISM (ISMN)
- NNR (Normnr.)
- PID (URN)
- RNR (Report-Nr.)
- ZDB (ZDBN)
- ZKT (neu, für den CODEN, einen Zeitschriften-Kurztitel)

Der Suchschlüssel BNU für die Buchnummer lässt sich in der neuen Indexierung nicht mehr in die allgemeinen Index NUM integrieren, da dieser nur noch Nummern auf Level 0 enthalten darf. BNU kann also nur noch "für sich allein" gesucht werden.

4.) Personen/Körperschaften


Von der AG Gemeinsame Neukatalogisierung wurde ein gemeinsamer Suchschlüssel für Personen und Körperschaften gefordert. Das lässt sich im Moment nur für die Stichwort-Suche realisieren.
Dieser Index ist mit dem Mnemocode "AUW" eingerichtet worden und enthält als Suchschlüssel:

- PEW (Verfassernamen Stichwort)
- PFW (gefeierte Personen, Stichwort)
- KOR (Körperschaften)

Ein Vorteil: Personennamen können in natürlicher Reihenfolge eingegeben werden, was sich vor allem im OPAC als nützlich erweisen kann.

Bsp.: f auw max born -> findet die Person Max Born und Körperschaften mit diesem Namensbestandteil und alle verknüpften Titel

Zu beachten ist allerdings, dass auf die Verwendung einer Stoppwortliste verzichtet wurde, da sonst zu viele Bestandteile von Personennamen (oder sogar komplette Namensformen) nicht suchbar gewesen wären. Dieser Verzicht wirkt sich auch auf den Suchschlüssel KOR aus!

Bsp.: f kor mit -> über 9000 Treffer; bislang 0 Treffer, da „mit“ in der Stoppwortliste steht

KOS ist (wie bislang schon KOR) jetzt auch direkt in den Titeldaten suchbar (z.B. bei Erwerbungsdatensätzen etc.).

5.) Sacherschließung

Die Unterscheidung zwischen SN und SNT wird aufgegeben; Systematiknummern für Bücher und Schlagwörter werden gemeinsam unter SN indexiert.

Auf den Suchschlüssel LCT (phrasenweise Indexierung des Ländercodes) wird künftig verzichtet, da die Indexierung mit LCO (Stichwortindex) ausreichend ist.
Bei dem Suchschlüssel BDC für DDC-Notationen haben wir eine Ergänzung vorgenommen: Notationen, die aus den Hilfstafeln stammen, bekommen ein differenzierendes Kürzel vorangestellt, damit gleichlautende Notationen voneinander unterschieden werden können.

Ein Beispiel: Die Notation 074 in der Haupttafel steht für "Journalismus und Zeitungen in Frankreich und Monaco", während die Notation aus der Hilfstafel 1 -T1--074 für "Museen, Sammlungen, Ausstellungen" steht. Beides wurde bislang im Schlüssel BDC als 074 indexiert. Jetzt findet man die erste Variante mit "f bdc 074", während der zweite Fall mit "f bdc t1 074" gesucht werden muss.

Der separate Suchschlüssel GDC "Notationen aus der geographischen Hilfstafel 2" kann daher jetzt entfallen;die entsprechenden Notationen können nun auch mit BDC gesucht werden.

Bsp.:f bdc t2 067

6.) Titel

Der Coden (Zeitschriften-Kurztitel) wurde aus Schlüssel "TIT" herausgenommen und bekam einen eigenen Suchschlüssel (ZKT, s. Punkt 2). Dies war eine Forderung der AG Gemeinsame Neukatalogisierung.

Bsp.:

 

7.) ALL-Suchschlüssel

Im Suchschlüssel ALL sind aufgrund der Festlegungen in der AG Gemeinsame Neukatalogisierung auch alle Nummern des Indices NUM ergänzt worden.

Außerdem findet man auch die Sacherschließungselemente aus der Hessischen Bibliographie mit diesem Schlüssel.

B) Neue Kommandos

1.) Eingabe/Korrektur von Exemplardaten

Mit den Befehlen "e e*" bzw. "k e*" können alle Exemplardaten zu einem Titel gemeinsam eingegeben oder bearbeitet werden, ohne zusätzlich Level1- oder Level2-Daten im Bearbeitungsbildschirm anzeigen zu lassen.

2.) Kommando "f"

Früher bekam man mit der Eingabe von "f" ohne weitere Zusätze einen Überblick über alle im System verwendeten Suchschlüssel. Als die Anzahl der Schlüssel irgendwann zu groß wurde, kam an dieser Stelle nur noch eine Fehlermeldung.

Mit der neuen CBS-Version wurde dieses Kommando mit einer neue Funktionalität verbunden, nämlich einem maskengesteuerter Suchbildschirm, ähnlich denjenigen, die es bislang schon in den OPAC-Oberflächen gab.

Da aber eine Übersicht über die Suchschlüssel nach wie vor ein Desiderat war, haben wir beschlossen, in der aktuellen WinIBW-Version, die Ende des Jahres ausgeliefert wird, im Menü "Hilfe" (obere Task-Leiste) einen Link "Suchschlüssel" einzubauen, mit dem man auf eine entsprechende Handbuchseite geführt wird.

A. Hinrichs
powered by webEdition CMS