Indhold
Hjælpepostformatets del 1 indeholder format til personnavne, korporationsnavne,
titler og emneord samt noter til disse. Felterne til titler og emneord er i
overensstemmelse med de normative titler og de emneordssystemer, som hovedformatet
understøtter.
Formatets opbygning og forholdet til USMARC
I sin opbygning svarer hjælpepostformatet til danMARC2 med en ramme med
feltkode og delfeltkoder, en kommenterende tekst og sidst eksempler. Hvor det
ikke har været i konflikt med danMARC2 er anvendt de samme feltkoder og
delfeltkoder som i USMARC. DanMARC anvender generelt flere delfelter end USMARC.
Endnu flere kommer til, fordi værdier fra indikatorerne skal lægges over i delfelter.
Fra USMARC er så vidt muligt medtaget alle de felter, der er obligatoriske samt
nogle af de valgfri. I de felter og delfelter, som er overtaget, er der ikke
ændret noget ved det indholdsmæssige.
Formatets anvendelsesområde
Hjælpepostformatet er tænkt til at kunne håndtere poster med navneformer på
personer, korporationer, titler og emneord. Det er udarbejdet ud fra en
forestilling om et nationalt autoritetsregister, som kan udveksle poster
med udlandet, men det kan også anvendes lokalt eller f.eks. i et regionalt
fællessystem.
Den vedtagne navneform inddateres i felt 1XX. Ikke vedtagne navneformer
inddateres i 4XX felterne og kan således danne udgangspunkt for se-henvisninger
med navneformen i 1XX som henvisningsmål.
Navneformer, der kan give anledning til se også-henvisninger inddateres i
5XX-felterne med navneformen i 1XX som henvisningsmål.
Det understreges, at hjælpepostformatet kun må indeholde identificerede
former, dvs. at man har konstateret det er samme person, korporation, etc.
Oversigt over danMARC2 til hjælpeposter
Begreberne postetiket og adresseliste findes ikke i danMARC2s hjælpepostformat,
som på det punkt følger hovedformatet. I USMARC er postetiket og adresseliste
positionsbestemte koder. Postetiketten (i USMARC: leader) består af 24 tegn
og adresselisten (i USMARC: directory) af 12 tegn. Ved konvertering til
USMARC skal ikke anvendte positioner i postetiket og adresseliste have
maskingenereret de krævede tegn, enten 0 (nul) eller blanktegn.
001-090 |
Numre og koder |
1XX |
Vedtagne former |
4XX |
Ikke vedtagne former eller se-henvisninger |
5XX |
Se også-henvisninger |
667-680 |
Noter |
880 |
Data i andet tegnsæt |
For yderligere oplysninger om det danske format, se danMARC2, 2. udgave.
Delfelter med fast betydning i hjælpepostformatet
Delfelt *å, feltnumerator, anvendes til at knytte to eller flere felter
i samme post sammen. Delfeltet er nævnt i mange af hjælpepostformatets
felter, men kan principielt anvendes i alle felter.
Delfelt *å står først i feltet og indeholder et tal fra 1 og opefter. Delfelt *å
kan gentages.
Verifikation (i USMARC: authentication). Da det er meningen, at hjælpepostformatet
også i givet fald skal kunne anvendes til et nationalt autoritetsregister med
henblik på udveksling med udlandet, er betydningen af verifikationsdelfelter
og -koder strammet i forhold til hovedformatet. De inddateres sidst i feltet.
Et tomt delfelt *0 knyttet til et felt betyder, at det er en form, der anvendes
i nationalbibliografien.
Delfelt *2 anvendes i emnedatafelter og indeholder oplysninger i form af en
kode for det anvendte emneordssystem. Koden skal godkendes af Katalogdataudvalgets
Sekretariat, før den tages i brug.
Delfelt *9 anvendes i klassifikationsdatafelter og indeholder oplysninger i
form af en kode for det anvendte klassifikationssystem. Koden skal godkendes
af Katalogdataudvalgets Sekretariat, før den tages i brug.
Alfabetiseringsangivelse
Når data i et givet delfelt skal sorteres (alfabetiseres) anderledes end tegn
for tegn fra venstre mod højre, anvendes alfabetiseringssymbol eller
alfabetiseringsdelfelt.
Alfabetiseringssymbol
Et specielt tegn (et alfabetiseringssymbol) angiver, hvor alfabetiseringen
i et givet delfelt skal starte. Som alfabetiseringssymbol anvendes ¤
(hexadecimalt: A4).
110 *a Det ¤Kongelige Bibliotek
Alfabetiseringsdelfelt
Et alfabetiseringsdelfelt er betegnet med et stort bogstav (A-Ø) og skal
umiddelbart efterfølges af en delfeltkode med det tilsvarende lille bogstav.
100 *A lacour *a La Cour *h Inger
100 *a Frederik *E 9 *e IX *f konge af Danmark
Der kan i princippet anvendes alfabetiseringsdelfelt foran ethvert delfelt
i en post. I praksis anvendes alfabetiseringsdelfeltet, hvor flere ord skal
alfabetiseres som ét ord eller bogstaver skal sorteres som tal.
Lokale felter og delfelter
Ønskes formatet udbygget til lokalt brug, anbefales det at anvende
bogstavfeltkoder, dvs. feltkoder der består af bogstaver eller en
kombination af bogstaver og tal.
Et delfelt *& er i alle felter reserveret til lokal anvendelse.
Ingen andre felter eller delfelter inden for intervallet 001-880 må anvendes
til rent lokale oplysninger.
Der bør desuden ikke anvendes lokale feltkoder til information, hvortil der
er defineret fælles feltkoder i formatet.
Tegnsæt
Som tegnsæt anvendes ISO 8859-1, også kaldet latinsk alfabet nr. 1. Det er
et 8-bit tegnsæt med plads til 256 forskellige tegn, idet der dog kun
er defineret 190 forskellige grafiske tegn (synlige tegn). For at kunne
anvende ISO 8859-1 til bibliografiske data har 3 tegn fået en speciel betydning:
-
- * delfeltkode (hexadecimal værdi 2A)
- @ skiftenøgle (hexadecimal værdi 40)
- ¤ alfabetiseringsmærke (hexadecimal værdi A4)
Skiftenøglen anvendes for at give plads for andre tegn inden for rammerne af
ISO 8859-1. Som referencetegnsæt anvendes principielt ISO 10646, som er et
4-dimensionalt tegnsæt med over 4 milliarder tegn-muligheder. Foreløbig
anvendes 2 dimensioner, kaldet BMP - Basic Multilingual Plane, og et fremmed
tegn angives på formen: @2030, hvor de første 2 tegn, dvs 20 (hexadecimal værdi),
angiver grundplanen, medens de sidste 2 tegn, dvs. 30, angiver tegnets placering
i planen. Som (enkelte) eksempler på grundplaner kan nævnes:
-
- 00 Basic Latin, Latin-1 Supplement (= ISO 8859-1)
- 01 Latin Extended-A, Latin Extended-B
- 04 Cyrillic
- 05 Armenian, Hebrew (Basic and Extended)
- 22 Mathematical Operators
- 4E CJK Unified Ideographs (Chinese, Japanese, Korean)
- 9F CJK Unified Ideographs (Chinese, Japanese, Korean)
Skelnen mellem gammel dansk å (Søndergaard) og dobbelt aa (dataanalyse)
kodes specielt:
-
- @å Lille gammelt å (aa)
- @Å Stort gammelt Å (Aa)
Meget specielle tegn, som ikke kan genfindes i ISO 10646, kodes ved at angive
den hexadecimale værdi for tegnet i fællestegnsættet med et foranstillet U, fx
-
- @UF9 Upadhmaniya
Hvis de tre tegn med speciel betydning anvendes med deres normale betydning
kodes de således:
-
- @@ commercial at
- @* asterisk
- @¤ currency sign
Kontroltegn som fx Start of Text, End of Text, Backspace, Line Feed og
Tape Mark gøres synlige, idet tegnenes placering i ISO 10646 overføres til
de tilsvarende ledige positioner i ISO 8859-1, hvorved de kan udskrives som
henholdsvis @0002, @0003, @0008 @000A og @0013.
En danMARC-hjælpepost har følgende liniebillede:
-
- @0002
- [ID-nummer]
- 001 *a .......
- 004 *r ....... *x ...
- 008 *p ...... *v...
- 100 *a ….. *h …
- @0003
Vedligeholdelse af danMARC2s hjælpepostformat
Anmodning om nye koder, ændringer eller tilføjelser til hjælpepostformatet
sker som for hovedformatet ved skriftlig henvendelse til
-
- Katalogdataudvalgets Sekretariat
- Biblioteksstyrelsen
- Nyhavn 31 E
- 1051 København K
På Biblioteksstyrelsens hjemmeside findes særlige blanketter til henvendelse
om rettelser i danMARC2.
Katalogdataudvalget tager stilling til oprettelsen af nye koder eller ændring
af eksisterende.