Referat fra møde i danZIG 12. maj 2003 – 39. møde
Tid og sted:
Mandag 12. maj 2003 kl. 9.30 -
15.00 i Biblioteksstyrelsen
Deltagere:
Henrik Dahl, Dantek
Hans-Henrik Felby, Fujitsu Invia
Ole Hultén,
DC Informatik (delvist)
Niels Jensen, Københavns
Kommunes Biblioteker (delvist)
Flemming H. Pedersen, CSC Consulting
Group
Jakob Chr. Poulsen, DBC Medier
Tommy Schomacker, DBC
Adam Dickmeiss,
gæstedeltager fra Index Data
Afbud fra:
Poul Henrik Jørgensen, Portia
Peder Lærke, Handelshøjskolens
Bibliotek, København
FORSLAG TIL DAGSORDEN:
1. Godkendelse af dagsorden
2. Godkendelse af referat fra
38. møde.
Referatet udsendt på listen
22. januar 2003.
Se også:
http://www.bs.dk/Indeks_post.ihtml?id=2984
3. Meddelelser og
konferencerapporter m.v.
Alle medlemmer bedes bidrage
med relevant information.
Foreløbig underpunkterne A+B.
Ny søgbarhed flerbindsværker i
Zpunkt.
Tommy orienterer om ny
søgbarhed på flerbindsværker i hoved-/bindstruktur på Zpunkt
/ DanBib, Jf. orientering udsendt på DBC's Z-INFO
5.2.2003.
arbejdsgruppe om søgbarhed af ikke-MARC baser Gruppen består af de anmeldte
repræsentanter fra danZIG-medlemsfirmaer m.v.: Bodil
Dalgaard-Møller (DBC), Mette Båstrup (Portia), Sebatian og Leif.
Første møde afholdt 2.5.2003,
hvorom Leif orienterer
European Digital Libraries (ECDL 2003) konferencen, hos NTNU i Trondheim 17.-22.
august 2003. Poul Henrik orienterer
Se mere:
http://www.ecdl2003.org/
4. Opsamling på emnerne på
sidste møde
Ikke dækket af denne
dagsordens øvrige punkter: Blanke i lokal ID (pkt. 6),
Lånercheck
(pkt. 8), Fælleskataloger (pkt. 10)
5. Implementeringsspørgsmål
6. danZIG-profilen:
justeringer af specifikationen
Gældende version downloades
fra http://www.bs.dk/Indeks_post.ihtml?id=2666
Bilag: udsendt på danZIG-listen 2. maj 2003:
Oplæg om justeringer af danZIG-profilen (J.nr. 331-3)
Oversigt over ILL-transaktioner Redaktionel ændring - opfølgning på
tidligere tilføjelse.
Angivelse af strenge
Redaktionel ændring -
præcisering.
Præcisering af DAN-1
Attribut-typer DAN-1 for andet
end USE. Principiel teknisk afklaring.
danMARC2 varianter / MARC OID
Redaktionel ændring -
medtagelse af OID-numre og opdatering
Kvalificering af attributter
Forslag om tilføjelse af ny
facilitet i profilen: anvendelsesmarkering
Nyt annex
Redaktionel tilføjelse: mapninger mellem USE attributter og søgekoder
Andre justeringer drøftet på
38. møde.
Indgår ikke i udsendt oplæg.
Mundtligt oplæg på mødet.
7. TEMA: Søgning på nettet:
alternativer til Z39.50?
I Web'ens
tidsalder er mere end et dusin år på bagen meget lang tid. Derfor et tema om
alternativer til Z39.50. Ikke fordi det ser ud til at Z39.50 er udfaset over
sommeren, men fordi det hele tiden er vigtigt at følge med. Sker det noget nyt?
Derfor findes også på Z39.50 Maintenance Agency's homepage en opsamling af initiativer kaldet for ZING,
se:
http://www.loc.gov/z3950/agency/zing/zing-home.html
NISO's initiativ om meta-søgning.
http://www.niso.org/committees/MetaSearch-info.html Sebastian deltager og har
lovet at berette nærmere
SRU/SRW - teknik og status
Adam Dickmeiss
fra Index Data giver et overblik over teknikken i SRU/SRW
samt et status for initiativet Index Data's Public SRW Service, se: http://indexdata.dk/srw/
8. TEMA: MARC-formater
I Danmark er der en aktuel
diskussion på baggrund af nogle større forskningsbibliotekers forslag om at
danMARC2 droppes og MARC21 tages i brug i stedet. På et mere teknisk plan er
der forskellige intiativer til at bære MARC-poster i XML i stedet for ISO2709.
danMARC2 eller MARC21?
Leif orienterer om et
igangværende udredningsarbejde
MARC og XML Baggrundsmateriale:
Library of Congress: http://www.loc.gov/marc/marcxml.html
OAI:
http://www.dlib.vt.edu/projects/OAi/marcxml/marcxml.html
Leif lægger op til en
principiel drøftelse om mulighederne / behovet for at supplere ISO2709 med et
XML Schema med henblik på datatransport i XML. Adam Dickmeiss fra Index Data giver et
eksempel på hvordan MARC-poster håndteres med XML med
Index Data's Public SRW
Service.
9. Mødeplan
40. møde: fastlægges
41. møde: fastlægges
10. Evt.
Leif åbnede mødet med at byde
velkommen og orientere om at mødefrekvensen fremover vil blive lidt lavere idet
udviklingen på området p.t. går knap så stærkt som tidligere. En anden årsag er
at arbejdsformen over tid har ændret sig således at flere emner behandles i
mindre arbejdsgrupper.
ad 1. Godkendelse af dagsorden
Dagsordenen blev godkendt.
ad 2. Godkendelse af referat fra 38. møde
Referatet blev godkendt.
ad 3. Meddelelser og konferencerapporter m.v.
Ny søgbarhed flerbindsværker i
Zpunkt
Tommy henviste til meddelelse
på Zpunkt som vil blive sendt til danZIG-listen.
[Sket 13.05.03] I forbindelse med omlægningen af DanBib-
og bibliotek.dk-baserne i maj blev der indført en
ændring i søgbarheden på hoved- sektions- og bindposter. Ændringen gælder søgning
på lokale id-numre, inkl. FAUST. Tommy henledte i
øvrigt opmærksomheden på Z-info og opfordrede til at abonnere på denne liste,
så det fremover undgås at skulle dobbeltinformere.
Punktet affødte en diskussion
omkring felterne 014 og 015. Søgning i felt 014 er altid mulig - i modsætning
til søgning i 015. Fra hovedposten kan man søge nedad hvilket kræver at
hovedposten er fuldt opdateret med bindpostinformation for at søge opad. Dette
er ikke obligatorisk i danMARC2
arbejdsgruppe om søgbarhed af ikke-MARC baser
Gruppen består af de tilmeldte
repræsentanter fra danZIG-medlemsfirmaer m.v.: Bodil
Dalgaard-Møller (DBC), Mette Båstrup (Portia),
European Digital Libraries (ECDL 2003) konferencen, hos NTNU i Trondheim
17.-22. august 2003
Poul Henrik er medlem af programkomiteen
der ledes af Traugott Koch fra
Universitetsbiblioteket i Lund. Der er kommet mange relevante forslag til
indlæg - også fra danske institutioner - og Poul Henrik opfordrer til at
deltage.
Se mere på:
http://www.ecdl2003.org/
Møde i ISO TC46 (Technical
Committee - TC46: Information and Documentation) i uge 21. International Organization for Standardization
(ISO):
Der er i uge 21 ISO TC46 (Technical Committee - TC46:
Information and Documentation) plenar-
og sub-komitémøder i Rom. Fra dansk side deltager
Tommy Schomacker, DBC og
I SC4 skal bl.a. - efter dansk
forslag - drøftes spørgsmålet om MARC i XML format. I en SC9 arbejdsgruppe
behandles forslag til ny model for ISBN.
Om Dansk Standard S-24
Information og Dokumentation,
se: http://www.ds.dk/1073
International Organization for Standardization (ISO)
http://www.iso.ch/iso/en/stdsdevelopment/tc/tclist/TechnicalCommitteeDetailPage.TechnicalCommitteeDetail?COMMID=1757
Konverteringstabel fra MARC21
til danMARC2
Der bliver p.t. arbejdet på en
konverteringstabel fra MARC21 til danMARC2.
Fjernlånskonferencen 2003 - teknik, etik og musik
I Leifs indlæg om bibliotek.dk
og danZIG - planer og perspektiver indgik en opsummering af BS' arbejde med
standardisering:
Det praktiske livs betingelser
indebærer at ikke alle leverandører understøtter de samme faciliteter, og ikke
alle biblioteker køber de samme moduler. Biblioteksstyrelsens rolle er at sikre
løsninger der er mest muligt standardiseret. DanBib binder systemerne sammen på
alle forskellige niveauer og måder. Derved sikres at ingen biblioteker kommer i
klemme. Funktionaliteten af en ILL request båret af Z
39.50 er bedre end en e-mail.
I forhold til de ovenstående
punkter punkter blev konverteringen mellem MARC21 og
danMARC2 hilst velkommen med en bemærkning om at det ville være godt hvis man
vælger et xml-schema til at beskrive konverteringen.
Leif lovede at lade det indgå i overvejelserne, men anførte at der i så fald
ikke bliver et tekstskema ved siden af.
ad 4. Opsamling på emnerne på sidste møde
Ikke dækket af denne
dagsordens øvrige punkter:
Lånercheck
(pkt. 8)
CSC Consulting,
Dantek, Integra og DBC
medier ytrede på forespørgsel fra Leif interesse for at deltage i et møde med
praktiske implementører med henblik på at indføre
lånercheck i 2003. Det er også muligt at melde sig efterfølgende. Mødet
påtænkes afholdt ultimo juni. Det bemærkes at principielle spørgsmål vil blive
vendt i danZIG. Der blev rejst spørgsmål og debatteret omkring target, krypterede forbindelser, understøttelse i
udviklingsværktøjer samt SOAP, protokolskift, SSL (secure
socket layer) og secure tunnels. Leif konkluderede at det vigtigste er at
lånercheck bliver lavet på én måde, og det skal være nemt at implementere. Der
er tre leverandører der er villige til at inkludere det i deres udviklingsplan.
Hvis de tre mener at noget skal justeres og kan blive enige om et kursskifte i
forbindelse med kommunikationsforbindelse, kan det godt lade sig gøre.
ad 5. Implementeringsspørgsmål
På en forespørgsel om nogen
henter flerbindsværker fra Z-punktet blev der svaret at Dantek
gør som DBC har beskrevet.
ad 6. danZIG-profilen:
justeringer af specifikationen
Gældende version downloades
fra: http://www.bs.dk/Indeks_post.ihtml?id=2666
Bilag: udsendt på danZIG-listen 2. maj 2003
Oplæg om justeringer af danZIG-profilen (J.nr. 331-3)
Oversigt over ILL-transaktioner
Redaktionel ændring -
opfølgning på tidligere tilføjelse.
Ingen kommentarer - vedtaget
Angivelse af strenge
Redaktionel ændring -
præcisering.
Ingen kommentarer - vedtaget
Præcisering af DAN-1
Attribut-typer DAN-1 for andet
end USE. Principiel teknisk afklaring: de 5 andre attributter knyttet til en
DAN-1 USE-attribut er BIB1 attributter. Afsnit 5.1.10-14 fjernes - og derudover foretages de redaktionelle
ændringer som er beskrevet i forslaget.
danMARC2 varianter / MARC OID
Redaktionel ændring - medtagelse
af OID-numre og opdatering
Ingen kommentarer - vedtaget
Kvalificering af attributter
Forslag om tilføjelse af ny
facilitet i profilen: anvendelsesmarkering. Leif foreslog at det blev tilføjet
som et annex hvor brugen af attributterne
registreres, således at profilen kan blive et praktisk arbejdsredskab. Leif bad
de leverandører der anvender andet end BIB1 attributter om at angive det til
ham inden 15. juni. Princippet blev godkendt og Leif udarbejder et forslag der
er klar til næste møde.
Nyt annex
Redaktionel tilføjelse: mapninger mellem USE attributter og søgekoder
Godkendt. Flere gave udtryk
for anerkendelse af Henriks indsats.
Andre justeringer drøftet på
38. møde
Leif orienterede om at
Biblioteksstyrelsen var ved at overveje hvordan XML Schemaer
skulle håndteres. Den tidligere annoncerede model med et repository
for biblioteks XML Schemaer på www.bs.dk vil måske
blive erstattet af en model, hvor sådanne Schemaer
placeres som en del af Infostrukturdatabasen. Den annoncerede gennemgang af
henvisninger til XML Schemaer i danZIG
specifikationen vil ske efter at dette er afklaret. Om InfoStrukturBasen,
se:
http://isb.oio.dk/info/about/dansk+intro/dansk_+intro.htm
ad 7. TEMA: Søgning på nettet: alternativer til Z39.50?
Der findes på Z39.50 Maintenance Agency's homepage en opsamling af initiativer kaldet for ZING,
se:
http://www.loc.gov/z3950/agency/zing/zing-home.html
NISO's initiativ om meta-søgning.
http://www.niso.org/committees/MetaSearch-info.html
Sebastian har den 7. - 8. maj
deltaget i NISO's workshop i Denver om Metasearch engines. Der var ca.
50 deltagere: bibliotekarer, firmaer der laver metasøgesystemer og som sælger
denne type systemer samt repræsentanter for indholdsleverandører, fx Elsevier og Gale. Det var i øvrigt indholdsleverandørerne
der prægede mødet mest. Biblioteksfolkene stillede i deres præsentationer nogle
krav, men forholdt sig ellers meget stille.
Nogle af de vigtigste emner,
der blev taget op, var 'rights management' og 'access control'. Desuden blev det
diskuteret hvordan man statistisk opgør brugernes anvendelse af metasearch engines samt hvordan
man standardiserer søgeprocessen. Alle var enige om at screen-scraping
ikke er godt, og at Z39.50 ikke løser behovene - det skal være xml-baseret. Der var også ønske om en større respekt for
leverandørernes egen branding
af informationerne.
Gruppen for søgning og
søgeresultater foreslog at en teknologisk anbefaling ledsages af et sæt 'etiske
retningslinjer'. Den anbefalede tre prioriterede muligheder for system-til-system adgang: helst ser man en xml-protokol - gerne SRW. Alternativet er en veldefineret
privat protokol.
Den næstbedste løsning er
anvendelse af Z39.50 understøttet af bath-profilen
Den tredje mulighed er en html grænseflade.
Producenterne af
metasøgesystemer har erkendt at det er umuligt at få alle til at understøtte
samme kommunikationsstandarder mellem systemer.
SRU/SRW - teknik og status
Adam Dickmeiss
fra Index Data gav et overblik over teknikken i
SRU/SRW (search retrieve url/search retrieve web) samt en
status for initiativet Index Data's
Public SRW Service,
se: ttp://indexdata.dk/srw/
Zing-paraply.
Specifikationerne vedlieholdes af Library of Congress. Version 1.0 er frigivet den 25. november 2002.
Samarbejdet på området har
været i gang ca. halvandet år. Index Data har
deltaget aktivt i knapt et år.
SRW egenskaber:
SRW er baseret på SOAP. Man
definerer i SRW en profil for, hvordan en server 'snakker'. Det sker primært
over HTTP POST. For SRU gælder at XML/indhold er identisk med SRW. SRU: HTTP
GET. SRU er nemmere at implementere i fx browsere. Basisfunktionaliteten er den
samme som i SRW. SRU er ikke så kraftfuld som SRW, da længden af en URL giver
nogle begrænsninger.
SRW SR kendetegn:
Service Search/retrieve/sort
kombineret. Søgesæt navngives af server. Der er ingen
databaser, og forespørgsler sker i CQL (query sprog).
Alt skal enkodes i XML - herunder poster.
Adgangskontrol er ikke en del af SRW.
SRW søgesæt:
Søgesæt kan navngives af server hvis det er muligt. Server
foreslår en levetid - time to live (TTL). Der er ingen garanti for
opretholdelse af dette, så klienten skal være forberedt! Klient TTL i version
1.1.
Databaser:
Databaser er udeladt på grund
af ønsket om en simpel protokol. URL sti kan anvendes som 'database', fx
http://myhost/mydatabase.
CQL 1:
Common query language har strengnotation. Minder om CCL (lidt om SQL).
CQL 2:
Der er specialtegn for termer.
Post 'schema':
Schema beskrives ved URI (streng). I de fleste tilfælde
svarer et schema til et bestemt XML schema, fx http://www.loc.gov/zing/srw/dcschema/1.0/ for
Dublin Core poster.
Status for implementationer:
5 - 8 er udviklet. Omkring 15
organisationer har planer om udvikling (antal på LoC's
site). Værktøjerne er udviklet i: Java, C, Python, C#
under .Net, Perl.
Erfaringer 1:
To protokoller (SRW, SRU) er
sværere at implementere end én. SRW/SRU kræver mere båndbredde og flere CPU ressourcer. SOAP værktøjer er nemme at bruge (til nemme
opgaver). Parallel Remote Procedure Control er svær. SRW, SRU har ikke en mekanisme for styring
af protokolversion.
Erfaringer 2:
CQL er nemmere at forstå end
RPN - få kan dog skrive en parser til denne. CQL er mindre generel end RPN og
sværere at udvide (i senere versioner). Nogle værktøjer har svært ved at
håndtere indlejret XML (for poster).
SRW i Danmark?
Danmarc2 kunne evt. bruge
samme struktur som MarcXML. CQL index set. Z39.50 gateways.
Leif vurderede SRW som
interessant, men ikke mere end der skal være en business case for at tage det i
anvendelse - og den skal være større end biblioteksverdenen. I øvrigt ser det
ikke ud til at tiden er moden til at det kan være en erstatning for Z39.50, da
SRW/SRU alene adresserer søgning. Vores anvendelse dækker også beholdning og
bestilling. Det er et område som danZIG arbejdsgruppen skal holde øje med.
Se slides på:
http://dickmeiss.net/files/danzig-srw.ppt
ad 8. TEMA: MARC-formater
danMARC2 eller MARC21?
Leif orienterede om et
igangværende udredningsarbejde foranlediget af nogle større
forskningsbiblioteker der ønsker at gå over til MARC21 fordi det ved import af
udenlandske data vil være en fordel. Derudover er der ingen faglige problemer
forbundet ved anvendelse af danMARC2, og et skift til MARC 21 vil give mange
andre problemer. Det skal bemærkes at ikke alle biblioteker har samme behov, og
en national løsning er ikke nødvendigvis optimal for alle biblioteker. Hvis der
skal være et skift vil det blive til et internationalt baseret format der ikke
er fordansket. Den aktuelle analyse skal dokumentere at der er en økonomisk
gevinst ved et skift. De nuværende katalogiseringsregler kan kun bruges med
MARC2. Et skift vil derfor indebære at de amerikanske regler skal anvendes, og
DK5 skal i givet fald også rettes til. MARC21 er mindre specifik end danMARC2.
MARC21 er mere kompleks med hensyn til systembehandling. Endelig vil
emnerepræsentationen i DBC's emneord, og den struktur
den repræsenteres i til danMARC2 ikke uden videre kunne finde en plads i det
ene felt der er til rådighed i MARC21. Biblioteksstyrelsen har endnu ikke
planlagt forløbet efter afslutningen på det faglige udredningsarbejde, men man
kan tænke sig en høring af interessenter.
Spørgsmålet er imidlertid om
tiden måske er løbet fra MARC-formatet der
grundlæggende er lavet til at udveksle bibliografiske registreringer via
magnetbånd. Ulempen er at MARC er biblioteksspecifik og kun kan bruges til
bibliografiske oplysninger. Det betyder at de mange ekstra oplysninger som nu
og i fremtiden vil blive brugt til at berige registreringerne i bibliotekernes
katalog og i fælleskatalogen ikke kan udveksles på en standardiseret måde. Der
er behov for at finde frem til et helt andet koncept - men om det tager et
eller fem år er ikke til at forudsige. Der tegner sig nogle tendenser omkring anvendelselsen af XML og mulighederne for at implementere
og anvende Functional Requirements
for Bibliographical Records.
MARC og XML
Der blev på mødet henvist til
det problem at danMARC2 specificerer anvendelse af delfelter i felt 001-009,
mens dette ikke tillades af det foreviste simple XML Schema
for MARC21, som i øvrigt ikke bærer MARC21 som sådan, men alene kan bære en MARC-post, som opfylder visse specifikationer (men altså incl. krav om faste felter for 001-009). Det blev endvidere
nævnt at dette faktisk ikke er noget nyt, men også er et problem i relation til
håndtering af danMARC2 poster under transport med ISO2709, da denne standard
har samme type begrænsning.
Leif orienterede om at Dansk
Standard S24 havde foreslået et "item for discussion"
på TC46/SC4 møde i Rom i den efterfølgende uge om netop MARC-poster
båret med XML som muligt supplement til ISO2709. Spørgsmålet drøftes nærmere på
næste danZIG-møde på grundlag af referat af
behandlingen på TC46/SC4-mødet.
ad 9. Mødeplan
40. møde: 15. september - 9.30
- 15.00
41. møde: 1. december - 9.30 -
15.00
ad 10. Evt.
Intet