Referat fra møde i danZIG 12. maj 2003 – 39. møde

 

 

 

 

Tid og sted:

Mandag 12. maj 2003 kl. 9.30 - 15.00 i Biblioteksstyrelsen

 

Deltagere:

Leif Andresen, Biblioteksstyrelsen (formand)

Ann Poulsen, Biblioteksstyrelsen (referent)

Henrik Dahl, Dantek

Hans-Henrik Felby, Fujitsu Invia

Sebastian Hammer, Index Data

Ole Hultén, DC Informatik (delvist)

Niels Jensen, Københavns Kommunes Biblioteker (delvist)

Flemming H. Pedersen, CSC Consulting Group

Jakob Chr. Poulsen, DBC Medier

Tommy Schomacker, DBC

Alice Brødsgaard, Axiell Bibliotek

Adam Dickmeiss, gæstedeltager fra Index Data

 

Afbud fra:

Per Steen Hansen, Handelshøjskolens Bibliotek, Århus

Gert Jensen, SIRSI

Poul Henrik Jørgensen, Portia

Peder Lærke, Handelshøjskolens Bibliotek, København

 

FORSLAG TIL DAGSORDEN:

 

1. Godkendelse af dagsorden

 

2. Godkendelse af referat fra 38. møde.

Referatet udsendt på listen 22. januar 2003.

Se også: http://www.bs.dk/Indeks_post.ihtml?id=2984

 

3. Meddelelser og konferencerapporter m.v.

Alle medlemmer bedes bidrage med relevant information.

Foreløbig underpunkterne A+B.

Ny søgbarhed flerbindsværker i Zpunkt.

Tommy orienterer om ny søgbarhed på flerbindsværker i hoved-/bindstruktur på Zpunkt / DanBib, Jf. orientering udsendt på DBC's Z-INFO 5.2.2003.

arbejdsgruppe om søgbarhed af ikke-MARC baser Gruppen består af de anmeldte repræsentanter fra danZIG-medlemsfirmaer m.v.: Bodil Dalgaard-Møller (DBC), Mette Båstrup (Portia), Sebatian og Leif.

Første møde afholdt 2.5.2003, hvorom Leif orienterer

European Digital Libraries (ECDL 2003) konferencen, hos NTNU i Trondheim 17.-22. august 2003. Poul Henrik orienterer

Se mere: http://www.ecdl2003.org/

 

4. Opsamling på emnerne på sidste møde

Ikke dækket af denne dagsordens øvrige punkter: Blanke i lokal ID (pkt. 6),

Lånercheck (pkt. 8), Fælleskataloger (pkt. 10)

 

5. Implementeringsspørgsmål

 

6. danZIG-profilen: justeringer af specifikationen

Gældende version downloades fra http://www.bs.dk/Indeks_post.ihtml?id=2666

Bilag: udsendt på danZIG-listen 2. maj 2003:

Oplæg om justeringer af danZIG-profilen (J.nr. 331-3)

Oversigt over ILL-transaktioner Redaktionel ændring - opfølgning på tidligere tilføjelse.

 

Angivelse af strenge

Redaktionel ændring - præcisering.

Præcisering af DAN-1

Attribut-typer DAN-1 for andet end USE. Principiel teknisk afklaring.

danMARC2 varianter / MARC OID

Redaktionel ændring - medtagelse af OID-numre og opdatering

Kvalificering af attributter

Forslag om tilføjelse af ny facilitet i profilen: anvendelsesmarkering

Nyt annex

Redaktionel tilføjelse: mapninger mellem USE attributter og søgekoder

Andre justeringer drøftet på 38. møde.

Indgår ikke i udsendt oplæg. Mundtligt oplæg på mødet.

 

7. TEMA: Søgning på nettet: alternativer til Z39.50?

I Web'ens tidsalder er mere end et dusin år på bagen meget lang tid. Derfor et tema om alternativer til Z39.50. Ikke fordi det ser ud til at Z39.50 er udfaset over sommeren, men fordi det hele tiden er vigtigt at følge med. Sker det noget nyt?

Derfor findes også på Z39.50 Maintenance Agency's homepage en opsamling af initiativer kaldet for ZING,

se: http://www.loc.gov/z3950/agency/zing/zing-home.html

NISO's initiativ om meta-søgning. http://www.niso.org/committees/MetaSearch-info.html Sebastian deltager og har lovet at berette nærmere

SRU/SRW - teknik og status

Adam Dickmeiss fra Index Data giver et overblik over teknikken i SRU/SRW samt et status for initiativet Index Data's Public SRW Service, se: http://indexdata.dk/srw/

 

8. TEMA: MARC-formater

I Danmark er der en aktuel diskussion på baggrund af nogle større forskningsbibliotekers forslag om at danMARC2 droppes og MARC21 tages i brug i stedet. På et mere teknisk plan er der forskellige intiativer til at bære MARC-poster i XML i stedet for ISO2709.

danMARC2 eller MARC21?

Leif orienterer om et igangværende udredningsarbejde

MARC og XML Baggrundsmateriale:

Library of Congress: http://www.loc.gov/marc/marcxml.html

OAI: http://www.dlib.vt.edu/projects/OAi/marcxml/marcxml.html

Leif lægger op til en principiel drøftelse om mulighederne / behovet for at supplere ISO2709 med et XML Schema med henblik på datatransport i XML. Adam Dickmeiss fra Index Data giver et eksempel på hvordan MARC-poster håndteres med XML med Index Data's Public SRW Service.

 

9. Mødeplan

40. møde: fastlægges

41. møde: fastlægges

 

10. Evt.

Leif åbnede mødet med at byde velkommen og orientere om at mødefrekvensen fremover vil blive lidt lavere idet udviklingen på området p.t. går knap så stærkt som tidligere. En anden årsag er at arbejdsformen over tid har ændret sig således at flere emner behandles i mindre arbejdsgrupper.

 

 

ad 1. Godkendelse af dagsorden

Dagsordenen blev godkendt.

 

ad 2. Godkendelse af referat fra 38. møde

Referatet blev godkendt.

 

ad 3. Meddelelser og konferencerapporter m.v.

Ny søgbarhed flerbindsværker i Zpunkt

Tommy henviste til meddelelse på Zpunkt som vil blive sendt til danZIG-listen. [Sket 13.05.03] I forbindelse med omlægningen af DanBib- og bibliotek.dk-baserne i maj blev der indført en ændring i søgbarheden på hoved- sektions- og bindposter. Ændringen gælder søgning på lokale id-numre, inkl. FAUST. Tommy henledte i øvrigt opmærksomheden på Z-info og opfordrede til at abonnere på denne liste, så det fremover undgås at skulle dobbeltinformere.

Punktet affødte en diskussion omkring felterne 014 og 015. Søgning i felt 014 er altid mulig - i modsætning til søgning i 015. Fra hovedposten kan man søge nedad hvilket kræver at hovedposten er fuldt opdateret med bindpostinformation for at søge opad. Dette er ikke obligatorisk i danMARC2

 

 

arbejdsgruppe om søgbarhed af ikke-MARC baser

Gruppen består af de tilmeldte repræsentanter fra danZIG-medlemsfirmaer m.v.: Bodil Dalgaard-Møller (DBC), Mette Båstrup (Portia), Sebastian Hammer (Index Data) og Leif Andresen (BS). Første møde blev afholdt 2.5.2003. Gruppen vil først beskæftige sig med generelle forhold og definere hvilke access points der kunne være fornuftige. Herefter kan man konkretisere i forhold til bib1 attributter. Det skal foregå i forhold til de generelle attributter som fx use 4 attribut for title og ikke use 1097-1111 (de Dublin Core specifikke attributter). Udefra skal man ikke interessere sig for om der er tale om en Dublin Core database.

 

European Digital Libraries (ECDL 2003) konferencen, hos NTNU i Trondheim 17.-22. august 2003

Poul Henrik er medlem af programkomiteen der ledes af Traugott Koch fra Universitetsbiblioteket i Lund. Der er kommet mange relevante forslag til indlæg - også fra danske institutioner - og Poul Henrik opfordrer til at deltage.

Se mere på: http://www.ecdl2003.org/

 

Møde i ISO TC46 (Technical Committee - TC46: Information and Documentation) i uge 21. International Organization for Standardization (ISO):

Der er i uge 21 ISO TC46 (Technical Committee - TC46: Information and Documentation) plenar- og sub-komitémøder i Rom. Fra dansk side deltager Tommy Schomacker, DBC og Leif Andresen, BS i SC4 mødet (Technical Interoperability), og Leif Andresen i SC9 (Identifikatorer) samt Aase Lindahl, SDUB og Jan Trane Hansen, BS i SC8 (Statistik). Desuden deltager tre øvrige danske repræsentanter i SC11 (Records Management). Leif Andresen deltager som formand for Dansk Standard S24 i TC46 Plenarmødet.

I SC4 skal bl.a. - efter dansk forslag - drøftes spørgsmålet om MARC i XML format. I en SC9 arbejdsgruppe behandles forslag til ny model for ISBN.

Om Dansk Standard S-24 Information og Dokumentation,

se: http://www.ds.dk/1073

International Organization for Standardization (ISO)

Om TechnicalCommittee - TC46: Information and Documentation, se:

http://www.iso.ch/iso/en/stdsdevelopment/tc/tclist/TechnicalCommitteeDetailPage.TechnicalCommitteeDetail?COMMID=1757

 

Konverteringstabel fra MARC21 til danMARC2

Der bliver p.t. arbejdet på en konverteringstabel fra MARC21 til danMARC2.

 

Fjernlånskonferencen 2003 - teknik, etik og musik

I Leifs indlæg om bibliotek.dk og danZIG - planer og perspektiver indgik en opsummering af BS' arbejde med standardisering:

Det praktiske livs betingelser indebærer at ikke alle leverandører understøtter de samme faciliteter, og ikke alle biblioteker køber de samme moduler. Biblioteksstyrelsens rolle er at sikre løsninger der er mest muligt standardiseret. DanBib binder systemerne sammen på alle forskellige niveauer og måder. Derved sikres at ingen biblioteker kommer i klemme. Funktionaliteten af en ILL request båret af Z 39.50 er bedre end en e-mail.

I forhold til de ovenstående punkter punkter blev konverteringen mellem MARC21 og danMARC2 hilst velkommen med en bemærkning om at det ville være godt hvis man vælger et xml-schema til at beskrive konverteringen. Leif lovede at lade det indgå i overvejelserne, men anførte at der i så fald ikke bliver et tekstskema ved siden af.

 

 

ad 4. Opsamling på emnerne på sidste møde

 

Ikke dækket af denne dagsordens øvrige punkter:

Lånercheck (pkt. 8)

CSC Consulting, Dantek, Integra og DBC medier ytrede på forespørgsel fra Leif interesse for at deltage i et møde med praktiske implementører med henblik på at indføre lånercheck i 2003. Det er også muligt at melde sig efterfølgende. Mødet påtænkes afholdt ultimo juni. Det bemærkes at principielle spørgsmål vil blive vendt i danZIG. Der blev rejst spørgsmål og debatteret omkring target, krypterede forbindelser, understøttelse i udviklingsværktøjer samt SOAP, protokolskift, SSL (secure socket layer) og secure tunnels. Leif konkluderede at det vigtigste er at lånercheck bliver lavet på én måde, og det skal være nemt at implementere. Der er tre leverandører der er villige til at inkludere det i deres udviklingsplan. Hvis de tre mener at noget skal justeres og kan blive enige om et kursskifte i forbindelse med kommunikationsforbindelse, kan det godt lade sig gøre.

 

 

ad 5. Implementeringsspørgsmål

På en forespørgsel om nogen henter flerbindsværker fra Z-punktet blev der svaret at Dantek gør som DBC har beskrevet.

 

 

ad 6. danZIG-profilen: justeringer af specifikationen

Gældende version downloades fra: http://www.bs.dk/Indeks_post.ihtml?id=2666

Bilag: udsendt på danZIG-listen 2. maj 2003

Oplæg om justeringer af danZIG-profilen (J.nr. 331-3)

 

Oversigt over ILL-transaktioner

Redaktionel ændring - opfølgning på tidligere tilføjelse.

Ingen kommentarer - vedtaget

 

Angivelse af strenge

Redaktionel ændring - præcisering.

Ingen kommentarer - vedtaget

 

Præcisering af DAN-1

Attribut-typer DAN-1 for andet end USE. Principiel teknisk afklaring: de 5 andre attributter knyttet til en DAN-1 USE-attribut er BIB1 attributter. Afsnit 5.1.10-14 fjernes - og derudover foretages de redaktionelle ændringer som er beskrevet i forslaget.

danMARC2 varianter / MARC OID

Redaktionel ændring - medtagelse af OID-numre og opdatering

Ingen kommentarer - vedtaget

 

Kvalificering af attributter

Forslag om tilføjelse af ny facilitet i profilen: anvendelsesmarkering. Leif foreslog at det blev tilføjet som et annex hvor brugen af attributterne registreres, således at profilen kan blive et praktisk arbejdsredskab. Leif bad de leverandører der anvender andet end BIB1 attributter om at angive det til ham inden 15. juni. Princippet blev godkendt og Leif udarbejder et forslag der er klar til næste møde.

 

Nyt annex

Redaktionel tilføjelse: mapninger mellem USE attributter og søgekoder

Godkendt. Flere gave udtryk for anerkendelse af Henriks indsats.

 

Andre justeringer drøftet på 38. møde

Leif orienterede om at Biblioteksstyrelsen var ved at overveje hvordan XML Schemaer skulle håndteres. Den tidligere annoncerede model med et repository for biblioteks XML Schemaer på www.bs.dk vil måske blive erstattet af en model, hvor sådanne Schemaer placeres som en del af Infostrukturdatabasen. Den annoncerede gennemgang af henvisninger til XML Schemaer i danZIG specifikationen vil ske efter at dette er afklaret. Om InfoStrukturBasen, se:

http://isb.oio.dk/info/about/dansk+intro/dansk_+intro.htm

 

 

ad 7. TEMA: Søgning på nettet: alternativer til Z39.50?

Der findes på Z39.50 Maintenance Agency's homepage en opsamling af initiativer kaldet for ZING,

se: http://www.loc.gov/z3950/agency/zing/zing-home.html

 

NISO's initiativ om meta-søgning.

http://www.niso.org/committees/MetaSearch-info.html

Sebastian har den 7. - 8. maj deltaget i NISO's workshop i Denver om Metasearch engines. Der var ca. 50 deltagere: bibliotekarer, firmaer der laver metasøgesystemer og som sælger denne type systemer samt repræsentanter for indholdsleverandører, fx Elsevier og Gale. Det var i øvrigt indholdsleverandørerne der prægede mødet mest. Biblioteksfolkene stillede i deres præsentationer nogle krav, men forholdt sig ellers meget stille.

Nogle af de vigtigste emner, der blev taget op, var 'rights management' og 'access control'. Desuden blev det diskuteret hvordan man statistisk opgør brugernes anvendelse af metasearch engines samt hvordan man standardiserer søgeprocessen. Alle var enige om at screen-scraping ikke er godt, og at Z39.50 ikke løser behovene - det skal være xml-baseret. Der var også ønske om en større respekt for leverandørernes egen branding af informationerne.

 

Gruppen for søgning og søgeresultater foreslog at en teknologisk anbefaling ledsages af et sæt 'etiske retningslinjer'. Den anbefalede tre prioriterede muligheder for system-til-system adgang: helst ser man en xml-protokol - gerne SRW. Alternativet er en veldefineret privat protokol.

Den næstbedste løsning er anvendelse af Z39.50 understøttet af bath-profilen Den tredje mulighed er en html grænseflade.

 

Producenterne af metasøgesystemer har erkendt at det er umuligt at få alle til at understøtte samme kommunikationsstandarder mellem systemer.

 

SRU/SRW - teknik og status

Adam Dickmeiss fra Index Data gav et overblik over teknikken i SRU/SRW (search retrieve url/search retrieve web) samt en status for initiativet Index Data's Public SRW Service,

se: ttp://indexdata.dk/srw/ Zing-paraply.

Specifikationerne vedlieholdes af Library of Congress. Version 1.0 er frigivet den 25. november 2002.

Samarbejdet på området har været i gang ca. halvandet år. Index Data har deltaget aktivt i knapt et år.

 

SRW egenskaber:

SRW er baseret på SOAP. Man definerer i SRW en profil for, hvordan en server 'snakker'. Det sker primært over HTTP POST. For SRU gælder at XML/indhold er identisk med SRW. SRU: HTTP GET. SRU er nemmere at implementere i fx browsere. Basisfunktionaliteten er den samme som i SRW. SRU er ikke så kraftfuld som SRW, da længden af en URL giver nogle begrænsninger.

 

SRW SR kendetegn:

Service Search/retrieve/sort kombineret. Søgesæt navngives af server. Der er ingen databaser, og forespørgsler sker i CQL (query sprog). Alt skal enkodes i XML - herunder poster. Adgangskontrol er ikke en del af SRW.

 

SRW søgesæt:

Søgesæt kan navngives af server hvis det er muligt. Server foreslår en levetid - time to live (TTL). Der er ingen garanti for opretholdelse af dette, så klienten skal være forberedt! Klient TTL i version 1.1.

 

Databaser:

Databaser er udeladt på grund af ønsket om en simpel protokol. URL sti kan anvendes som 'database', fx http://myhost/mydatabase.

 

CQL 1:

Common query language har strengnotation. Minder om CCL (lidt om SQL).

 

CQL 2:

Der er specialtegn for termer.

 

Post 'schema':

Schema beskrives ved URI (streng). I de fleste tilfælde svarer et schema til et bestemt XML schema, fx http://www.loc.gov/zing/srw/dcschema/1.0/ for Dublin Core poster.

 

Status for implementationer:

5 - 8 er udviklet. Omkring 15 organisationer har planer om udvikling (antal på LoC's site). Værktøjerne er udviklet i: Java, C, Python, C# under .Net, Perl.

 

Erfaringer 1:

To protokoller (SRW, SRU) er sværere at implementere end én. SRW/SRU kræver mere båndbredde og flere CPU ressourcer. SOAP værktøjer er nemme at bruge (til nemme opgaver). Parallel Remote Procedure Control er svær. SRW, SRU har ikke en mekanisme for styring af protokolversion.

 

Erfaringer 2:

CQL er nemmere at forstå end RPN - få kan dog skrive en parser til denne. CQL er mindre generel end RPN og sværere at udvide (i senere versioner). Nogle værktøjer har svært ved at håndtere indlejret XML (for poster).

 

SRW i Danmark?

Danmarc2 kunne evt. bruge samme struktur som MarcXML. CQL index set. Z39.50 gateways.

Leif vurderede SRW som interessant, men ikke mere end der skal være en business case for at tage det i anvendelse - og den skal være større end biblioteksverdenen. I øvrigt ser det ikke ud til at tiden er moden til at det kan være en erstatning for Z39.50, da SRW/SRU alene adresserer søgning. Vores anvendelse dækker også beholdning og bestilling. Det er et område som danZIG arbejdsgruppen skal holde øje med.

Se slides på: http://dickmeiss.net/files/danzig-srw.ppt

 

 

ad 8. TEMA: MARC-formater

danMARC2 eller MARC21?

Leif orienterede om et igangværende udredningsarbejde foranlediget af nogle større forskningsbiblioteker der ønsker at gå over til MARC21 fordi det ved import af udenlandske data vil være en fordel. Derudover er der ingen faglige problemer forbundet ved anvendelse af danMARC2, og et skift til MARC 21 vil give mange andre problemer. Det skal bemærkes at ikke alle biblioteker har samme behov, og en national løsning er ikke nødvendigvis optimal for alle biblioteker. Hvis der skal være et skift vil det blive til et internationalt baseret format der ikke er fordansket. Den aktuelle analyse skal dokumentere at der er en økonomisk gevinst ved et skift. De nuværende katalogiseringsregler kan kun bruges med MARC2. Et skift vil derfor indebære at de amerikanske regler skal anvendes, og DK5 skal i givet fald også rettes til. MARC21 er mindre specifik end danMARC2. MARC21 er mere kompleks med hensyn til systembehandling. Endelig vil emnerepræsentationen i DBC's emneord, og den struktur den repræsenteres i til danMARC2 ikke uden videre kunne finde en plads i det ene felt der er til rådighed i MARC21. Biblioteksstyrelsen har endnu ikke planlagt forløbet efter afslutningen på det faglige udredningsarbejde, men man kan tænke sig en høring af interessenter.

Spørgsmålet er imidlertid om tiden måske er løbet fra MARC-formatet der grundlæggende er lavet til at udveksle bibliografiske registreringer via magnetbånd. Ulempen er at MARC er biblioteksspecifik og kun kan bruges til bibliografiske oplysninger. Det betyder at de mange ekstra oplysninger som nu og i fremtiden vil blive brugt til at berige registreringerne i bibliotekernes katalog og i fælleskatalogen ikke kan udveksles på en standardiseret måde. Der er behov for at finde frem til et helt andet koncept - men om det tager et eller fem år er ikke til at forudsige. Der tegner sig nogle tendenser omkring anvendelselsen af XML og mulighederne for at implementere og anvende Functional Requirements for Bibliographical Records.

 

 

MARC og XML

Der blev på mødet henvist til det problem at danMARC2 specificerer anvendelse af delfelter i felt 001-009, mens dette ikke tillades af det foreviste simple XML Schema for MARC21, som i øvrigt ikke bærer MARC21 som sådan, men alene kan bære en MARC-post, som opfylder visse specifikationer (men altså incl. krav om faste felter for 001-009). Det blev endvidere nævnt at dette faktisk ikke er noget nyt, men også er et problem i relation til håndtering af danMARC2 poster under transport med ISO2709, da denne standard har samme type begrænsning.

Leif orienterede om at Dansk Standard S24 havde foreslået et "item for discussion" på TC46/SC4 møde i Rom i den efterfølgende uge om netop MARC-poster båret med XML som muligt supplement til ISO2709. Spørgsmålet drøftes nærmere på næste danZIG-møde på grundlag af referat af behandlingen på TC46/SC4-mødet.

 

ad 9. Mødeplan

40. møde: 15. september - 9.30 - 15.00

41. møde: 1. december - 9.30 - 15.00

 

ad 10. Evt.

Intet