--- trunk/conf/normalize/ff-libri.pl 2007/11/02 13:00:55 964 +++ trunk/conf/normalize/ff-libri.pl 2007/11/27 21:02:15 1064 @@ -1,30 +1,39 @@ -######################################################################### +########################################################################## ## ## ## Ova datoteka sadrži pravila za generiranje MARC21 ISO 2709 izlazne ## -## datoteke. Ulazni format je CDS/ISIS sa zapisima u UNIMARC-u. ## +## datoteke. Ulazni format je CDS/ISIS izvorni format, sa zapisima u ## +## UNIMARC formatu, sa višestrukim odstupanjima od standarda. ## ## ## ########################################################################## -# konvertira se ako postoji polje 200^a +## konvertira se ako postoji polje 200^a if ( rec('200','a') ) { ### LEADER -# raspraviti 17,18 -# u nekim knjižnicama koristi se 999a i 999b, a u nekima samo 999 +## raspraviti 17,18 + +## LDR 05 - c ili d - iz 999a ili 999b ili 999 - provjeriti za svaku knjiznicu -if ( rec('999') && first(rec('999')) =~ m/(pregledan|P)/i) { +if ( rec('999') && rec('999','a') =~ m/(pregledan|P)/i) { marc_leader('05','c'); } else { marc_leader('05','n'); } -# moguća je i oznaka "m" u 06 - odrediti kriterije +## LDR 06 - a ili m - odrediti kriterije + marc_leader('06','a'); + +## LDR 07 - m + marc_leader('07','m'); + +## LDR 17 i 18 - razjasniti + marc_leader('18','i'); -# pojasniti upotrebu 19 lidera! +## LDR 19 - razjasniti if ( rec('230') ) { marc_leader('19','r'); @@ -32,17 +41,14 @@ ### 001 - Voyager -### 003 -# Pojasniti upotrebu polja +### 003 - razjasniti -### 007 -# pojasniti upotrebu polja +### 007 - razjasniti marc_fixed('007',00,'ta'); ### 008 - All materials - -# što zapisati u polje kad datum nije poznat? +## 008 00 - datum - što kad datum nije poznat? if ( rec('994','c') ) { marc_fixed('008','00', @@ -63,50 +69,71 @@ #) #); -marc_fixed('008','06', 't'); # 06 - Type of date/Publication status +## 008 06 - Type of date/Publication status - t - raspraviti + +marc_fixed('008','06', 't'); + +## 008 07-10 - Date 1 - iz 210d koji kroz modify postaje 210c + marc_fixed('008','07', - rec('210','d') -); # 07-10 - Date 1 -# marc_fixed('008','11', ' '); # 11-14 - Date 2 + rec('210','c') +); + +## 008 11-14 - Date 2 + +## 008 15-17 - Place of publication, production, or execution - što ako nema 102? + marc_fixed('008','15', lc ( rec('102') ) -); # 15-17 - Place of publication, production, or execution +); + +## 008 35-37 - Language - što ako nema 101? + marc_fixed('008','35', - first( lc(rec('101')) ) # 35-37 - Language + first( lc(rec('101')) ) ); -marc_fixed('008','38', '|'); # 38 - Modified record -marc_fixed('008','39','d'); # 39 - Cataloging source + +## 008 38 - Modified record - razjasniti +## 008 39 - Cataloging source - d -### 008 - Books - - # 18-21 - Illustrations - # 22 - Target audience - # 23 - Form of item - # 24-27 - Nature of contents - # 28 - Government publication - # 29 - Conference publication - # 30 - Festschrift - # 31 - Index - # 32 - Undefined - # 33 - Literary form - # 34 - Biography +marc_fixed('008','39','d'); +### 008 - Books - raspraviti upotrebu ovih polja +## 008 18-21 - Illustrations +## 008 22 - Target audience +## 008 23 - Form of item +## 008 24-27 - Nature of contents +## 008 28 - Government publication +## 008 29 - Conference publication +## 008 30 - Festschrift +## 008 31 - Index +## 008 32 - Undefined +## 008 33 - Literary form +## 008 34 - Biography ### 020 -# postoji modify -> drugi ISBN počinje prefixom "ISBN" koji se miče (sfb) +## modify -> drugi ISBN počinje prefixom "ISBN" koji se miče (sfb) -marc('020','a', - regex('s/\s*[\\r\\n]+\s*\**\s*/ ; /g', - rec('10') - ) -); +if ( frec('10') ne ( frec('290') ) ) { + marc('020','a', + regex('s/-//g', +# regex('s/\(\d\)\(/$1 \(//g', + rec('10') + ) + ); +} +#warn( +# dump( +# frec('10') +# ), +#); ### 035$6 -# Privemeno koristimo 035$6 umjesto 035$9, zato što marclint prijavljuje 9 kao grešku. -# marc 035a - System Number - Voyagerov ID (001) -# polje 035$9 može sadržavati slova i razmake +## Privemeno koristimo 035$6 umjesto 035$9, zato što marclint prijavljuje 9 kao grešku. +## marc 035a - System Number - Voyagerov ID (001) +## polje 035$9 može sadržavati slova i razmake marc('035','6', join_with('', @@ -122,8 +149,8 @@ ); ### 040 -# za sve je isti -# treba utvrditi točnu oznaku za ustanovu +## za sve je isti +## treba utvrditi točnu oznaku za ustanovu marc('040','a', 'HR FFZG' @@ -139,36 +166,35 @@ ### 041 - indikatori -# -# pretpostavke o indikatorima: -# -# 1. Ako postoji polje 300 i ono sadrži /Prijevod/ ili /Izv. stv. nasl./, i1 = 1 -# (Da li je napomena uvijek pisana?) -# -# 2. Podatak o prevodiocu u 200g. Problem: različiti oblici riječi, različiti jezici. -# -# 3. Ako u UDK oznaci postoji "=", bez zagrada, onda je to prijevod -# (ako postoje zagrade pr. 94(=411.16) onda su to pomoćne oznake) -# pr. 821.111-2=163.42 je prijevod engleske drame na HR. -# to ima samo za književna djela, eseje.... -# ???? - - -#if ( rec('675') =~ m/\d=\d/ ) { -if ( grep( m/prijevod/i, rec('300')) || grep( m/prevedeno/i, rec('300')) || grep( m/izv.*stv.*nasl/i, rec('300')) || grep( m/izvornik/i, rec('300')) || grep( m/preve/i, rec('200','f')) || grep( m/preve/i, rec('200','g')) || grep( m/prijevod/i, rec('200','f')) || grep( m/prijevod/i, rec('200','g')) ) { +## pretpostavke o indikatorima +## 1. Ako postoji polje 300 i ono sadrži /Prijevod/ ili /Izv. stv. nasl./, i1 = 1 +## (Da li je napomena uvijek pisana?) +## 2. Podatak o prevodiocu u 200g. Problem: različiti oblici riječi, različiti jezici. +## 3. Ako u UDK oznaci postoji "=", bez zagrada, onda je to prijevod +## (ako postoje zagrade pr. 94(=411.16) onda su to pomoćne oznake) +## pr. 821.111-2=163.42 je prijevod engleske drame na HR. +## to ima samo za književna djela, eseje.... +## ???? + +#if ( rec('675') =~ m/\d=\d/ ) ?? + +if ( + grep( m/[prijevod|prevedeno|izv.*stv.*nasl|izvornik]/i, rec('300') ) || + grep( m/[preve|prijevod]/i, rec('200','f')) || + grep( m/[preve|prijevod]/i, rec('200','g')) +) { marc_indicators('041', 1, ' '); } else { marc_indicators('041', 0, ' '); } - ### 041 -# ponovljivo polje konvertira se u ponovljivo potpolje +## ponovljivo polje (101) konvertira se u ponovljivo potpolje (041a) #_debug(2); marc_repeatable_subfield('041','a', - lc( rec('101') ) + map { lc($_) } rec('101') ); #_debug(0); @@ -177,7 +203,7 @@ ## kako dobiti zemlju izdavanja? ### 080 -# 675 podpolja b, c, d ... - što s njima ??? +## 675 podpolja b, c, d ... - što s njima? - provjeriti za svaku bazu marc('080','a', rec('675','a') @@ -197,17 +223,16 @@ ### 084 - other classification (R) -# NSK ga koristi za stručnu oznaku NSK iz polja 681 -# NSK konvertira polje 686 u 084, u skladu s LOC konv. tablicom -# polje 686 koristi FFPS. još netko? +## NSK ga koristi za stručnu oznaku NSK iz polja 681 +## NSK konvertira polje 686 u 084, u skladu s LOC konv. tablicom +## polje 686 koristi FFPS. još netko? marc('084','a', rec('686') ); -### 100 indikatori - -# I1 = 0 ako je pseudonim (ima 700a, nema 700b) +### 100 +## I1 = 0 ako je pseudonim (ima 700a, nema 700b) if ( rec('700','a') && ! rec('700','b') ) { marc_indicators('100', 0, ' '); @@ -215,8 +240,6 @@ marc_indicators('100', 1, ' '); } -### 100 - marc('100','a', join_with(', ', rec('700', 'a'), @@ -226,7 +249,7 @@ ### 111 i 110 -# provjeriti ispise naslova iz svake baze - moguće su greške. +## konverzija u 110 ili 111 ovisno o postojanju/nepostojanju nekih polja - provjeriti ispise naslova iz svake baze - moguće su greške. # ovo vrijedi za FFSFB if ( rec('710','d') || rec('710','e') || rec('710','f') ) { @@ -283,10 +306,9 @@ ### 245 indikatori -# treba nadopuniti i dati podatke na verifikaciju knjižničarima - -# i1 = 0 za anonimne publikacije, i1 = 1 ako postoji 700 ili 710 -# i2 = pretpostavlja se na temelju člana na početku naslova i jezika +## i1 = 0 za anonimne publikacije, i1 = 1 ako postoji 700 ili 710 +## i2 = pretpostavlja se na temelju člana na početku naslova i jezika +## treba provjeriti my $i1; @@ -299,23 +321,29 @@ marc_indicators('245', $i1, 0); -if ( ( rec('200','a') =~ m/^Die /) || - ( rec('200','a') =~ m/^Das /) || - ( rec('200','a') =~ m/^Der /) || - ( rec('200','a') =~ m/^The /) ) { +if ( rec('200','a') =~ m/^Einen / ) { + marc_indicators('245', $i1, 6); +} + +if ( rec('200','a') =~ m/^Eine / ) { + marc_indicators('245', $i1, 5); +} + +if ( rec('200','a') =~ m/^(Die|Das|Der|Ein|Les|The) / ) { marc_indicators('245', $i1, 4); } -if ( ( rec('200','a') =~ m/^A /) && ( rec(101) =~ m/ENG/ ) ) { - marc_indicators('245', $i1, 2); +if ( rec('200','a') =~ m/^(Um|Un|An|La|Le|Il) / ) { + marc_indicators('245', $i1, 3); } -if ( ( rec('200','a') =~ m/^An /) && ( rec(101) =~ m/ENG/ ) ) { +if ( rec('200','a') =~ m/^(A|L') / ) { marc_indicators('245', $i1, 2); } + ### 245 -# podpolja i interpunkcije pripremljeni u modify +## potpolja i interpunkcije pripremljeni u modify #_debug(3); @@ -325,7 +353,7 @@ ( rec('200','d') ) ? ' =' : ( rec('200','e') ) ? ' :' : ( rec('200','k') ) ? ' ;' : - '', + '.', rec('200','a'), ), 'b', suffix( @@ -349,76 +377,28 @@ 'c', suffix( ( rec('200','f') && rec('200','c') ) ? '.' : '', - rec('200','f'), + join_with(' ; ', + rec('200','f'), + rec('200','g') + ) ), + ## append to last subfield '+', suffix('.', rec('200','c'), ), ); -#marc_compose('245', -# 'a', suffix( -# ( ! rec('200','p') && ( rec('200','f') || rec('200','c') ) ) ? ' / ' : -# ( ! rec('200','p') && rec('200','c') ) ? ' : ' : -# '', -# rec('200','a'), -# ), -# 'b', suffix( -# ( rec('200','p') && rec('200','f') ) ? ' / ' : -# ( rec('200','p') && rec('200','c') ) ? '. ' : -# '', -# rec('200','p'), -# ), -# 'c', suffix( -# ( rec('200','f') && rec('200','c') ) ? '. ' : -# '', -# rec('200','f'), -# ), -# '+', rec('200','c'), -#); - #_debug(0); -#marc_compose('245', -# 'a', suffix( -# rec('200','b') ? '. ' : -# rec('200','k') ? ' ; ' : -# rec('200','d') ? ' = ' : -# rec('200','e') ? ' : ' : -# rec('200','f') ? ' / ' : -# '.', -# rec('200','a') -# ), -## 'h', rec('200','b'), -# 'b', suffix( -# ( rec('200','k') && rec('200','f') ) ? ' / ' : -# ' ', -# join_with(' ; ', -# rec('200','k'), -# ), -# ), -# 'b', suffix( -# ( rec('200','d') && rec('200','f') ) ? ' / ' : -# ' ', -# rec('200','d'), -# ), -# 'b', suffix( -# ( rec('200','e') && rec('200','f') ) ? ' / ' : -# ' ', -# join_with(' : ', -# rec('200','e'), -# ), -# ), -# 'c', rec('200','f'), -## append to last subfield -# '+', prefix('. ', -# rec('200','c') -# ), -#); +### 246 +marc_indicators('246', 1, 3); +marc('246','a', + rec('532') +); ### 250 -# zapisima koji nemaju potpolje, dodaje se ^a u modify - provjeriti +## zapisima koji nemaju potpolje, dodaje se ^a u modify - provjeriti marc_compose('250', 'a',suffix( @@ -430,20 +410,20 @@ ); ### 260 -# ponovljiva potpolja u originalnom redosljedu +## ponovljiva potpolja u originalnom redosljedu - priprema u modify marc_original_order('260', '210'); ### 300 -# urediti interpunkcije za sve kombinacije +## urediti interpunkcije za sve kombinacije marc('300','a', suffix( rec('215','c') ? ' : ' : rec('215','d') ? ' ; ' : rec('215','e') ? ' + ' : - ' ', + '', rec('215','a') ) ); @@ -452,7 +432,7 @@ suffix( ( rec('215','c') && rec('215','d') ) ? ' ; ' : ( rec('215','c') && rec('215','e') ) ? ' + ' : - ' ', + '', rec('215','c') ) ); @@ -460,7 +440,7 @@ marc('300','c', suffix( rec('215','e') ? ' + ' : - ' ', + '', rec('215','d') ) ); @@ -469,12 +449,10 @@ rec('215','e') ); -### 362 -# brojčani podaci za nakladničku cjelinu -# ??? +### 362 - brojčani podaci za nakladničku cjelinu - razjasniti upotrebu ### 440 - indikatori -# 2.ind. prema jeziku i članu, provjeriri +## 2.ind. prema jeziku i članu, provjeriti marc_indicators('440', ' ', '0'); @@ -489,36 +467,94 @@ } if ( ( rec('225','a') =~ m/^An /) && ( rec(101) =~ m/ENG/ ) ) { - marc_indicators('440', ' ', 2); + marc_indicators('440', ' ', 3); } #_debug(3); ### 440 -marc_original_order('440','225'); +marc_template( + from => 225, to => 440, + subfields_rename => [ + 'a' => 'a', + 'x' => 'x', + 'v' => 'v', + 'h' => 'n', + 'i' => 'p', + 'w' => 'v', + ], + isis_template => [ + 'a.|h,|i ;|w', + 'a.|h.|w', + 'a.|i ;|w', + 'a ;|v.|i', + 'a ;|v.|i ;|w', + 'a ;|v.|h,|i ;|w', + 'a ;|v.|h ;|w', + 'a ;|v ;|w', + #mozda greska: + 'a ;|v,|x ;|w', + 'a,|x ;|v', + 'a,|x.|p ;|w', + ], + marc_template => [ + 'a', + 'a ;|v', + 'a,|x', + 'a.|n', # mozda greska + 'a.|n,|p', + 'a.|p', + 'a ;|v.|n', + 'a ;|v.|n,|p', # mozda greska + 'v', + 'x', + ], +); + + +## marc_compose za 440 radi samo kad polje ni potpolja nisu ponovljiva. ne zapisuje dobro drugo pojavljivanje ^v, tj. ^v iza ^p (iz 225^w) #marc_compose('440', # 'a', suffix( -# rec('225','i') ? '. ' : +# ( rec('225','v') ) ? ' ;' : +# ( rec('225','w') ) ? ' ; ' : +# ( rec('225','x') ) ? ',' : +# ( rec('225','h') || rec('225','i') ) ? '.' : +# '.', +# frec('225','a') +# ), +# 'x',suffix( +# ( rec('225','x') && ( rec('225','h') || rec('225','i') ) ) ? '.' : # '', -# rec('225','a'), +# frec('225','x') # ), -# 'p', suffix( -# ( ! rec('225','x') && rec('225','i') && rec('225','v') ) ? ' ; ' : -# ( rec('225','i') && rec('225','x') ) ? ', ' : +# 'v',suffix( +# ( rec('225','v') && ( rec('225','h') || rec('225','i') ) ) ? '.' : +# ( rec('225','v') && rec('225','w') ) ? ' ; ' : # '', -# rec('225','i'), +# frec('225','v') # ), -# 'x', suffix( -# ( rec('225','x') && rec('225','v') ) ? ' ; ' : +# 'n',suffix( +# ( rec('225','h') && rec('225','i') ) ? ',' : +# ( rec('225','h') && rec('225','w') ) ? ' ; ' : # '', -# rec('225','x'), +# frec('225','h') # ), -# 'v', rec('225','v'), +# 'p',suffix( +# ( rec('225','i') && rec('225','w') ) ? ' ; ' : +# ( rec('225','i') && rec('225','x') ) ? ',' : +# '', +# frec('225','i') +# ), +## 225w treba ici u 440v, na kraj +# '+', join_with(' ; ', +# rec('225','w'), +# ) #); -## ovo radi samo kad 225 nije ponovljivo +#marc_original_order('440','225'); + #if ( # count( lookup( @@ -528,104 +564,11 @@ # ) ) > 1 #) { -#marc_compose('440', -# 'a', suffix( -# ( rec('225','x') ) ? ', ' : -# ( rec('225','v') || rec('225','w') ) ? ' ; ' : -# ( rec('225','h') || rec('225','i') ) ? '. ' : -# '', -# join_with(' / ', -# join_with(' : ', -# join_with(' = ', -# rec('225','a'), -# rec('225','d'), -# ), -# rec('225','e'), -# ), -# rec('225','f'), -# ), -# ), -# 'x', suffix( -# ( rec('225','x') && rec('225','v') ) ? ' ; ' : -# ( rec('225','x') && ( rec('225','h') || rec('225','i') ) ) ? '. ' : -# '', -# rec('225','x'), -# ), -# 'v', suffix( -# ( rec('225','v') && rec('225','h') || rec('225','i') ) ? '. ' : -# '', -# join_with('; ', -# rec('225','v'), -# ) -# ), -# 'n', suffix( -# ( rec('225','h') && rec('225','p') || rec('225','y') ) ? ', ' : -# '', -# rec('225','h'), -# ), -# 'p', suffix( -# ( rec('225','i') && rec('225','x') ) ? ', ' : -# ( rec('225','i') && rec('225','v') ) ? ' ; ' : -# '', -# rec('225','i'), -# ), -# 'x', suffix( -# ( rec('225','y') && rec('225','v') ) ? ' ; ' : -# '', -# rec('225','y'), -# ), -# 'v', rec('225','w'), -# ); -# -# marc_compose('440', -# 'a', suffix( -# rec('225','k') ? ' ; ' : -# '', -# join_with(' / ', -# rec('225','b'), -# rec('225','j') -# ), -# ), -# 'v', -# rec('225','k'), -# ); -# -# -# marc_compose('440', -# 'a', suffix( -# rec('225','s') ? ' ; ' : -# '', -# join_with(' / ', -# rec('225','c'), -# rec('225','r') -# ), -# ), -# 'v', -# rec('225','s'), -# ); - -#} - -#if ( rec('225','i') ) { -# marc('440','p', -# prefix('. ', -# rec('225','i') -# ), -# ); -#} -# -#if ( rec('225','v') ) { -# marc('440','v', -# prefix(' ; ', -# rec('225','v'), -# ), -# ); -#} #_debug(0); -### 50x +### 500 marc('500','a', rec('300') @@ -644,7 +587,7 @@ ); ### 502 - bilješka o disertacijama -# odgovarajućeg polja nema u originalnim podacima. možda se može pretpostaviti? +## odgovarajućeg polja nema u originalnim podacima. možda se može pretpostaviti? ### 504 @@ -652,13 +595,11 @@ rec('320') ); -## napomene uz konverziju polja 327 (sadrzaj): -# NSK konvertira 327 (NP) u 501 (R) -# u LOC konv. tablici stoji 327 (NP) u 505 (NR) -# standard i validacije dopuštaju 501 (R) i 505 (R) - -## 505 -# FFPS 327 - sadrzaj +### 505 +## FFPS 327 - sadrzaj +## NSK konvertira 327 (NP) u 501 (R) +## u LOC konv. tablici stoji 327 (NP) u 505 (NR) +## standard i validacije dopuštaju 501 (R) i 505 (R) if ( config() =~ m/ffps/ || config() =~ m/fftu/ ) { marc_indicators('505', '0', ' '); @@ -679,13 +620,12 @@ } -# NSK konvertira 330 (P) u 520 (P) = LOC konv. tablica ### 520 -# možda i polje 520y - jezik napomene ako je uvijek isti jezik? +## NSK konvertira 330 (P) u 520 (P) = LOC konv. tablica +## FFPS 330 (NP) - sažetak -# FFPS 330 (NP) - sažetak if ( config() =~ m/ffps/ ) { marc('520','a', regex('s/[\\r\\n]+/. /g', @@ -695,7 +635,7 @@ } ### 526 - STUDY PROGRAM INFORMATION NOTE -# provjeriti za svaku bazu sta je tocno u 996? +## provjeriti za svaku bazu sta je u 996? marc_indicators('526', 8, ' '); @@ -709,14 +649,6 @@ rec('337','a') ); - -### 246 - -marc_indicators('246', 1, 3); -marc('246','a', - rec('532') -); - ### 655 marc_indicators('655', ' ', 4); @@ -735,6 +667,7 @@ ### 700 +## ako je u originalu ponovljivo polje treba biti i konvertirano u ponovljivo !! marc_indicators('700', 1, ' '); @@ -780,10 +713,6 @@ ) ); - -# ako je u originalu ponovljivo polje treba biti i konvertirano u ponovljivo !! - - marc('700','a', join_with(', ', rec('702','c'), @@ -808,7 +737,7 @@ #_debug(0); -### 740 +### 740 - nadopuniti marc_indicators('740', 0, ' '); @@ -829,51 +758,54 @@ # }; -# generiranje zapisa o nakladničkoj cjelini i povezivanje podređenog zapisa s nadređenim -if ( - rec('225','a') # da li je nakladnička cjelina? -) { - -my $series_key = -join_with('', - rec('225','a'), - rec('210','a'), - rec('210','b'), -); - -my $series = get( $series_key ); - -if ($series) { - warn "nije novi"; -} else { - -$series = join_with('', - uc( config() ), - ' LS', - rec('000') -); - -set( $series_key => $series ); - -} # $series -} # nakladnička cjelina - -my $series_key = join_with('', - rec('225','a'), - rec('210','a'), - rec('210','b'), -); +### 760 w +## generiranje zapisa o nakladničkoj cjelini i povezivanje podređenog zapisa s nadređenim -if ($series_key) { +#if ( +# rec('225','a') # da li je nakladnička cjelina? +#) { +# +#my $series_key = +#join_with('', +# rec('225','a'), +# rec('210','a'), +# rec('210','b'), +#); +# +#my $series = get( $series_key ); +# +#if ($series) { +# warn "nije novi"; +#} else { +# +#$series = join_with('', +# uc( config() ), +# ' LS', +# rec('000') +#); +# +#set( $series_key => $series ); +# +#} # $series +#} # nakladnička cjelina +# +#my $series_key = join_with('', +# rec('225','a'), +# rec('210','a'), +# rec('210','b'), +#); +# +#if ($series_key) { +# +# marc_indicators('760', 0, ' '); +# +# marc('760','w', +# get( $series_key ) +# ); +#} - marc_indicators('760', 0, ' '); - - marc('760','w', - get( $series_key ) - ); -} -### testing +# ## testing # # my $dup_key = join_with('', # rec('200','a'), @@ -894,7 +826,7 @@ # -### 852 - lokacija +### 852 - signatura marc_indicators('852', 4, ' ');