--- trunk/conf/normalize/ff-libri.pl 2007/05/18 20:27:21 824 +++ trunk/conf/normalize/ff-libri.pl 2007/11/27 21:02:15 1064 @@ -1,39 +1,54 @@ -######################################################################### +########################################################################## ## ## ## Ova datoteka sadrži pravila za generiranje MARC21 ISO 2709 izlazne ## -## datoteke. Ulazni format je CDS/ISIS sa zapisima u UNIMARC-u. ## +## datoteke. Ulazni format je CDS/ISIS izvorni format, sa zapisima u ## +## UNIMARC formatu, sa višestrukim odstupanjima od standarda. ## ## ## ########################################################################## -# konvertira se ako postoji polje 200^a +## konvertira se ako postoji polje 200^a if ( rec('200','a') ) { ### LEADER -# raspraviti 17,18 -# u nekim knjižnicama koristi se 999a i 999b, a u nekima samo 999 +## raspraviti 17,18 + +## LDR 05 - c ili d - iz 999a ili 999b ili 999 - provjeriti za svaku knjiznicu -if ( rec('999') && first(rec('999')) =~ m/(pregledan|P)/i) { +if ( rec('999') && rec('999','a') =~ m/(pregledan|P)/i) { marc_leader('05','c'); } else { marc_leader('05','n'); } +## LDR 06 - a ili m - odrediti kriterije + marc_leader('06','a'); + +## LDR 07 - m + marc_leader('07','m'); + +## LDR 17 i 18 - razjasniti + marc_leader('18','i'); +## LDR 19 - razjasniti + if ( rec('230') ) { marc_leader('19','r'); } ### 001 - Voyager -### 007 +### 003 - razjasniti + +### 007 - razjasniti marc_fixed('007',00,'ta'); -### 008 +### 008 - All materials +## 008 00 - datum - što kad datum nije poznat? if ( rec('994','c') ) { marc_fixed('008','00', @@ -54,26 +69,78 @@ #) #); -## FIXME treba velika slova pretvoriti u mala +## 008 06 - Type of date/Publication status - t - raspraviti + +marc_fixed('008','06', 't'); + +## 008 07-10 - Date 1 - iz 210d koji kroz modify postaje 210c + +marc_fixed('008','07', + rec('210','c') +); + +## 008 11-14 - Date 2 + +## 008 15-17 - Place of publication, production, or execution - što ako nema 102? + +marc_fixed('008','15', + lc ( rec('102') ) +); + +## 008 35-37 - Language - što ako nema 101? marc_fixed('008','35', - first( lc(rec('101')) ) + first( lc(rec('101')) ) ); + +## 008 38 - Modified record - razjasniti +## 008 39 - Cataloging source - d +marc_fixed('008','39','d'); -### 035$6 -# Privemeno koristimo 035$6 umjesto 035$9, zato što marclint prijavljuje 9 kao grešku. -# marc 035a - System Number - NSK zapisuje Voyagerov ID (001) - kako? -# kako mora izgledati polje 035$9? može li sadržavati slova i razmake? +### 008 - Books - raspraviti upotrebu ovih polja +## 008 18-21 - Illustrations +## 008 22 - Target audience +## 008 23 - Form of item +## 008 24-27 - Nature of contents +## 008 28 - Government publication +## 008 29 - Conference publication +## 008 30 - Festschrift +## 008 31 - Index +## 008 32 - Undefined +## 008 33 - Literary form +## 008 34 - Biography + +### 020 +## modify -> drugi ISBN počinje prefixom "ISBN" koji se miče (sfb) + +if ( frec('10') ne ( frec('290') ) ) { + marc('020','a', + regex('s/-//g', +# regex('s/\(\d\)\(/$1 \(//g', + rec('10') + ) + ); +} + +#warn( +# dump( +# frec('10') +# ), +#); +### 035$6 +## Privemeno koristimo 035$6 umjesto 035$9, zato što marclint prijavljuje 9 kao grešku. +## marc 035a - System Number - Voyagerov ID (001) +## polje 035$9 može sadržavati slova i razmake marc('035','6', join_with('', # config('input normalize path'), # config('name'), config(), - 'L', + ' L', # config('input name'), # id(), # rec('994','a'), @@ -81,19 +148,9 @@ ) ); - -### 020 -# postoji modify -> drugi ISBN počinje prefixom "ISBN" koji se miče (sfb) - -marc('020','a', - regex('s/ ISBN //g', - rec('10') - ) -); - - ### 040 -# za sve je isti +## za sve je isti +## treba utvrditi točnu oznaku za ustanovu marc('040','a', 'HR FFZG' @@ -108,59 +165,74 @@ ); -### 041 indikatori -# pretpostavke o indikatorima: -# -# 1. Ako postoji polje 300 i ono sadrži /Prijevod/ ili /Izv. stv. nasl./, i1 = 1 -# (Da li je napomena uvijek pisana?) -# -# 2. Podatak o prevodiocu u 200g. Problem: različiti oblici riječi, različiti jezici. -# -# 3. Ako u UDK oznaci postoji "=", bez zagrada, onda je to prijevod -# (ako postoje zagrade pr. 94(=411.16) onda su to pomoćne oznake) -# pr. 821.111-2=163.42 je prijevod engleske drame na HR. -# to ima samo za književna djela, eseje.... -# ???? - - -#if ( rec('675') =~ m/\d=\d/ ) { -if ( grep( m/Prijevod/, rec('300')) || grep( m/Izv. stv. nasl./, rec('300') ) ) { +### 041 - indikatori +## pretpostavke o indikatorima +## 1. Ako postoji polje 300 i ono sadrži /Prijevod/ ili /Izv. stv. nasl./, i1 = 1 +## (Da li je napomena uvijek pisana?) +## 2. Podatak o prevodiocu u 200g. Problem: različiti oblici riječi, različiti jezici. +## 3. Ako u UDK oznaci postoji "=", bez zagrada, onda je to prijevod +## (ako postoje zagrade pr. 94(=411.16) onda su to pomoćne oznake) +## pr. 821.111-2=163.42 je prijevod engleske drame na HR. +## to ima samo za književna djela, eseje.... +## ???? + +#if ( rec('675') =~ m/\d=\d/ ) ?? + +if ( + grep( m/[prijevod|prevedeno|izv.*stv.*nasl|izvornik]/i, rec('300') ) || + grep( m/[preve|prijevod]/i, rec('200','f')) || + grep( m/[preve|prijevod]/i, rec('200','g')) +) { marc_indicators('041', 1, ' '); } else { marc_indicators('041', 0, ' '); } - ### 041 -# ponovljivo polje konvertira se u ponovljivo potpolje +## ponovljivo polje (101) konvertira se u ponovljivo potpolje (041a) #_debug(2); + marc_repeatable_subfield('041','a', - rec('101') + map { lc($_) } rec('101') ); + #_debug(0); +### 044 +## kako dobiti zemlju izdavanja? ### 080 -# 675 podpolja b, c, d ... - što s njima ??? +## 675 podpolja b, c, d ... - što s njima? - provjeriti za svaku bazu marc('080','a', rec('675','a') ); +marc('080','a', + rec('675','b') +); + +marc('080','a', + rec('675','c') +); + +marc('080','a', + rec('675','d') +); -### 084 - other classification (R) -# NSK ga koristi za stručnu oznaku NSK iz polja 681 -# NSK definira i prelazak polja 686 u 084, u skladu s LOC konv. tablicom -# polje 686 koristi FFPS +### 084 - other classification (R) +## NSK ga koristi za stručnu oznaku NSK iz polja 681 +## NSK konvertira polje 686 u 084, u skladu s LOC konv. tablicom +## polje 686 koristi FFPS. još netko? marc('084','a', rec('686') ); -### 100 -# I1 = 0 ako je pseudonim (ima 700a, nema 700b) +### 100 +## I1 = 0 ako je pseudonim (ima 700a, nema 700b) if ( rec('700','a') && ! rec('700','b') ) { marc_indicators('100', 0, ' '); @@ -177,40 +249,66 @@ ### 111 i 110 -# provjeriti ispise naslova iz svake baze - moguće su greške. -# ovo vrijedi za FFSFB +## konverzija u 110 ili 111 ovisno o postojanju/nepostojanju nekih polja - provjeriti ispise naslova iz svake baze - moguće su greške. -if ( rec('710','f') ) { +# ovo vrijedi za FFSFB +if ( rec('710','d') || rec('710','e') || rec('710','f') ) { marc_indicators('111', 2, ' '); marc_compose('111', - 'a', rec('710','a'), + 'a', suffix( + rec('710','b') ? '.' : + '', + rec('710','a'), + ), 'e', rec('710','b'), - 'n', rec('710','d'), - 'd', rec('710','f'), - 'c', rec('710','e'), + 'n', prefix( + rec('710','d') ? '(' : + '', + rec('710','d') + ), + 'd', prefix( + ( ! rec('710','d') ) ? '(' : + ( ! rec('710','e') ) ? '(' : + '; ', + rec('710','f'), + ), + 'c', prefix( + ( rec('710','e') && ( rec('710','d') || rec('710','f') ) ) ? '; ' : + ( ! rec('710','d') && ! rec('710','f') ) ? '(' : + '', + rec('710','e'), + ), + '+',')', ); } else { marc_indicators('110', 2, ' '); + marc('110','a', rec('710','a') ); -marc('110','c', - rec('710','c') +marc('110','b', + rec('710','b') ); + if ( rec('710','c') ) { + marc('110','c', + surround('(', ')', rec('710','c')) + ); + } + } ### 245 indikatori -# i1 = 0 za anonimne publikacije, i1 = 1 ako postoji 700 ili 710 -# i2 = pretpostavlja se na temelju člana na početku naslova i jezika -# treba nadopuniti i dati podatke na verifikaciju knjižničarima +## i1 = 0 za anonimne publikacije, i1 = 1 ako postoji 700 ili 710 +## i2 = pretpostavlja se na temelju člana na početku naslova i jezika +## treba provjeriti my $i1; @@ -223,92 +321,84 @@ marc_indicators('245', $i1, 0); -if ( ( rec('200','a') =~ m/^Die /) || - ( rec('200','a') =~ m/^Das /) || - ( rec('200','a') =~ m/^Der /) || - ( rec('200','a') =~ m/^The /) ) { +if ( rec('200','a') =~ m/^Einen / ) { + marc_indicators('245', $i1, 6); +} + +if ( rec('200','a') =~ m/^Eine / ) { + marc_indicators('245', $i1, 5); +} + +if ( rec('200','a') =~ m/^(Die|Das|Der|Ein|Les|The) / ) { marc_indicators('245', $i1, 4); } -if ( ( rec('200','a') =~ m/^A /) && ( rec(101) =~ m/ENG/ ) ) { - marc_indicators('245', $i1, 2); +if ( rec('200','a') =~ m/^(Um|Un|An|La|Le|Il) / ) { + marc_indicators('245', $i1, 3); } -if ( ( rec('200','a') =~ m/^An /) && ( rec(101) =~ m/ENG/ ) ) { +if ( rec('200','a') =~ m/^(A|L') / ) { marc_indicators('245', $i1, 2); } + ### 245 -# redoslijed polja važan -# podpolja i interpunkcije pripremljeni u modify +## potpolja i interpunkcije pripremljeni u modify #_debug(3); marc_compose('245', 'a', suffix( - ( ! rec('200','p') && ( rec('200','f') || rec('200','c') ) ) ? ' / ' : - ( rec('200','p') && rec('200','c') ) ? ' : ' : - '', + ( ! ( rec('200','d') || rec('200','e') || rec('200','k') ) ) && ( rec('200','f') ) ? ' /' : + ( rec('200','d') ) ? ' =' : + ( rec('200','e') ) ? ' :' : + ( rec('200','k') ) ? ' ;' : + '.', rec('200','a'), ), 'b', suffix( - ( rec('200','p') && rec('200','f') ) ? ' / ' : - ( rec('200','p') && rec('200','c') ) ? '. ' : + ( rec('200','d') && rec('200','f') ) ? ' /' : + ( rec('200','d') && rec('200','c') ) ? '.' : + '', + rec('200','d'), + ), + 'b', suffix( + ( rec('200','e') && rec('200','f') ) ? ' /' : + ( rec('200','e') && rec('200','c') ) ? '.' : + '', + rec('200','e'), + ), + 'b', suffix( + ( rec('200','k') && rec('200','f') ) ? ' /' : + ( rec('200','k') && rec('200','c') ) ? '.' : '', - rec('200','p'), + rec('200','k'), ), 'c', suffix( - ( rec('200','f') && rec('200','c') ) ? '. ' : + ( rec('200','f') && rec('200','c') ) ? '.' : '', - rec('200','f'), + join_with(' ; ', + rec('200','f'), + rec('200','g') + ) + ), + ## append to last subfield + '+', suffix('.', + rec('200','c'), ), - '+', rec('200','c'), ); #_debug(0); -#marc_compose('245', -# 'a', suffix( -# rec('200','b') ? '. ' : -# rec('200','k') ? ' ; ' : -# rec('200','d') ? ' = ' : -# rec('200','e') ? ' : ' : -# rec('200','f') ? ' / ' : -# '.', -# rec('200','a') -# ), -## 'h', rec('200','b'), -# 'b', suffix( -# ( rec('200','k') && rec('200','f') ) ? ' / ' : -# ' ', -# join_with(' ; ', -# rec('200','k'), -# ), -# ), -# 'b', suffix( -# ( rec('200','d') && rec('200','f') ) ? ' / ' : -# ' ', -# rec('200','d'), -# ), -# 'b', suffix( -# ( rec('200','e') && rec('200','f') ) ? ' / ' : -# ' ', -# join_with(' : ', -# rec('200','e'), -# ), -# ), -# 'c', rec('200','f'), -### append to last subfield -# '+', prefix('. ', -# rec('200','c') -# ), -#); - - - +### 246 +marc_indicators('246', 1, 3); +marc('246','a', + rec('532') +); ### 250 +## zapisima koji nemaju potpolje, dodaje se ^a u modify - provjeriti marc_compose('250', 'a',suffix( @@ -319,26 +409,21 @@ 'b', rec('205','f'), ); -#marc('250','b', -# rec('205','f') -#); - - ### 260 -# ponovljiva potpolja u originalnom redosljedu +## ponovljiva potpolja u originalnom redosljedu - priprema u modify marc_original_order('260', '210'); ### 300 -# provjeriti interpunkcije !! +## urediti interpunkcije za sve kombinacije marc('300','a', suffix( rec('215','c') ? ' : ' : rec('215','d') ? ' ; ' : rec('215','e') ? ' + ' : - ' ', + '', rec('215','a') ) ); @@ -347,7 +432,7 @@ suffix( ( rec('215','c') && rec('215','d') ) ? ' ; ' : ( rec('215','c') && rec('215','e') ) ? ' + ' : - ' ', + '', rec('215','c') ) ); @@ -355,7 +440,7 @@ marc('300','c', suffix( rec('215','e') ? ' + ' : - ' ', + '', rec('215','d') ) ); @@ -364,9 +449,10 @@ rec('215','e') ); +### 362 - brojčani podaci za nakladničku cjelinu - razjasniti upotrebu -### 440 -# 2.ind. prema jeziku i članu +### 440 - indikatori +## 2.ind. prema jeziku i članu, provjeriti marc_indicators('440', ' ', '0'); @@ -381,52 +467,108 @@ } if ( ( rec('225','a') =~ m/^An /) && ( rec(101) =~ m/ENG/ ) ) { - marc_indicators('440', ' ', 2); + marc_indicators('440', ' ', 3); } #_debug(3); -marc('440', - 'a', suffix( rec('225','f'), - rec('225','a'), - ), +### 440 + +marc_template( + from => 225, to => 440, + subfields_rename => [ + 'a' => 'a', + 'x' => 'x', + 'v' => 'v', + 'h' => 'n', + 'i' => 'p', + 'w' => 'v', + ], + isis_template => [ + 'a.|h,|i ;|w', + 'a.|h.|w', + 'a.|i ;|w', + 'a ;|v.|i', + 'a ;|v.|i ;|w', + 'a ;|v.|h,|i ;|w', + 'a ;|v.|h ;|w', + 'a ;|v ;|w', + #mozda greska: + 'a ;|v,|x ;|w', + 'a,|x ;|v', + 'a,|x.|p ;|w', + ], + marc_template => [ + 'a', + 'a ;|v', + 'a,|x', + 'a.|n', # mozda greska + 'a.|n,|p', + 'a.|p', + 'a ;|v.|n', + 'a ;|v.|n,|p', # mozda greska + 'v', + 'x', + ], ); -# join_with(' / ', -# join_with(' ', -# rec('225','a'), -# rec('225','p'), -# ), -# rec('225','f') -# ), -#_debug(0); +## marc_compose za 440 radi samo kad polje ni potpolja nisu ponovljiva. ne zapisuje dobro drugo pojavljivanje ^v, tj. ^v iza ^p (iz 225^w) -marc('440','n', - rec('225','h') -); +#marc_compose('440', +# 'a', suffix( +# ( rec('225','v') ) ? ' ;' : +# ( rec('225','w') ) ? ' ; ' : +# ( rec('225','x') ) ? ',' : +# ( rec('225','h') || rec('225','i') ) ? '.' : +# '.', +# frec('225','a') +# ), +# 'x',suffix( +# ( rec('225','x') && ( rec('225','h') || rec('225','i') ) ) ? '.' : +# '', +# frec('225','x') +# ), +# 'v',suffix( +# ( rec('225','v') && ( rec('225','h') || rec('225','i') ) ) ? '.' : +# ( rec('225','v') && rec('225','w') ) ? ' ; ' : +# '', +# frec('225','v') +# ), +# 'n',suffix( +# ( rec('225','h') && rec('225','i') ) ? ',' : +# ( rec('225','h') && rec('225','w') ) ? ' ; ' : +# '', +# frec('225','h') +# ), +# 'p',suffix( +# ( rec('225','i') && rec('225','w') ) ? ' ; ' : +# ( rec('225','i') && rec('225','x') ) ? ',' : +# '', +# frec('225','i') +# ), +## 225w treba ici u 440v, na kraj +# '+', join_with(' ; ', +# rec('225','w'), +# ) +#); -marc('440','p', - rec('225','i') -); +#marc_original_order('440','225'); -marc('440','v', - rec('225','v'), -); -marc('440','x', - rec('225','x') -); +#if ( +# count( lookup( +# sub { 1 }, +# 'ffps','libri', +# sub { rec('225','a') } +# ) ) > 1 +#) { -### 490 -# -#marc('490','a', -# rec('225','a') -#); +#_debug(0); -### 50x +### 500 marc('500','a', rec('300') @@ -445,7 +587,7 @@ ); ### 502 - bilješka o disertacijama -# odgovarajućeg polja nema u originalnim podacima. možda se može pretpostaviti? +## odgovarajućeg polja nema u originalnim podacima. možda se može pretpostaviti? ### 504 @@ -453,13 +595,11 @@ rec('320') ); -## napomene uz konverziju polja 327 (sadrzaj): -# NSK konvertira 327 (NP) u 501 (R) -# u LOC konv. tablici stoji 327 (NP) u 505 (NR) -# standard i validacije dopuštaju 501 (R) i 505 (R) - -## 505 +### 505 ## FFPS 327 - sadrzaj +## NSK konvertira 327 (NP) u 501 (R) +## u LOC konv. tablici stoji 327 (NP) u 505 (NR) +## standard i validacije dopuštaju 501 (R) i 505 (R) if ( config() =~ m/ffps/ || config() =~ m/fftu/ ) { marc_indicators('505', '0', ' '); @@ -481,14 +621,11 @@ -## napomene uz konverziju polja 330: -# NSK konvertira 330 (P) u 520 (P) = LOC konv. tablica - ### 520 -# možda i polje 520y - jezik napomene ako je uvijek isti jezik +## NSK konvertira 330 (P) u 520 (P) = LOC konv. tablica +## FFPS 330 (NP) - sažetak -# FFPS 330 (NP) - sažetak if ( config() =~ m/ffps/ ) { marc('520','a', regex('s/[\\r\\n]+/. /g', @@ -498,6 +635,7 @@ } ### 526 - STUDY PROGRAM INFORMATION NOTE +## provjeriti za svaku bazu sta je u 996? marc_indicators('526', 8, ' '); @@ -511,14 +649,6 @@ rec('337','a') ); - -### 246 - -marc_indicators('246', 1, 3); -marc('246','a', - rec('532') -); - ### 655 marc_indicators('655', ' ', 4); @@ -537,6 +667,7 @@ ### 700 +## ako je u originalu ponovljivo polje treba biti i konvertirano u ponovljivo !! marc_indicators('700', 1, ' '); @@ -576,13 +707,12 @@ marc('700','a', - rec('702','a'), + join_with(', ', + rec('702', 'a'), + rec('702', 'b') + ) ); - -# ako je u originalu ponovljivo polje treba biti i konvertirano u ponovljivo !! - - marc('700','a', join_with(', ', rec('702','c'), @@ -604,40 +734,10 @@ ) ); -## treba provjeriti da li polje 330 sadrzi jos neke podatke koji mogu biti u <> ili su tu iskljucivo autori? da li samo autori ili neke druge osobe? -# -# marc('700','a', -# rec('330','a') -# ); -# -# -# marc('700','a', -# rec('330','b') -# ); -# -# marc('700','a', -# rec('330','c') -# ); -# -# -# marc('700','a', -# rec('330','d') -# ); -# -# marc('700','a', -# rec('330','e') -# ); -# -# marc('700','a', -# rec('330','f') -# ); - #_debug(0); - - -### 740 +### 740 - nadopuniti marc_indicators('740', 0, ' '); @@ -658,52 +758,54 @@ # }; -### generiranje zapisa o nakladničkoj cjelini i povezivanje podređenog zapisa s nadređenim - -if ( - rec('225','a') # da li je nakladnicka cjelina? -) { - -my $series_key = -join_with('', - rec('225','a'), - rec('210','a'), - rec('210','b'), -); - -my $series = get( $series_key ); - -if ($series) { - warn "nije novi"; -} else { - - -$series = join_with('', - config(), - 'LS', - rec('000') -); - -set( $series_key => $series ); - -} -} -my $series_key = join_with('', - rec('225','a'), - rec('210','a'), - rec('210','b'), -); +### 760 w +## generiranje zapisa o nakladničkoj cjelini i povezivanje podređenog zapisa s nadređenim -if ($series_key) { +#if ( +# rec('225','a') # da li je nakladnička cjelina? +#) { +# +#my $series_key = +#join_with('', +# rec('225','a'), +# rec('210','a'), +# rec('210','b'), +#); +# +#my $series = get( $series_key ); +# +#if ($series) { +# warn "nije novi"; +#} else { +# +#$series = join_with('', +# uc( config() ), +# ' LS', +# rec('000') +#); +# +#set( $series_key => $series ); +# +#} # $series +#} # nakladnička cjelina +# +#my $series_key = join_with('', +# rec('225','a'), +# rec('210','a'), +# rec('210','b'), +#); +# +#if ($series_key) { +# +# marc_indicators('760', 0, ' '); +# +# marc('760','w', +# get( $series_key ) +# ); +#} - marc_indicators('760', 0, ' '); - - marc('760','w', - get( $series_key ) - ); -} -### testing +# ## testing # # my $dup_key = join_with('', # rec('200','a'), @@ -724,7 +826,7 @@ # -## 852 - lokacija +### 852 - signatura marc_indicators('852', 4, ' '); @@ -734,13 +836,13 @@ ) ); -## 876 - item information - basic bibliographic unit +### 876 - item information - basic bibliographic unit marc('876','a', rec('991'), ); -## 886 - former marc +### 886 - former marc marc_indicators('886', 2, ' ');