/[webpac2]/trunk/lib/WebPAC/Normalize.pm
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/lib/WebPAC/Normalize.pm

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 604 by dpavlin, Sun Jul 30 14:19:54 2006 UTC revision 813 by dpavlin, Sun Apr 1 21:47:47 2007 UTC
# Line 2  package WebPAC::Normalize; Line 2  package WebPAC::Normalize;
2  use Exporter 'import';  use Exporter 'import';
3  @EXPORT = qw/  @EXPORT = qw/
4          _set_rec _set_lookup          _set_rec _set_lookup
5            _set_load_row
6          _get_ds _clean_ds          _get_ds _clean_ds
7          _debug          _debug
8            _pack_subfields_hash
9    
10          tag search display          tag search display
11          marc marc_indicators marc_repeatable_subfield          marc marc_indicators marc_repeatable_subfield
12          marc_compose marc_leader          marc_compose marc_leader
13          marc_duplicate marc_remove          marc_duplicate marc_remove marc_count
14          marc_original_order          marc_original_order
15    
16          rec1 rec2 rec          rec1 rec2 rec
17          regex prefix suffix surround          regex prefix suffix surround
18          first lookup join_with          first lookup join_with
19            save_into_lookup
20    
21          split_rec_on          split_rec_on
22    
23            get set
24            count
25  /;  /;
26    
27  use warnings;  use warnings;
# Line 23  use strict; Line 29  use strict;
29    
30  #use base qw/WebPAC::Common/;  #use base qw/WebPAC::Common/;
31  use Data::Dump qw/dump/;  use Data::Dump qw/dump/;
 use Encode qw/from_to/;  
32  use Storable qw/dclone/;  use Storable qw/dclone/;
33    use Carp qw/confess/;
34    
35  # debugging warn(s)  # debugging warn(s)
36  my $debug = 0;  my $debug = 0;
# Line 36  WebPAC::Normalize - describe normalisato Line 42  WebPAC::Normalize - describe normalisato
42    
43  =head1 VERSION  =head1 VERSION
44    
45  Version 0.15  Version 0.27
46    
47  =cut  =cut
48    
49  our $VERSION = '0.15';  our $VERSION = '0.27';
50    
51  =head1 SYNOPSIS  =head1 SYNOPSIS
52    
# Line 66  All other functions are available for us Line 72  All other functions are available for us
72  Return data structure  Return data structure
73    
74    my $ds = WebPAC::Normalize::data_structure(    my $ds = WebPAC::Normalize::data_structure(
75          lookup => $lookup->lookup_hash,          lookup => $lookup_hash,
76          row => $row,          row => $row,
77          rules => $normalize_pl_config,          rules => $normalize_pl_config,
78          marc_encoding => 'utf-8',          marc_encoding => 'utf-8',
79          config => $config,          config => $config,
80            load_row_coderef => sub {
81                    my ($database,$input,$mfn) = shift;
82                    $store->load_row( database => $database, input => $input, id => $mfn );
83            },
84    );    );
85    
86  Options C<lookup>, C<row>, C<rules> and C<log> are mandatory while all  Options C<row>, C<rules> and C<log> are mandatory while all
87  other are optional.  other are optional.
88    
89    C<load_row_coderef> is closure only used when executing lookups, so they will
90    die if it's not defined.
91    
92  This function will B<die> if normalizastion can't be evaled.  This function will B<die> if normalizastion can't be evaled.
93    
94  Since this function isn't exported you have to call it with  Since this function isn't exported you have to call it with
# Line 83  C<WebPAC::Normalize::data_structure>. Line 96  C<WebPAC::Normalize::data_structure>.
96    
97  =cut  =cut
98    
99    my $load_row_coderef;
100    
101  sub data_structure {  sub data_structure {
102          my $arg = {@_};          my $arg = {@_};
103    
# Line 90  sub data_structure { Line 105  sub data_structure {
105          die "need normalisation argument" unless ($arg->{rules});          die "need normalisation argument" unless ($arg->{rules});
106    
107          no strict 'subs';          no strict 'subs';
108          _set_lookup( $arg->{lookup} );          _set_lookup( $arg->{lookup} ) if defined($arg->{lookup});
109          _set_rec( $arg->{row} );          _set_rec( $arg->{row} );
110          _set_config( $arg->{config} );          _set_config( $arg->{config} ) if defined($arg->{config});
111          _clean_ds( %{ $arg } );          _clean_ds( %{ $arg } );
112            $load_row_coderef = $arg->{load_row_coderef};
113    
114          eval "$arg->{rules}";          eval "$arg->{rules}";
115          die "error evaling $arg->{rules}: $@\n" if ($@);          die "error evaling $arg->{rules}: $@\n" if ($@);
116    
# Line 150  Return hash formatted as data structure Line 167  Return hash formatted as data structure
167    
168  =cut  =cut
169    
170  my ($out, $marc_record, $marc_encoding, $marc_repeatable_subfield, $marc_indicators);  my ($out, $marc_record, $marc_encoding, $marc_repeatable_subfield, $marc_indicators, $marc_leader);
171  my ($marc_record_offset, $marc_fetch_offset) = (0, 0);  my ($marc_record_offset, $marc_fetch_offset) = (0, 0);
172    
173  sub _get_ds {  sub _get_ds {
# Line 167  Clean data structure hash for next recor Line 184  Clean data structure hash for next recor
184    
185  sub _clean_ds {  sub _clean_ds {
186          my $a = {@_};          my $a = {@_};
187          ($out,$marc_record, $marc_encoding, $marc_repeatable_subfield, $marc_indicators) = ();          ($out,$marc_record, $marc_encoding, $marc_repeatable_subfield, $marc_indicators, $marc_leader) = ();
188          ($marc_record_offset, $marc_fetch_offset) = (0,0);          ($marc_record_offset, $marc_fetch_offset) = (0,0);
189          $marc_encoding = $a->{marc_encoding};          $marc_encoding = $a->{marc_encoding};
190  }  }
# Line 186  sub _set_lookup { Line 203  sub _set_lookup {
203          $lookup = shift;          $lookup = shift;
204  }  }
205    
206    =head2 _get_lookup
207    
208    Get current lookup hash
209    
210      my $lookup = _get_lookup();
211    
212    =cut
213    
214    sub _get_lookup {
215            return $lookup;
216    }
217    
218    =head2 _set_load_row
219    
220    Setup code reference which will return L<data_structure> from
221    L<WebPAC::Store>
222    
223      _set_load_row(sub {
224                    my ($database,$input,$mfn) = @_;
225                    $store->load_row( database => $database, input => $input, id => $mfn );
226      });
227    
228    =cut
229    
230    sub _set_load_row {
231            my $coderef = shift;
232            confess "argument isn't CODE" unless ref($coderef) eq 'CODE';
233    
234            $load_row_coderef = $coderef;
235    }
236    
237  =head2 _get_marc_fields  =head2 _get_marc_fields
238    
239  Get all fields defined by calls to C<marc>  Get all fields defined by calls to C<marc>
# Line 241  will return 42th copy record (if it exis Line 289  will return 42th copy record (if it exis
289    
290  =cut  =cut
291    
292    my $fetch_pos;
293    
294  sub _get_marc_fields {  sub _get_marc_fields {
295    
296          my $arg = {@_};          my $arg = {@_};
297          warn "### _get_marc_fields arg: ", dump($arg), $/ if ($debug > 2);          warn "### _get_marc_fields arg: ", dump($arg), $/ if ($debug > 2);
298          my $offset = $marc_fetch_offset;          $fetch_pos = $marc_fetch_offset;
299          if ($arg->{offset}) {          if ($arg->{offset}) {
300                  $offset = $arg->{offset};                  $fetch_pos = $arg->{offset};
301          } elsif($arg->{fetch_next}) {          } elsif($arg->{fetch_next}) {
302                  $marc_fetch_offset++;                  $marc_fetch_offset++;
303          }          }
# Line 256  sub _get_marc_fields { Line 306  sub _get_marc_fields {
306    
307          warn "### full marc_record = ", dump( @{ $marc_record }), $/ if ($debug > 2);          warn "### full marc_record = ", dump( @{ $marc_record }), $/ if ($debug > 2);
308    
309          my $marc_rec = $marc_record->[ $offset ];          my $marc_rec = $marc_record->[ $fetch_pos ];
310    
311          warn "## _get_marc_fields (at offset: $offset) -- marc_record = ", dump( @$marc_rec ), $/ if ($debug > 1);          warn "## _get_marc_fields (at offset: $fetch_pos) -- marc_record = ", dump( @$marc_rec ), $/ if ($debug > 1);
312    
313          return if (! $marc_rec || ref($marc_rec) ne 'ARRAY' || $#{ $marc_rec } < 0);          return if (! $marc_rec || ref($marc_rec) ne 'ARRAY' || $#{ $marc_rec } < 0);
314    
# Line 279  sub _get_marc_fields { Line 329  sub _get_marc_fields {
329    
330          if ($debug) {          if ($debug) {
331                  warn "## marc_repeatable_subfield = ", dump( $marc_repeatable_subfield ), $/ if ( $marc_repeatable_subfield );                  warn "## marc_repeatable_subfield = ", dump( $marc_repeatable_subfield ), $/ if ( $marc_repeatable_subfield );
332                  warn "## marc_record[$offset] = ", dump( $marc_rec ), $/;                  warn "## marc_record[$fetch_pos] = ", dump( $marc_rec ), $/;
333                  warn "## sorted_marc_record = ", dump( \@sorted_marc_record ), $/;                  warn "## sorted_marc_record = ", dump( \@sorted_marc_record ), $/;
334                  warn "## subfield count = ", dump( $u ), $/;                  warn "## subfield count = ", dump( $u ), $/;
335          }          }
# Line 360  sub _get_marc_fields { Line 410  sub _get_marc_fields {
410          return \@m;          return \@m;
411  }  }
412    
413    =head2 _get_marc_leader
414    
415    Return leader from currently fetched record by L</_get_marc_fields>
416    
417      print WebPAC::Normalize::_get_marc_leader();
418    
419    =cut
420    
421    sub _get_marc_leader {
422            die "no fetch_pos, did you called _get_marc_fields first?" unless ( defined( $fetch_pos ) );
423            return $marc_leader->[ $fetch_pos ];
424    }
425    
426  =head2 _debug  =head2 _debug
427    
428  Change level of debug warnings  Change level of debug warnings
# Line 442  sub marc_leader { Line 505  sub marc_leader {
505          my ($offset,$value) = @_;          my ($offset,$value) = @_;
506    
507          if ($offset) {          if ($offset) {
508                  $out->{' leader'}->{ $offset } = $value;                  $marc_leader->[ $marc_record_offset ]->{ $offset } = $value;
509          } else {          } else {
510                  return $out->{' leader'};                  
511                    if (defined($marc_leader)) {
512                            die "marc_leader not array = ", dump( $marc_leader ) unless (ref($marc_leader) eq 'ARRAY');
513                            return $marc_leader->[ $marc_record_offset ];
514                    } else {
515                            return;
516                    }
517          }          }
518  }  }
519    
# Line 469  sub marc { Line 538  sub marc {
538          foreach (@_) {          foreach (@_) {
539                  my $v = $_;             # make var read-write for Encode                  my $v = $_;             # make var read-write for Encode
540                  next unless (defined($v) && $v !~ /^\s*$/);                  next unless (defined($v) && $v !~ /^\s*$/);
                 from_to($v, 'iso-8859-2', $marc_encoding) if ($marc_encoding);  
541                  my ($i1,$i2) = defined($marc_indicators->{$f}) ? @{ $marc_indicators->{$f} } : (' ',' ');                  my ($i1,$i2) = defined($marc_indicators->{$f}) ? @{ $marc_indicators->{$f} } : (' ',' ');
542                  if (defined $sf) {                  if (defined $sf) {
543                          push @{ $marc_record->[ $marc_record_offset ] }, [ $f, $i1, $i2, $sf => $v ];                          push @{ $marc_record->[ $marc_record_offset ] }, [ $f, $i1, $i2, $sf => $v ];
# Line 540  sub marc_compose { Line 608  sub marc_compose {
608    
609          warn "### marc_compose input subfields = ", dump(@_),$/ if ($debug > 2);          warn "### marc_compose input subfields = ", dump(@_),$/ if ($debug > 2);
610    
611            if ($#_ % 2 != 1) {
612                    die "ERROR: marc_compose",dump($f,@_)," not valid (must be even).\nDo you need to add first() or join() around some argument?\n";
613            }
614    
615          while (@_) {          while (@_) {
616                  my $sf = shift or die "marc_compose $f needs subfield";                  my $sf = shift;
617                  my $v = shift;                  my $v = shift;
618    
619                  next unless (defined($v) && $v !~ /^\s*$/);                  next unless (defined($v) && $v !~ /^\s*$/);
                 from_to($v, 'iso-8859-2', $marc_encoding) if ($marc_encoding);  
620                  warn "## ++ marc_compose($f,$sf,$v) ", dump( $m ),$/ if ($debug > 1);                  warn "## ++ marc_compose($f,$sf,$v) ", dump( $m ),$/ if ($debug > 1);
621                  if ($sf ne '+') {                  if ($sf ne '+') {
622                          push @$m, ( $sf, $v );                          push @$m, ( $sf, $v );
# Line 574  sub marc_duplicate { Line 645  sub marc_duplicate {
645           my $m = $marc_record->[ -1 ];           my $m = $marc_record->[ -1 ];
646           die "can't duplicate record which isn't defined" unless ($m);           die "can't duplicate record which isn't defined" unless ($m);
647           push @{ $marc_record }, dclone( $m );           push @{ $marc_record }, dclone( $m );
648           warn "## marc_duplicate = ", dump(@$marc_record), $/ if ($debug > 1);           push @{ $marc_leader }, dclone( marc_leader() );
649             warn "## marc_duplicate = ", dump(@$marc_leader, @$marc_record), $/ if ($debug > 1);
650           $marc_record_offset = $#{ $marc_record };           $marc_record_offset = $#{ $marc_record };
651           warn "## marc_record_offset = $marc_record_offset", $/ if ($debug > 1);           warn "## marc_record_offset = $marc_record_offset", $/ if ($debug > 1);
652    
653  }  }
654    
655  =head2 marc_remove  =head2 marc_remove
# Line 588  Remove some field or subfield from MARC Line 661  Remove some field or subfield from MARC
661    
662  This will erase field C<200> or C<200^a> from current MARC record.  This will erase field C<200> or C<200^a> from current MARC record.
663    
664      marc_remove('*');
665    
666    Will remove all fields in current MARC record.
667    
668  This is useful after calling C<marc_duplicate> or on it's own (but, you  This is useful after calling C<marc_duplicate> or on it's own (but, you
669  should probably just remove that subfield definition if you are not  should probably just remove that subfield definition if you are not
670  using C<marc_duplicate>).  using C<marc_duplicate>).
# Line 605  sub marc_remove { Line 682  sub marc_remove {
682    
683          warn "### marc_remove before = ", dump( $marc ), $/ if ($debug > 2);          warn "### marc_remove before = ", dump( $marc ), $/ if ($debug > 2);
684    
685          my $i = 0;          if ($f eq '*') {
686          foreach ( 0 .. $#{ $marc } ) {  
687                  last unless (defined $marc->[$i]);                  delete( $marc_record->[ $marc_record_offset ] );
688                  warn "#### working on ",dump( @{ $marc->[$i] }), $/ if ($debug > 3);                  warn "## full marc_record = ", dump( @{ $marc_record }), $/ if ($debug > 1);
689                  if ($marc->[$i]->[0] eq $f) {  
690                          if (! defined $sf) {          } else {
691                                  # remove whole field  
692                                  splice @$marc, $i, 1;                  my $i = 0;
693                                  warn "#### slice \@\$marc, $i, 1 = ",dump( @{ $marc }), $/ if ($debug > 3);                  foreach ( 0 .. $#{ $marc } ) {
694                                  $i--;                          last unless (defined $marc->[$i]);
695                          } else {                          warn "#### working on ",dump( @{ $marc->[$i] }), $/ if ($debug > 3);
696                                  foreach my $j ( 0 .. (( $#{ $marc->[$i] } - 3 ) / 2) ) {                          if ($marc->[$i]->[0] eq $f) {
697                                          my $o = ($j * 2) + 3;                                  if (! defined $sf) {
698                                          if ($marc->[$i]->[$o] eq $sf) {                                          # remove whole field
699                                                  # remove subfield                                          splice @$marc, $i, 1;
700                                                  splice @{$marc->[$i]}, $o, 2;                                          warn "#### slice \@\$marc, $i, 1 = ",dump( @{ $marc }), $/ if ($debug > 3);
701                                                  warn "#### slice \@{\$marc->[$i]}, $o, 2 = ", dump( @{ $marc }), $/ if ($debug > 3);                                          $i--;
702                                                  # is record now empty?                                  } else {
703                                                  if ($#{ $marc->[$i] } == 2) {                                          foreach my $j ( 0 .. (( $#{ $marc->[$i] } - 3 ) / 2) ) {
704                                                          splice @$marc, $i, 1;                                                  my $o = ($j * 2) + 3;
705                                                          warn "#### slice \@\$marc, $i, 1 = ", dump( @{ $marc }), $/ if ($debug > 3);                                                  if ($marc->[$i]->[$o] eq $sf) {
706                                                          $i--;                                                          # remove subfield
707                                                  };                                                          splice @{$marc->[$i]}, $o, 2;
708                                                            warn "#### slice \@{\$marc->[$i]}, $o, 2 = ", dump( @{ $marc }), $/ if ($debug > 3);
709                                                            # is record now empty?
710                                                            if ($#{ $marc->[$i] } == 2) {
711                                                                    splice @$marc, $i, 1;
712                                                                    warn "#### slice \@\$marc, $i, 1 = ", dump( @{ $marc }), $/ if ($debug > 3);
713                                                                    $i--;
714                                                            };
715                                                    }
716                                          }                                          }
717                                  }                                  }
718                          }                          }
719                            $i++;
720                  }                  }
                 $i++;  
         }  
721    
722          warn "### marc_remove($f", $sf ? ",$sf" : "", ") after = ", dump( $marc ), $/ if ($debug > 2);                  warn "### marc_remove($f", $sf ? ",$sf" : "", ") after = ", dump( $marc ), $/ if ($debug > 2);
723    
724          $marc_record->[ $marc_record_offset ] = $marc;                  $marc_record->[ $marc_record_offset ] = $marc;
725            }
726    
727          warn "## full marc_record = ", dump( @{ $marc_record }), $/ if ($debug > 1);          warn "## full marc_record = ", dump( @{ $marc_record }), $/ if ($debug > 1);
728  }  }
# Line 646  sub marc_remove { Line 731  sub marc_remove {
731    
732  Copy all subfields preserving original order to marc field.  Copy all subfields preserving original order to marc field.
733    
734    marc_original_order(210, 260);    marc_original_order( marc_field_number, original_input_field_number );
735    
736    Please note that field numbers are consistent with other commands (marc
737    field number first), but somewhat counter-intuitive (destination and then
738    source).
739    
740  You might want to use this command if you are just renaming subfields or  You might want to use this command if you are just renaming subfields or
741  using pre-processing modify_record in C<config.yml> and don't need any  using pre-processing modify_record in C<config.yml> and don't need any
742  post-processing or want to preserve order of original subfields.  post-processing or want to preserve order of original subfields.
743    
744    
745  =cut  =cut
746    
747  sub marc_original_order {  sub marc_original_order {
748    
749          my ($from, $to) = @_;          my ($to, $from) = @_;
750          die "marc_original_order needs from and to fields\n" unless ($from && $to);          die "marc_original_order needs from and to fields\n" unless ($from && $to);
751    
752          my $r = $rec->{$from} || return;          return unless defined($rec->{$from});
753    
754            my $r = $rec->{$from};
755          die "record field $from isn't array\n" unless (ref($r) eq 'ARRAY');          die "record field $from isn't array\n" unless (ref($r) eq 'ARRAY');
756    
757          my ($i1,$i2) = defined($marc_indicators->{$to}) ? @{ $marc_indicators->{$to} } : (' ',' ');          my ($i1,$i2) = defined($marc_indicators->{$to}) ? @{ $marc_indicators->{$to} } : (' ',' ');
758          warn "## marc_original_order($from,$to) source = ", dump( $r ),$/ if ($debug > 1);          warn "## marc_original_order($to,$from) source = ", dump( $r ),$/ if ($debug > 1);
759    
760          foreach my $d (@$r) {          foreach my $d (@$r) {
761    
762                    if (! defined($d->{subfields}) && ref($d->{subfields}) ne 'ARRAY') {
763                            warn "# marc_original_order($to,$from): field $from doesn't have subfields specification\n";
764                            next;
765                    }
766            
767                  my @sfs = @{ $d->{subfields} };                  my @sfs = @{ $d->{subfields} };
768    
                 die "field $from doesn't have subfields specification\n" unless(@sfs);  
769                  die "field $from doesn't have even number of subfields specifications\n" unless($#sfs % 2 == 1);                  die "field $from doesn't have even number of subfields specifications\n" unless($#sfs % 2 == 1);
770    
771  warn "#--> d: ",dump($d), "\n#--> sfs: ",dump(@sfs),$/;                  warn "#--> d: ",dump($d), "\n#--> sfs: ",dump(@sfs),$/ if ($debug > 2);
772    
773                  my $m = [ $to, $i1, $i2 ];                  my $m = [ $to, $i1, $i2 ];
774    
775                  while (my $sf = shift @sfs) {                  while (my $sf = shift @sfs) {
776  warn "#--> sf: ",dump($sf), $/;  
777                            warn "#--> sf: ",dump($sf), $/ if ($debug > 2);
778                          my $offset = shift @sfs;                          my $offset = shift @sfs;
779                          die "corrupted sufields specification for field $from\n" unless defined($offset);                          die "corrupted sufields specification for field $from\n" unless defined($offset);
780    
# Line 698  warn "#--> sf: ",dump($sf), $/; Line 795  warn "#--> sf: ",dump($sf), $/;
795          }          }
796    
797          warn "## marc_record = ", dump( $marc_record ),$/ if ($debug > 1);          warn "## marc_record = ", dump( $marc_record ),$/ if ($debug > 1);
798    }
799    
800    =head2 marc_count
801    
802    Return number of MARC records created using L</marc_duplicate>.
803    
804      print "created ", marc_count(), " records";
805    
806    =cut
807    
808          warn "# marc_original_order is partly implemented";  sub marc_count {
809            return $#{ $marc_record };
810  }  }
811    
812    
# Line 708  warn "#--> sf: ",dump($sf), $/; Line 815  warn "#--> sf: ",dump($sf), $/;
815  This function should be used inside functions to create C<data_structure> described  This function should be used inside functions to create C<data_structure> described
816  above.  above.
817    
818    =head2 _pack_subfields_hash
819    
820     @subfields = _pack_subfields_hash( $h );
821     $subfields = _pack_subfields_hash( $h, 1 );
822    
823    Return each subfield value in array or pack them all together and return scalar
824    with subfields (denoted by C<^>) and values.
825    
826    =cut
827    
828    sub _pack_subfields_hash {
829    
830            warn "## _pack_subfields_hash( ",dump(@_), " )\n" if ($debug > 1);
831    
832            my ($h,$include_subfields) = @_;
833    
834            if ( defined($h->{subfields}) ) {
835                    my $sfs = delete $h->{subfields} || die "no subfields?";
836                    my @out;
837                    while (@$sfs) {
838                            my $sf = shift @$sfs;
839                            push @out, '^' . $sf if ($include_subfields);
840                            my $o = shift @$sfs;
841                            if ($o == 0 && ref( $h->{$sf} ) ne 'ARRAY' ) {
842                                    # single element subfields are not arrays
843    #warn "====> $sf $o / $#$sfs ", dump( $sfs, $h->{$sf} ), "\n";
844    
845                                    push @out, $h->{$sf};
846                            } else {
847    #warn "====> $sf $o / $#$sfs ", dump( $sfs, $h->{$sf} ), "\n";
848                                    push @out, $h->{$sf}->[$o];
849                            }
850                    }
851                    if ($include_subfields) {
852                            return join('', @out);
853                    } else {
854                            return @out;
855                    }
856            } else {
857                    if ($include_subfields) {
858                            my $out = '';
859                            foreach my $sf (sort keys %$h) {
860                                    if (ref($h->{$sf}) eq 'ARRAY') {
861                                            $out .= '^' . $sf . join('^' . $sf, @{ $h->{$sf} });
862                                    } else {
863                                            $out .= '^' . $sf . $h->{$sf};
864                                    }
865                            }
866                            return $out;
867                    } else {
868                            # FIXME this should probably be in alphabetical order instead of hash order
869                            values %{$h};
870                    }
871            }
872    }
873    
874  =head2 rec1  =head2 rec1
875    
876  Return all values in some field  Return all values in some field
# Line 724  sub rec1 { Line 887  sub rec1 {
887          return unless (defined($rec) && defined($rec->{$f}));          return unless (defined($rec) && defined($rec->{$f}));
888          warn "rec1($f) = ", dump( $rec->{$f} ), $/ if ($debug > 1);          warn "rec1($f) = ", dump( $rec->{$f} ), $/ if ($debug > 1);
889          if (ref($rec->{$f}) eq 'ARRAY') {          if (ref($rec->{$f}) eq 'ARRAY') {
890                  return map {                  my @out;
891                          if (ref($_) eq 'HASH') {                  foreach my $h ( @{ $rec->{$f} } ) {
892                                  values %{$_};                          if (ref($h) eq 'HASH') {
893                                    push @out, ( _pack_subfields_hash( $h ) );
894                          } else {                          } else {
895                                  $_;                                  push @out, $h;
896                          }                          }
897                  } @{ $rec->{$f} };                  }
898                    return @out;
899          } elsif( defined($rec->{$f}) ) {          } elsif( defined($rec->{$f}) ) {
900                  return $rec->{$f};                  return $rec->{$f};
901          }          }
# Line 765  syntaxtic sugar for Line 930  syntaxtic sugar for
930    @v = rec('200')    @v = rec('200')
931    @v = rec('200','a')    @v = rec('200','a')
932    
933    If rec() returns just single value, it will
934    return scalar, not array.
935    
936  =cut  =cut
937    
938  sub rec {  sub rec {
# Line 774  sub rec { Line 942  sub rec {
942          } elsif ($#_ == 1) {          } elsif ($#_ == 1) {
943                  @out = rec2(@_);                  @out = rec2(@_);
944          }          }
945          if (@out) {          if ($#out == 0 && ! wantarray) {
946                    return $out[0];
947            } elsif (@out) {
948                  return @out;                  return @out;
949          } else {          } else {
950                  return '';                  return '';
# Line 858  sub first { Line 1028  sub first {
1028    
1029  Consult lookup hashes for some value  Consult lookup hashes for some value
1030    
1031    @v = lookup( $v );    @v = lookup(
1032    @v = lookup( @v );          sub {
1033                    'ffkk/peri/mfn'.rec('000')
1034            },
1035            'ffkk','peri','200-a-200-e',
1036            sub {
1037                    first(rec(200,'a')).' '.first(rec('200','e'))
1038            }
1039      );
1040    
1041    Code like above will be B<automatically generated> using L<WebPAC::Parse> from
1042    normal lookup definition in C<conf/lookup/something.pl> which looks like:
1043    
1044      lookup(
1045            # which results to return from record recorded in lookup
1046            sub { 'ffkk/peri/mfn' . rec('000') },
1047            # from which database and input
1048            'ffkk','peri',
1049            # such that following values match
1050            sub { first(rec(200,'a')) . ' ' . first(rec('200','e')) },
1051            # if this part is missing, we will try to match same fields
1052            # from lookup record and current one, or you can override
1053            # which records to use from current record using
1054            sub { rec('900','x') . ' ' . rec('900','y') },
1055      )
1056    
1057    You can think about this lookup as SQL (if that helps):
1058    
1059      select
1060            sub { what }
1061      from
1062            database, input
1063      where
1064        sub { filter from lookuped record }
1065      having
1066        sub { optional filter on current record }
1067    
1068    Easy as pie, right?
1069    
1070  =cut  =cut
1071    
1072  sub lookup {  sub lookup {
1073          my $k = shift or return;          my ($what, $database, $input, $key, $having) = @_;
1074          return unless (defined($lookup->{$k}));  
1075          if (ref($lookup->{$k}) eq 'ARRAY') {          confess "lookup needs 5 arguments: what, database, input, key, having\n" unless ($#_ == 4);
1076                  return @{ $lookup->{$k} };  
1077            warn "## lookup ($database, $input, $key)", $/ if ($debug > 1);
1078            return unless (defined($lookup->{$database}->{$input}->{$key}));
1079    
1080            confess "lookup really need load_row_coderef added to data_structure\n" unless ($load_row_coderef);
1081    
1082            my $mfns;
1083            my @having = $having->();
1084    
1085            warn "## having = ", dump( @having ) if ($debug > 2);
1086    
1087            foreach my $h ( @having ) {
1088                    if (defined($lookup->{$database}->{$input}->{$key}->{$h})) {
1089                            warn "lookup for $database/$input/$key/$h return ",dump($lookup->{$database}->{$input}->{$key}->{$h}),"\n" if ($debug);
1090                            $mfns->{$_}++ foreach keys %{ $lookup->{$database}->{$input}->{$key}->{$h} };
1091                    }
1092            }
1093    
1094            return unless ($mfns);
1095    
1096            my @mfns = sort keys %$mfns;
1097    
1098            warn "# lookup loading $database/$input/$key mfn ", join(",",@mfns)," having ",dump(@having),"\n" if ($debug);
1099    
1100            my $old_rec = $rec;
1101            my @out;
1102    
1103            foreach my $mfn (@mfns) {
1104                    $rec = $load_row_coderef->( $database, $input, $mfn );
1105    
1106                    warn "got $database/$input/$mfn = ", dump($rec), $/ if ($debug);
1107    
1108                    my @vals = $what->();
1109    
1110                    push @out, ( @vals );
1111    
1112                    warn "lookup for mfn $mfn returned ", dump(@vals), $/ if ($debug);
1113            }
1114    
1115    #       if (ref($lookup->{$k}) eq 'ARRAY') {
1116    #               return @{ $lookup->{$k} };
1117    #       } else {
1118    #               return $lookup->{$k};
1119    #       }
1120    
1121            $rec = $old_rec;
1122    
1123            warn "## lookup returns = ", dump(@out), $/ if ($debug);
1124    
1125            if ($#out == 0) {
1126                    return $out[0];
1127          } else {          } else {
1128                  return $lookup->{$k};                  return @out;
1129          }          }
1130  }  }
1131    
1132    =head2 save_into_lookup
1133    
1134    Save value into lookup. It associates current database, input
1135    and specific keys with one or more values which will be
1136    associated over MFN.
1137    
1138    MFN will be extracted from first occurence current of field 000
1139    in current record, or if it doesn't exist from L<_set_config> C<_mfn>.
1140    
1141      my $nr = save_into_lookup($database,$input,$key,sub {
1142            # code which produce one or more values
1143      });
1144    
1145    It returns number of items saved.
1146    
1147    This function shouldn't be called directly, it's called from code created by
1148    L<WebPAC::Parser>.
1149    
1150    =cut
1151    
1152    sub save_into_lookup {
1153            my ($database,$input,$key,$coderef) = @_;
1154            die "save_into_lookup needs database" unless defined($database);
1155            die "save_into_lookup needs input" unless defined($input);
1156            die "save_into_lookup needs key" unless defined($key);
1157            die "save_into_lookup needs CODE" unless ( defined($coderef) && ref($coderef) eq 'CODE' );
1158    
1159            warn "## save_into_lookup rec = ", dump($rec), " config = ", dump($config), $/ if ($debug > 2);
1160    
1161            my $mfn =
1162                    defined($rec->{'000'}->[0])     ?       $rec->{'000'}->[0]      :
1163                    defined($config->{_mfn})        ?       $config->{_mfn}         :
1164                                                                                    die "mfn not defined or zero";
1165    
1166            my $nr = 0;
1167    
1168            foreach my $v ( $coderef->() ) {
1169                    $lookup->{$database}->{$input}->{$key}->{$v}->{$mfn}++;
1170                    warn "# saved lookup $database/$input/$key [$v] $mfn\n" if ($debug > 1);
1171                    $nr++;
1172            }
1173    
1174            return $nr;
1175    }
1176    
1177  =head2 config  =head2 config
1178    
1179  Consult config values stored in C<config.yml>  Consult config values stored in C<config.yml>
# Line 997  sub split_rec_on { Line 1298  sub split_rec_on {
1298          }          }
1299  }  }
1300    
1301    my $hash;
1302    
1303    =head2 set
1304    
1305      set( key => 'value' );
1306    
1307    =cut
1308    
1309    sub set {
1310            my ($k,$v) = @_;
1311            warn "## set ( $k => ", dump($v), " )", $/ if ( $debug );
1312            $hash->{$k} = $v;
1313    };
1314    
1315    =head2 get
1316    
1317      get( 'key' );
1318    
1319    =cut
1320    
1321    sub get {
1322            my $k = shift || return;
1323            my $v = $hash->{$k};
1324            warn "## get $k = ", dump( $v ), $/ if ( $debug );
1325            return $v;
1326    }
1327    
1328    =head2 count
1329    
1330      if ( count( @result ) == 1 ) {
1331            # do something if only 1 result is there
1332      }
1333    
1334    =cut
1335    
1336    sub count {
1337            warn "## count ",dump(@_),$/ if ( $debug );
1338            return @_ . '';
1339    }
1340    
1341  # END  # END
1342  1;  1;

Legend:
Removed from v.604  
changed lines
  Added in v.813

  ViewVC Help
Powered by ViewVC 1.1.26