/[webpac2]/trunk/lib/WebPAC/Input/ISIS.pm
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/lib/WebPAC/Input/ISIS.pm

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 10 by dpavlin, Sat Jul 16 20:35:30 2005 UTC revision 286 by dpavlin, Sun Dec 18 21:06:46 2005 UTC
# Line 3  package WebPAC::Input::ISIS; Line 3  package WebPAC::Input::ISIS;
3  use warnings;  use warnings;
4  use strict;  use strict;
5    
6  use WebPAC::Common;  require Exporter;
7  use base qw/WebPAC::Input WebPAC::Common/;  use vars qw/@ISA @EXPORT/;
8  use Text::Iconv;  @ISA = qw/Exporter/;
9    @EXPORT = qw/init open_db fetch_rec/;
10    
11    use blib;
12    use WebPAC::Input;
13    #use base qw/WebPAC::Input/;
14    
15  =head1 NAME  =head1 NAME
16    
17  WebPAC::Input::ISIS - support for CDS/ISIS source files  WebPAC::Input::ISIS - support for CDS/ISIS database files
18    
19  =head1 VERSION  =head1 VERSION
20    
21  Version 0.01  Version 0.03
22    
23  =cut  =cut
24    
25  our $VERSION = '0.01';  our $VERSION = '0.03';
26    
27    
 # auto-configure  
   
 my ($have_biblio_isis, $have_openisis) = (0,0);  
   
 eval "use Biblio::Isis 0.13;";  
 unless ($@) {  
         $have_biblio_isis = 1  
 } else {  
         eval "use OpenIsis;";  
         $have_openisis = 1 unless ($@);  
 }  
   
28  =head1 SYNOPSIS  =head1 SYNOPSIS
29    
30  Open CDS/ISIS, WinISIS or IsisMarc database using Biblio::Isis or OpenIsis  Open CDS/ISIS, WinISIS or IsisMarc database using C<Biblio::Isis> or
31  module and read all records to memory.  C<OpenIsis> module and read all records to memory.
32    
33   my $isis = new WebPAC::Input::ISIS();   my $isis = new WebPAC::Input::ISIS();
34   $isis->open( filename => '/path/to/ISIS/ISIS' );   $isis->open( path => '/path/to/ISIS/ISIS' );
35    
36  =head1 FUNCTIONS  =head1 FUNCTIONS
37    
38  =head2 open  =head2 init
39    
40  This function will read whole database in memory and produce lookups.  Autoconfigure this module to use C<Biblio::Isis> or C<OpenIsis>.
41    
42   $isis->open(  =cut
         filename => '/data/ISIS/ISIS',  
         code_page => '852',  
         limit_mfn => 500,  
         start_mfn => 6000,  
         lookup => $lookup_obj,  
  );  
43    
44  By default, ISIS code page is assumed to be C<852>.  sub init {
45            my $self = shift;
46    
47  If optional parametar C<start_mfn> is set, this will be first MFN to read          eval "use Biblio::Isis 0.13;";
48  from database (so you can skip beginning of your database if you need to).          unless ($@) {
49                    $self->{have_biblio_isis} = 1
50            } else {
51                    eval "use OpenIsis;";
52                    $self->{have_openisis} = 1 unless ($@);
53            }
54    }
55    
56  If optional parametar C<limit_mfn> is set, it will read just 500 records  =head2 open_db
 from database in example above.  
57    
58  Returns number of last record read into memory (size of database, really).  Returns handle to database
59    
60      my $db = $open_db(
61            path => '/path/to/LIBRI'
62      }
63    
64  =cut  =cut
65    
66  sub open {  sub open_db {
67          my $self = shift;          my $self = shift;
68    
69          my $arg = {@_};          my $arg = {@_};
70    
71          my $log = $self->_get_logger();          my $log = $self->_get_logger();
72    
73          $log->logcroak("need filename") if (! $arg->{'filename'});          $log->info("opening ISIS database '$arg->{path}'");
         my $code_page = $arg->{'code_page'} || '852';  
74    
75          $log->logdie("can't find database ",$arg->{'filename'}) unless (glob($arg->{'filename'}.'.*'));          my ($isis_db,$db_size);
76    
77          # store data in object          if ($self->{have_openisis}) {
         $self->{'isis_filename'} = $arg->{'filename'};  
         $self->{'isis_code_page'} = $code_page;  
   
         #$self->{'isis_code_page'} = $code_page;  
   
         # create Text::Iconv object  
         my $cp = Text::Iconv->new($code_page,$self->{'code_page'});  
   
         $log->info("reading ISIS database '",$arg->{'filename'},"'");  
         $log->debug("isis code page: $code_page");  
   
         my ($isis_db,$maxmfn);  
   
         if ($have_openisis) {  
78                  $log->debug("using OpenIsis perl bindings");                  $log->debug("using OpenIsis perl bindings");
79                  $isis_db = OpenIsis::open($arg->{'filename'});                  $isis_db = OpenIsis::open($arg->{path});
80                  $maxmfn = OpenIsis::maxRowid( $isis_db ) || 1;                  $db_size = OpenIsis::maxRowid( $isis_db ) || 1;
81          } elsif ($have_biblio_isis) {          } elsif ($self->{have_biblio_isis}) {
82                  $log->debug("using Biblio::Isis");                  $log->debug("using Biblio::Isis");
83                  use Biblio::Isis;                  use Biblio::Isis;
84                  $isis_db = new Biblio::Isis(                  $isis_db = new Biblio::Isis(
85                          isisdb => $arg->{'filename'},                          isisdb => $arg->{path},
86                          include_deleted => 1,                          include_deleted => 1,
87                          hash_filter => sub {                          hash_filter => sub {
88                                  my $l = shift || return;                                  my $l = shift || return;
89                                  $l = $cp->convert($l);                                  $l = $self->{iconv}->convert($l) if ($self->{iconv});
90                                  return $l;                                  return $l;
91                          },                          },
92                  );                  ) or $log->logdie("can't find database $arg->{path}");
                 $maxmfn = $isis_db->count;  
93    
94                  unless ($maxmfn) {                  $db_size = $isis_db->count;
                         $log->logwarn("no records in database ", $arg->{'filename'}, ", skipping...");  
                         return;  
                 }  
95    
96          } else {          } else {
97                  $log->logdie("Can't find supported ISIS library for perl. I suggent that you install Bilbio::Isis from CPAN.");                  $log->logdie("Can't find supported ISIS library for perl. I suggent that you install Bilbio::Isis from CPAN.");
98          }          }
99    
100            return ($isis_db, $db_size);
         my $startmfn = 1;  
   
         if (my $s = $self->{'start_mfn'}) {  
                 $log->info("skipping to MFN $s");  
                 $startmfn = $s;  
         } else {  
                 $self->{'start_mfn'} = $startmfn;  
         }  
   
         $maxmfn = $startmfn + $self->{limit_mfn} if ($self->{limit_mfn});  
   
         $log->info("processing ",($maxmfn-$startmfn)." records using ",( $have_openisis ? 'OpenIsis' : 'Biblio::Isis'));  
   
   
         # read database  
         for (my $mfn = $startmfn; $mfn <= $maxmfn; $mfn++) {  
   
                 $log->debug("mfn: $mfn\n");  
   
                 my $rec;  
   
                 if ($have_openisis) {  
   
                         # read record using OpenIsis  
                         my $row = OpenIsis::read( $isis_db, $mfn );  
                         foreach my $k (keys %{$row}) {  
                                 if ($k ne "mfn") {  
                                         foreach my $l (@{$row->{$k}}) {  
                                                 $l = $cp->convert($l);  
                                                 # has subfields?  
                                                 my $val;  
                                                 if ($l =~ m/\^/) {  
                                                         foreach my $t (split(/\^/,$l)) {  
                                                                 next if (! $t);  
                                                                 $val->{substr($t,0,1)} = substr($t,1);  
                                                         }  
                                                 } else {  
                                                         $val = $l;  
                                                 }  
   
                                                 push @{$rec->{$k}}, $val;  
                                         }  
                                 } else {  
                                         push @{$rec->{'000'}}, $mfn;  
                                 }  
                         }  
   
                 } elsif ($have_biblio_isis) {  
                         $rec = $isis_db->to_hash($mfn);  
                 } else {  
                         $log->logdie("hum? implementation missing?");  
                 }  
   
                 $log->confess("record $mfn empty?") unless ($rec);  
   
                 # store  
                 if ($self->{'low_mem'}) {  
                         $self->{'db'}->put($mfn, $rec);  
                 } else {  
                         $self->{'data'}->{$mfn} = $rec;  
                 }  
   
                 # create lookup  
                 $self->{'lookup'}->add( $rec ) if ($self->{'lookup'} && can($self->{'lookup'}->add));  
   
                 $self->progress_bar($mfn,$maxmfn);  
   
         }  
   
         $self->{'current_mfn'} = -1;  
         $self->{'last_pcnt'} = 0;  
   
         $log->debug("max mfn: $maxmfn");  
   
         # store max mfn and return it.  
         return $self->{'max_mfn'} = $maxmfn;  
101  }  }
102    
103  =head2 fetch  =head2 fetch_rec
104    
105  Fetch next record from database. It will also displays progress bar.  Return record with ID C<$mfn> from database
106    
107   my $rec = $isis->fetch;    my $rec = $self->fetch_rec( $db, $mfn );
108    
 Record from this function should probably go to C<data_structure> for  
 normalisation.  
   
 =cut  
   
 sub fetch {  
         my $self = shift;  
   
         my $log = $self->_get_logger();  
   
         $log->logconfess("it seems that you didn't load database!") unless ($self->{'current_mfn'});  
   
         if ($self->{'current_mfn'} == -1) {  
                 $self->{'current_mfn'} = $self->{'start_mfn'};  
         } else {  
                 $self->{'current_mfn'}++;  
         }  
   
         my $mfn = $self->{'current_mfn'};  
   
         if ($mfn > $self->{'max_mfn'}) {  
                 $self->{'current_mfn'} = $self->{'max_mfn'};  
                 $log->debug("at EOF");  
                 return;  
         }  
   
         $self->progress_bar($mfn,$self->{'max_mfn'});  
   
         if ($self->{'low_mem'}) {  
                 return $self->{'db'}->get($mfn);  
         } else {  
                 return $self->{'data'}->{$mfn};  
         }  
 }  
   
 =head2 pos  
   
 Returns current record number (MFN).  
   
  print $isis->pos;  
   
 First record in database has position 1.  
   
 =cut  
   
 sub pos {  
         my $self = shift;  
         return $self->{'current_mfn'};  
109  }  }
110    
   
 =head2 size  
   
 Returns number of records in database  
   
  print $isis->size;  
   
111  =cut  =cut
112    
113  sub size {  sub fetch_rec {
114          my $self = shift;          my $self = shift;
         return $self->{'max_mfn'};  
 }  
115    
116  =head2 seek          my ($isis_db, $mfn) = @_;
117    
118  Seek to specified MFN in file.          my $rec;
119    
120   $isis->seek(42);          if ($self->{have_openisis}) {
121    
122  First record in database has position 1.                  # read record using OpenIsis
123                    my $row = OpenIsis::read( $isis_db, $mfn );
124    
125  =cut                  # convert record to hash
126                    foreach my $k (keys %{$row}) {
127  sub seek {                          if ($k ne "mfn") {
128          my $self = shift;                                  foreach my $l (@{$row->{$k}}) {
129          my $pos = shift || return;                                          $l = $self->{iconv}->convert($l) if ($self->{iconv});
130                                            # has subfields?
131          my $log = $self->_get_logger();                                          my $val;
132                                            if ($l =~ m/\^/) {
133                                                    foreach my $t (split(/\^/,$l)) {
134                                                            next if (! $t);
135                                                            $val->{substr($t,0,1)} = substr($t,1);
136                                                    }
137                                            } else {
138                                                    $val = $l;
139                                            }
140                                            push @{$rec->{$k}}, $val;
141                                    }
142                            } else {
143                                    push @{$rec->{'000'}}, $mfn;
144                            }
145                    }
146    
147          if ($pos < 1) {          } elsif ($self->{have_biblio_isis}) {
148                  $log->warn("seek before first record");                  $rec = $isis_db->to_hash($mfn);
149                  $pos = 1;          } else {
150          } elsif ($pos > $self->{'max_mfn'}) {                  $self->_get_logger()->logdie("hum? implementation missing?");
                 $log->warn("seek beyond last record");  
                 $pos = $self->{'max_mfn'};  
151          }          }
152    
153          return $self->{'current_mfn'} = (($pos - 1) || -1);          return $rec;
154  }  }
155    
156  =head1 AUTHOR  =head1 AUTHOR

Legend:
Removed from v.10  
changed lines
  Added in v.286

  ViewVC Help
Powered by ViewVC 1.1.26