/[webpac2]/branches/Sack/lib/WebPAC/Input/ISI.pm
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /branches/Sack/lib/WebPAC/Input/ISI.pm

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 898 by dpavlin, Wed Oct 10 19:01:55 2007 UTC revision 1077 by dpavlin, Wed Nov 28 22:52:01 2007 UTC
# Line 6  use strict; Line 6  use strict;
6  use WebPAC::Input;  use WebPAC::Input;
7  use base qw/WebPAC::Common/;  use base qw/WebPAC::Common/;
8    
9    use Data::Dump qw/dump/;
10    
11  =head1 NAME  =head1 NAME
12    
13  WebPAC::Input::ISI - support for ISI Export Format  WebPAC::Input::ISI - support for ISI Export Format
14    
15  =head1 VERSION  =head1 VERSION
16    
17  Version 0.00  Version 0.02
18    
19  =cut  =cut
20    
21  our $VERSION = '0.00';  our $VERSION = '0.02';
   
22    
23  =head1 SYNOPSIS  =head1 SYNOPSIS
24    
# Line 54  path to ISI export file Line 55  path to ISI export file
55    
56  =cut  =cut
57    
58    my $subfields = {
59            'CR' => sub {
60                    my @v = split(/, /, shift);
61                    my $f;
62                    foreach ( qw/author year reference volume page/ ) {
63                            if ( my $tmp = shift @v ) {
64                                    $f->{$_} = $tmp;
65                            }
66                    }
67                    if ( $f->{author} =~ /^\*(.+)/ ) {
68                            delete $f->{author};
69                            $f->{institution} = $1;
70                    }
71                    return $f;
72            },
73    };
74    
75  sub new {  sub new {
76          my $class = shift;          my $class = shift;
77          my $self = {@_};          my $self = {@_};
# Line 85  sub new { Line 103  sub new {
103    
104          $log->info("opening $format $version database '$arg->{path}'");          $log->info("opening $format $version database '$arg->{path}'");
105    
106            my $tag;
107            my $rec;
108    
109            $self->{size} = 0;
110    
111            while( $line = <$fh> ) {
112                    chomp($line);
113    
114                    my $v;
115    
116                    if ( $line =~ /^(\S\S)\s(.+)$/ ) {
117                                    $tag = $1;
118                                    $v = $2;
119                    } elsif ( $line =~ /^\s{3}(.+)$/ ) {
120                                    $v = $1;
121                    } elsif ( $line eq 'ER' ) {
122                            # join tags
123                            foreach ( qw/AB DE ID TI/ ) {
124                                    $rec->{$_} = join(' ', @{ $rec->{$_} }) if defined $rec->{$_};
125                            }
126                            $rec->{'000'} = [ ++$self->{size} ];
127                            push @{ $self->{_rec} }, $rec;
128                            $rec = {};
129                            $line = <$fh>;
130                            chomp $line;
131                            $log->logdie("expected blank like in ",$arg->{path}, " +$.: $line") unless ( $line eq '' );
132                    } elsif ( $line eq 'EF' ) {
133                            last;
134                    } else {
135                            $log->logdie("can't parse +$. $arg->{path} : $line");
136                    }
137    
138                    if ( defined $v ) {
139                            $v = $subfields->{$tag}->($v) if defined $subfields->{$tag};
140    
141                            $log->debug("$tag: ", sub { dump( $v ) });
142                            push @{ $rec->{$tag} }, $v;
143                    }
144    
145            }
146    
147            $log->debug("loaded ", $self->size, " records");
148    
149          $self ? return $self : return undef;          $self ? return $self : return undef;
150  }  }
151    
# Line 92  sub new { Line 153  sub new {
153    
154  Return record with ID C<$mfn> from database  Return record with ID C<$mfn> from database
155    
156    my $rec = $input->fetch_rec( $mfn, $filter_coderef);    my $rec = $input->fetch_rec( $mfn, $filter_coderef );
157    
158  =cut  =cut
159    
160  sub fetch_rec {  sub fetch_rec {
161          my $self = shift;          my $self = shift;
162    
163          my ($mfn, $filter_coderef) = @_;          my ( $mfn, $filter_coderef ) = @_;
   
         my $rec;  
164    
165          return $rec;          return $self->{_rec}->[$mfn-1];
166  }  }
167    
168    
# Line 117  Return number of records in database Line 176  Return number of records in database
176    
177  sub size {  sub size {
178          my $self = shift;          my $self = shift;
179          return 2;          return $self->{size};
180  }  }
181    
182    =head1 SEE ALSO
183    
184    L<http://isibasic.com/help/helpprn.html> is only sane source of document format which Google could find...
185    
186  =head1 AUTHOR  =head1 AUTHOR
187    
188  Dobrica Pavlinusic, C<< <dpavlin@rot13.org> >>  Dobrica Pavlinusic, C<< <dpavlin@rot13.org> >>

Legend:
Removed from v.898  
changed lines
  Added in v.1077

  ViewVC Help
Powered by ViewVC 1.1.26