/[Search-Estraier]/trunk/lib/Search/Estraier.pm
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/lib/Search/Estraier.pm

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 108 by dpavlin, Sun Feb 19 17:13:57 2006 UTC revision 128 by dpavlin, Mon May 8 12:00:43 2006 UTC
# Line 4  use 5.008; Line 4  use 5.008;
4  use strict;  use strict;
5  use warnings;  use warnings;
6    
7  our $VERSION = '0.04_2';  our $VERSION = '0.06_1';
8    
9  =head1 NAME  =head1 NAME
10    
# Line 599  sub options { Line 599  sub options {
599  }  }
600    
601    
602    =head2 set_skip
603    
604    Set number of skipped documents from beginning of results
605    
606      $cond->set_skip(42);
607    
608    Similar to C<offset> in RDBMS.
609    
610    =cut
611    
612    sub set_skip {
613            my $self = shift;
614            $self->{skip} = shift;
615    }
616    
617    =head2 skip
618    
619    Return skip for this condition.
620    
621      print $cond->skip;
622    
623    =cut
624    
625    sub skip {
626            my $self = shift;
627            return $self->{skip};
628    }
629    
630    
631  package Search::Estraier::ResultDocument;  package Search::Estraier::ResultDocument;
632    
633  use Carp qw/croak/;  use Carp qw/croak/;
# Line 874  sub new { Line 903  sub new {
903          my $self = {          my $self = {
904                  pxport => -1,                  pxport => -1,
905                  timeout => 0,   # this used to be -1                  timeout => 0,   # this used to be -1
                 dnum => -1,  
                 wnum => -1,  
                 size => -1.0,  
906                  wwidth => 480,                  wwidth => 480,
907                  hwidth => 96,                  hwidth => 96,
908                  awidth => 96,                  awidth => 96,
909                  status => -1,                  status => -1,
910          };          };
911    
912          bless($self, $class);          bless($self, $class);
913    
914          if ($#_ == 0) {          if ($#_ == 0) {
# Line 894  sub new { Line 921  sub new {
921                  warn "## Node debug on\n" if ($self->{debug});                  warn "## Node debug on\n" if ($self->{debug});
922          }          }
923    
924            $self->{inform} = {
925                    dnum => -1,
926                    wnum => -1,
927                    size => -1.0,
928            };
929    
930          $self ? return $self : return undef;          $self ? return $self : return undef;
931  }  }
932    
# Line 1270  sub _fetch_doc { Line 1303  sub _fetch_doc {
1303    
1304  sub name {  sub name {
1305          my $self = shift;          my $self = shift;
1306          $self->_set_info unless ($self->{name});          $self->_set_info unless ($self->{inform}->{name});
1307          return $self->{name};          return $self->{inform}->{name};
1308  }  }
1309    
1310    
# Line 1283  sub name { Line 1316  sub name {
1316    
1317  sub label {  sub label {
1318          my $self = shift;          my $self = shift;
1319          $self->_set_info unless ($self->{label});          $self->_set_info unless ($self->{inform}->{label});
1320          return $self->{label};          return $self->{inform}->{label};
1321  }  }
1322    
1323    
# Line 1296  sub label { Line 1329  sub label {
1329    
1330  sub doc_num {  sub doc_num {
1331          my $self = shift;          my $self = shift;
1332          $self->_set_info if ($self->{dnum} < 0);          $self->_set_info if ($self->{inform}->{dnum} < 0);
1333          return $self->{dnum};          return $self->{inform}->{dnum};
1334  }  }
1335    
1336    
# Line 1309  sub doc_num { Line 1342  sub doc_num {
1342    
1343  sub word_num {  sub word_num {
1344          my $self = shift;          my $self = shift;
1345          $self->_set_info if ($self->{wnum} < 0);          $self->_set_info if ($self->{inform}->{wnum} < 0);
1346          return $self->{wnum};          return $self->{inform}->{wnum};
1347  }  }
1348    
1349    
# Line 1322  sub word_num { Line 1355  sub word_num {
1355    
1356  sub size {  sub size {
1357          my $self = shift;          my $self = shift;
1358          $self->_set_info if ($self->{size} < 0);          $self->_set_info if ($self->{inform}->{size} < 0);
1359          return $self->{size};          return $self->{inform}->{size};
1360  }  }
1361    
1362    
# Line 1356  sub search { Line 1389  sub search {
1389          );          );
1390          return if ($rv != 200);          return if ($rv != 200);
1391    
1392          my (@docs, $hints);          my @records     = split /--------\[.*?\]--------(?::END)?\r?\n/, $resbody;
1393            my $hintsText   = splice @records, 0, 2; # starts with empty record
1394          my @lines = split(/\n/, $resbody);          my $hints               = { $hintsText =~ m/^(.*?)\t(.*?)$/gsm };
1395          return unless (@lines);  
1396            # process records
1397          my $border = $lines[0];          my $docs = [];
1398          my $isend = 0;          foreach my $record (@records)
1399          my $lnum = 1;          {
1400                    # split into keys and snippets
1401          while ( $lnum <= $#lines ) {                  my ($keys, $snippet) = $record =~ m/^(.*?)\n\n(.*?)$/s;
1402                  my $line = $lines[$lnum];  
1403                  $lnum++;                  # create document hash
1404                    my $doc                         = { $keys =~ m/^(.*?)=(.*?)$/gsm };
1405                  #warn "## $line\n";                  $doc->{'@keywords'}     = $doc->{keywords};
1406                  if ($line && $line =~ m/^\Q$border\E(:END)*$/) {                  ($doc->{keywords})      = $keys =~ m/^%VECTOR\t(.*?)$/gm;
1407                          $isend = $1;                  $doc->{snippet}         = $snippet;
1408                          last;  
1409                  }                  push @$docs, new Search::Estraier::ResultDocument(
1410                            attrs           => $doc,
1411                  if ($line =~ /\t/) {                          uri             => $doc->{'@uri'},
1412                          my ($k,$v) = split(/\t/, $line, 2);                          snippet         => $snippet,
1413                          $hints->{$k} = $v;                          keywords        => $doc->{'keywords'},
1414                  }                  );
1415          }          }
1416    
1417          my $snum = $lnum;          return new Search::Estraier::NodeResult( docs => $docs, hints => $hints );
   
         while( ! $isend && $lnum <= $#lines ) {  
                 my $line = $lines[$lnum];  
                 #warn "# $lnum: $line\n";  
                 $lnum++;  
   
                 if ($line && $line =~ m/^\Q$border\E/) {  
                         if ($lnum > $snum) {  
                                 my $rdattrs;  
                                 my $rdvector;  
                                 my $rdsnippet;  
                                   
                                 my $rlnum = $snum;  
                                 while ($rlnum < $lnum - 1 ) {  
                                         #my $rdline = $self->_s($lines[$rlnum]);  
                                         my $rdline = $lines[$rlnum];  
                                         $rlnum++;  
                                         last unless ($rdline);  
                                         if ($rdline =~ /^%/) {  
                                                 $rdvector = $1 if ($rdline =~ /^%VECTOR\t(.+)$/);  
                                         } elsif($rdline =~ /=/) {  
                                                 $rdattrs->{$1} = $2 if ($rdline =~ /^(.+)=(.+)$/);  
                                         } else {  
                                                 confess "invalid format of response";  
                                         }  
                                 }  
                                 while($rlnum < $lnum - 1) {  
                                         my $rdline = $lines[$rlnum];  
                                         $rlnum++;  
                                         $rdsnippet .= "$rdline\n";  
                                 }  
                                 #warn Dumper($rdvector, $rdattrs, $rdsnippet);  
                                 if (my $rduri = $rdattrs->{'@uri'}) {  
                                         push @docs, new Search::Estraier::ResultDocument(  
                                                 uri => $rduri,  
                                                 attrs => $rdattrs,  
                                                 snippet => $rdsnippet,  
                                                 keywords => $rdvector,  
                                         );  
                                 }  
                         }  
                         $snum = $lnum;  
                         #warn "### $line\n";  
                         $isend = 1 if ($line =~ /:END$/);  
                 }  
   
         }  
   
         if (! $isend) {  
                 warn "received result doesn't have :END\n$resbody";  
                 return;  
         }  
   
         #warn Dumper(\@docs, $hints);  
   
         return new Search::Estraier::NodeResult( docs => \@docs, hints => $hints );  
1418  }  }
1419    
1420    
# Line 1486  sub cond_to_query { Line 1463  sub cond_to_query {
1463          push @args, 'wwidth=' . $self->{wwidth};          push @args, 'wwidth=' . $self->{wwidth};
1464          push @args, 'hwidth=' . $self->{hwidth};          push @args, 'hwidth=' . $self->{hwidth};
1465          push @args, 'awidth=' . $self->{awidth};          push @args, 'awidth=' . $self->{awidth};
1466            push @args, 'skip=' . $self->{skip} if ($self->{skip});
1467    
1468          return join('&', @args);          return join('&', @args);
1469  }  }
# Line 1680  Return array of users with admin rights Line 1658  Return array of users with admin rights
1658    
1659  sub admins {  sub admins {
1660          my $self = shift;          my $self = shift;
1661          $self->_set_info unless ($self->{name});          $self->_set_info unless ($self->{inform}->{name});
1662          return $self->{admins};          return $self->{inform}->{admins};
1663  }  }
1664    
1665  =head2 guests  =head2 guests
# Line 1694  Return array of users with guest rights Line 1672  Return array of users with guest rights
1672    
1673  sub guests {  sub guests {
1674          my $self = shift;          my $self = shift;
1675          $self->_set_info unless ($self->{name});          $self->_set_info unless ($self->{inform}->{name});
1676          return $self->{guests};          return $self->{inform}->{guests};
1677  }  }
1678    
1679  =head2 links  =head2 links
# Line 1708  Return array of links for this node Line 1686  Return array of links for this node
1686    
1687  sub links {  sub links {
1688          my $self = shift;          my $self = shift;
1689          $self->_set_info unless ($self->{name});          $self->_set_info unless ($self->{inform}->{name});
1690          return $self->{links};          return $self->{inform}->{links};
1691  }  }
1692    
1693    
# Line 1741  sub _set_info { Line 1719  sub _set_info {
1719          return if ($rv != 200 || !$resbody);          return if ($rv != 200 || !$resbody);
1720    
1721          my @lines = split(/[\r\n]/,$resbody);          my @lines = split(/[\r\n]/,$resbody);
1722            
1723          ( $self->{name}, $self->{label}, $self->{dnum}, $self->{wnum}, $self->{size} ) =          $self->{inform} = {};
1724                  split(/\t/, shift @lines, 5);  
1725            ( $self->{inform}->{name}, $self->{inform}->{label}, $self->{inform}->{dnum},
1726                    $self->{inform}->{wnum}, $self->{inform}->{size} ) = split(/\t/, shift @lines, 5);
1727    
1728          return $resbody unless (@lines);          return $resbody unless (@lines);
1729    
1730          shift @lines;          shift @lines;
1731    
1732          while(my $admin = shift @lines) {          while(my $admin = shift @lines) {
1733                  push @{$self->{admins}}, $admin;                  push @{$self->{inform}->{admins}}, $admin;
1734          }          }
1735            
1736          while(my $guest = shift @lines) {          while(my $guest = shift @lines) {
1737                  push @{$self->{guests}}, $guest;                  push @{$self->{inform}->{guests}}, $guest;
1738          }          }
1739    
1740          while(my $link = shift @lines) {          while(my $link = shift @lines) {
1741                  push @{$self->{links}}, $link;                  push @{$self->{inform}->{links}}, $link;
1742          }          }
1743    
1744          return $resbody;          return $resbody;
# Line 1781  Hyper Estraier Ruby interface on which t Line 1761  Hyper Estraier Ruby interface on which t
1761    
1762  Dobrica Pavlinusic, E<lt>dpavlin@rot13.orgE<gt>  Dobrica Pavlinusic, E<lt>dpavlin@rot13.orgE<gt>
1763    
1764    Robert Klep E<lt>robert@klep.nameE<gt> contributed refactored search code
1765    
1766  =head1 COPYRIGHT AND LICENSE  =head1 COPYRIGHT AND LICENSE
1767    

Legend:
Removed from v.108  
changed lines
  Added in v.128

  ViewVC Help
Powered by ViewVC 1.1.26