/[Search-Estraier]/trunk/Estraier.pm
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/Estraier.pm

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 24 by dpavlin, Thu Jan 5 14:33:05 2006 UTC revision 39 by dpavlin, Thu Jan 5 22:36:10 2006 UTC
# Line 580  sub keywords { Line 580  sub keywords {
580  }  }
581    
582    
583  package Search::Estraier::Master;  package Search::Estraier::NodeResult;
584    
585  use Carp;  use Carp qw/croak/;
586    
587  =head1 Search::Estraier::Master  #use Search::Estraier;
588    #our @ISA = qw/Search::Estraier/;
589    
590  Controll node master. This requires user with administration priviledges.  =head1 Search::Estraier::NodeResult
591    
592    =head2 new
593    
594      my $res = new Search::HyperEstraier::NodeResult(
595            docs => @array_of_rdocs,
596            hits => %hash_with_hints,
597      );
598    
599  =cut  =cut
600    
601  {  sub new {
602          package RequestAgent;          my $class = shift;
603          our @ISA = qw(LWP::UserAgent);          my $self = {@_};
604            bless($self, $class);
605    
606          sub new {          foreach my $f (qw/docs hints/) {
607                  my $self = LWP::UserAgent::new(@_);                  croak "missing $f for ResultDocument" unless defined($self->{$f});
                 $self->agent("Search-Estraier/$Search::Estraer::VERSION");  
                 $self;  
608          }          }
609    
610          sub get_basic_credentials {          $self ? return $self : return undef;
                 my($self, $realm, $uri) = @_;  
 #               return ($user, $password);  
         }  
611  }  }
612    
613    =head2 doc_num
614    
615    Return number of documents
616    
617  =head2 new    print $res->doc_num;
618    
619  Create new connection to node master.  =cut
620    
621    my $master = new Search::Estraier::Master(  sub doc_num {
622          url => 'http://localhost:1978',          my $self = shift;
623          user => 'admin',          return $#{$self->{docs}};
624          passwd => 'admin',  }
625    );  
626    =head2 get_doc
627    
628    Return single document
629    
630      my $doc = $res->get_doc( 42 );
631    
632    Returns undef if document doesn't exist.
633    
634    =cut
635    
636    sub get_doc {
637            my $self = shift;
638            my $num = shift;
639            croak "expect number as argument" unless ($num =~ m/^\d+$/);
640            return undef if ($num < 0 || $num > $self->{docs});
641            return $self->{docs}->[$num];
642    }
643    
644    =head2 hint
645    
646    Return specific hint from results.
647    
648      print $rec->hint( 'VERSION' );
649    
650    Possible hints are: C<VERSION>, C<NODE>, C<HIT>, C<HINT#n>, C<DOCNUM>, C<WORDNUM>,
651    C<TIME>, C<LINK#n>, C<VIEW>.
652    
653    =cut
654    
655    sub hint {
656            my $self = shift;
657            my $key = shift || return;
658            return $self->{hints}->{$key};
659    }
660    
661    
662    package Search::Estraier::Node;
663    
664    use Carp qw/carp croak/;
665    use URI;
666    use MIME::Base64;
667    use IO::Socket::INET;
668    
669    =head1 Search::Estraier::Node
670    
671    =head2 new
672    
673      my $node = new Search::HyperEstraier::Node;
674    
675  =cut  =cut
676    
677  sub new {  sub new {
678          my $class = shift;          my $class = shift;
679          my $self = {@_};          my $self = {
680                    pxport => -1,
681                    timeout => 0,   # this used to be -1
682                    dnum => -1,
683                    wnum => -1,
684                    size => -1.0,
685                    wwidth => 480,
686                    hwidth => 96,
687                    awidth => 96,
688                    status => -1,
689            };
690          bless($self, $class);          bless($self, $class);
691    
692          foreach my $p (qw/url user passwd/) {          if (@_) {
693                  croak "need $p" unless ($self->{$p});                  $self->{debug} = 1;
694                    warn "## Node debug on\n";
695          }          }
696    
697          $self ? return $self : return undef;          $self ? return $self : return undef;
698  }  }
699    
700    =head2 set_url
701    
702    Specify URL to node server
703    
704      $node->set_url('http://localhost:1978');
705    
706    =cut
707    
708    sub set_url {
709            my $self = shift;
710            $self->{url} = shift;
711    }
712    
713    =head2 set_proxy
714    
715    Specify proxy server to connect to node server
716    
717      $node->set_proxy('proxy.example.com', 8080);
718    
719    =cut
720    
721    sub set_proxy {
722            my $self = shift;
723            my ($host,$port) = @_;
724            croak "proxy port must be number" unless ($port =~ m/^\d+$/);
725            $self->{pxhost} = $host;
726            $self->{pxport} = $port;
727    }
728    
729    =head2 set_timeout
730    
731    Specify timeout of connection in seconds
732    
733      $node->set_timeout( 15 );
734    
735    =cut
736    
737    sub set_timeout {
738            my $self = shift;
739            my $sec = shift;
740            croak "timeout must be number" unless ($sec =~ m/^\d+$/);
741            $self->{timeout} = $sec;
742    }
743    
744    =head2 set_auth
745    
746    Specify name and password for authentication to node server.
747    
748      $node->set_auth('clint','eastwood');
749    
750    =cut
751    
752    sub set_auth {
753            my $self = shift;
754            my ($login,$passwd) = @_;
755            $self->{auth} = encode_base64( "$login:$passwd" );
756    }
757    
758    =head2 status
759    
760    Return status code of last request.
761    
762      print $res->status;
763    
764    C<-1> means connection failure.
765    
766    =cut
767    
768    sub status {
769            my $self = shift;
770            return $self->{status};
771    }
772    
773    =head2 shuttle_url
774    
775    This is method which uses C<IO::Socket::INET> to communicate with Hyper Estraier node
776    master.
777    
778      my $rv = shuttle_url( $url, $content_type, \$req_body, \$resbody );
779    
780    C<$resheads> and C<$resbody> booleans controll if response headers and/or response
781    body will be saved within object.
782    
783    =cut
784    
785    sub shuttle_url {
786            my $self = shift;
787    
788            my ($url, $content_type, $reqbody, $resbody) = @_;
789    
790            my $status = -1;
791    
792            warn "## $url\n";
793    
794            $url = new URI($url);
795            if (
796                            !$url || !$url->scheme || !$url->scheme eq 'http' ||
797                            !$url->host || !$url->port || $url->port < 1
798                    ) {
799                    carp "can't parse $url\n";
800                    return -1;
801            }
802    
803            my ($host,$port,$query) = ($url->host, $url->port, $url->path);
804    
805            if ($self->{pxhost}) {
806                    ($host,$port) = ($self->{pxhost}, $self->{pxport});
807                    $query = "http://$host:$port/$query";
808            }
809    
810            $query .= '?' . $url->query if ($url->query && ! $reqbody);
811    
812            my $headers;
813    
814            if ($reqbody) {
815                    $headers .= "POST $query HTTP/1.0\r\n";
816            } else {
817                    $headers .= "GET $query HTTP/1.0\r\n";
818            }
819    
820            $headers .= "Host: $url->host:$url->port\r\n";
821            $headers .= "Connection: close\r\n";
822            $headers .= "User-Agent: Search-Estraier/$Search::Estraier::VERSION\r\n";
823            $headers .= "Content-Type $content_type\r\n";
824            $headers .= "Authorization: Basic $self->{auth}\r\n";
825            my $len = 0;
826            {
827                    use bytes;
828                    $len = length($reqbody) if ($reqbody);
829            }
830            $headers .= "Content-Length: $len\r\n";
831            $headers .= "\r\n";
832    
833            my $sock = IO::Socket::INET->new(
834                    PeerAddr        => $host,
835                    PeerPort        => $port,
836                    Proto           => 'tcp',
837                    Timeout         => $self->{timeout} || 90,
838            );
839    
840            if (! $sock) {
841                    carp "can't open socket to $host:$port";
842                    return -1;
843            }
844    
845            warn "## headers:\n$headers\n" if ($self->{debug});
846    
847            print $sock $headers or
848                    carp "can't send headers to network:\n$headers\n" and return -1;
849    
850            if ($reqbody) {
851                    warn "## request body:\n$headers\n" if ($self->{debug});
852                    print $sock $$reqbody or
853                            carp "can't send request body to network:\n$$reqbody\n" and return -1;
854            }
855    
856            my $line = <$sock>;
857            chomp($line);
858            my ($schema, $res_status, undef) = split(/  */, $line, 3);
859            return if ($schema !~ /^HTTP/ || ! $res_status);
860    
861            $status = $res_status;
862            warn "## response status: $res_status\n" if ($self->{debug});
863    
864            # skip rest of headers
865            $line = <$sock>;
866            while ($line) {
867                    $line = <$sock>;
868                    $line =~ s/[\r\n]+$//;
869                    warn "## ", $line || 'NULL', " ##\n";
870            };
871    
872            # read body
873            $len = 0;
874            do {
875                    $len = read($sock, my $buf, 8192);
876                    $$resbody .= $buf if ($resbody);
877            } while ($len);
878    
879            
880            warn "## response body:\n$$resbody\n" if ($self->{debug});
881    
882            return $status;
883    }
884    
885  ###  ###
886    

Legend:
Removed from v.24  
changed lines
  Added in v.39

  ViewVC Help
Powered by ViewVC 1.1.26