/[mws]/trunk/httpd.pl
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/httpd.pl

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 27 by dpavlin, Sat May 8 20:34:26 2004 UTC revision 52 by dpavlin, Tue May 25 18:55:46 2004 UTC
# Line 1  Line 1 
1  #!/usr/bin/perl  #!/usr/bin/perl
2    
3  # based on post  BEGIN {
4  # http://www.mail-archive.com/libwww@perl.org/msg04750.html          my $basedir = readlink($0) || $0; $basedir =~ s#/[^/]+$#/lib#;
5            unshift(@INC, $basedir);
6    }
7    
8    =head1 NAME
9    
10    httpd.pl - http server for Mail::Box Web Search
11    
12    =head1 SYNOPSYS
13    
14     httpd.pl [local.conf]
15    
16    =head1 DESCRIPTION
17    
18    This script implements user interface for Mail::Box Web Search as
19    a small single-user http server.
20    
21    =head1 SEE ALSO
22    
23    C<MWS> perl modules which are part of this package
24    C<MWS::HTTPD> module which implements the server itself
25    
26    =cut
27    
28  use strict;  use strict;
29  use warnings;  use warnings;
30  use HTTP::Daemon;  use MWS::SWISH;
31  use HTTP::Status;  #use MWS::Plucene;
32  use IO::String;  use HTTP::Daemon::Simple;
 use CGI::Lite;  
33  use Template;  use Template;
 use MWS;  
34  use URI::Escape;  use URI::Escape;
35    
36  use Data::Dumper;  use Data::Dumper;
# Line 28  be used. Line 48  be used.
48          exit 1;          exit 1;
49  }  }
50    
51  my $d = HTTP::Daemon->new( Reuse => 1, LocalPort => 6969 ) || die;  my $mws = MWS::SWISH->new(config_file => $config_file);
52  my $cgi = new CGI::Lite;  #my $mws = MWS::Plucene->new(config_file => $config_file, debug => $debug);
53  my $mws = MWS->new($config_file);  
54  my $tt = Template->new({  my $tt = Template->new({
55          INCLUDE_PATH => $mws->{config}->val('global', 'templates'),          INCLUDE_PATH => $mws->{config}->val('global', 'templates'),
56          FILTERS => {          FILTERS => {
57                  'body5' => \&body5_filter,                  'body5' => \&body5_filter,
58                    'body' => \&body_filter,
59          },          },
60          EVAL_PERL => 1,          EVAL_PERL => 1,
61  });  });
62    
63  my $static_html = $mws->{config}->val('global', 'static_html');  my $d = new HTTP::Daemon::Simple(
64            'listen' => $mws->{config}->val('global', 'listen'),
65            'static_html' => $mws->{config}->val('global', 'static_html'),
66            'debug' => $debug,
67    ) || die "can't create HTTP::Daemon::Simple: $!";
68    
69    
70  print "Web server ready at: ", $d->url, "\n";  print "Web server ready at: ", $d->url, "\n";
71    
72    $d->run_server( \&request );
73    
74  while ( my $c = $d->accept ) {  sub request($$) {
75          while ( my $r = $c->get_request ) {          my ($url,$param) = @_;
76    
77                  # environs that a webserver should set.          print Dumper($param,$mws->{counter}),"\n" if ($debug);
                 $ENV{'REQUEST_METHOD'}    = $r->method;  
                 $ENV{'GATEWAY_INTERFACE'} = "CGI/1.0";  
                 $ENV{'SERVER_PROTOCOL'}   = $r->protocol;  
                 $ENV{'CONTENT_TYPE'}      = $r->content_type;  
   
                 # this part is based on CGI::Lite  
   
                 $cgi->close_all_files();  
                 $cgi->{web_data}       = {};  
                 $cgi->{ordered_keys}   = [];  
                 $cgi->{all_handles}    = [];  
                 $cgi->{error_status}   = 0;  
                 $cgi->{error_message}  = undef;  
   
                 if ( $r->method eq 'GET' || $r->uri =~ /\?/ ) {  
                         my $query_string = $r->uri;  
                         $query_string =~ s/[^\?]+\?(.*)/$1/;  
                         $cgi->_decode_url_encoded_data (\$query_string, 'form');  
   
                 } elsif ( $r->method eq 'POST' ) {  
   
                         if ($r->content_type eq 'application/x-www-form-urlencoded') {  
 #                               local $^W = 0;  
                                 $cgi->_decode_url_encoded_data (\$r->content, 'form');  
                         } elsif ($r->content_type =~ /multipart\/form-data/) {  
                                 my ($boundary) = $r->content_type =~ /boundary=(\S+)$/;  
                                 $cgi->_parse_multipart_data ($r->content_length, $boundary);  
                         }  
                 } else {  
                          $c->send_error(RC_FORBIDDEN);  
                 }  
78    
79                  my $param = $cgi->{web_data};          # template file name (use ?format=html as default)
80                  my $url = $r->url->path;          my $tpl_file = 'master.';
81            $tpl_file .= $param->{'format'} || 'html';
82    
83                  # XXX LOG          # parse date from url
84                  print $r->method," ",$url,"\n",Dumper($param),"\n" if ($debug);          my ($yyyy,$mm,$dd) = $mws->yyyymmdd;
85    
86                  # is this static page?          my $yyyymm;
                 if ($static_html && -f "$static_html/$url") {  
                         print "static file: $static_html/$url\n" if ($debug);  
                         $c->send_file_response("$static_html/$url");  
                         $c->close;  
                         next;  
                 }  
87    
88                  # template file name (use ?format=html as default)          my $date_limit;
                 my $tpl_file = 'master.';  
                 $tpl_file .= $param->{'format'} || 'html';  
   
                 # parse date from url  
                 my ($yyyy,$mm,$dd) = $mws->yyyymmdd;  
   
                 my $yyyymm;  
   
                 my $date_limit;  
   
                 if ($url =~ m,^/(\d{4})[/-](\d+)[/-](\d+),) {  
                         ($yyyy, $mm, $dd) = $mws->fmtdate($1,$2,$3);  
                          $date_limit = "$yyyy-$mm-$dd";  
                 } elsif ($url =~ m,^/(\d{4})[/-](\d+),) {  
                         ($yyyy,$mm) = $mws->fmtdate($1,$2);  
                         $date_limit = "$yyyy-$mm";  
                 } elsif ($url =~ m,^/(\d{4}),) {  
                         $date_limit = $mws->fmtdate($1);  
                 }  
89    
90                  #          if ($url =~ m,^/(\d{4})[/-](\d+)[/-](\d+),) {
91                  # implement functionality and generate HTML                  ($yyyy, $mm, $dd) = $mws->fmtdate($1,$2,$3);
92                  #                   $date_limit = "$yyyy-$mm-$dd";
93                  my $html;          } elsif ($url =~ m,^/(\d{4})[/-](\d+),) {
94                    ($yyyy,$mm) = $mws->fmtdate($1,$2);
95                  if ($param->{'search_val'} && $param->{'search_fld'} && !$param->{'search'}) {                  $date_limit = "$yyyy-$mm";
96                          $param->{'search'} = $param->{'search_fld'}.":".$param->{'search_val'};          } elsif ($url =~ m,^/(\d{4}),) {
97                  } elsif ($param->{'search'}) {                  $date_limit = $mws->fmtdate($1);
98                          ($param->{'search_fld'}, $param->{'search_val'}) = split(/:/,$param->{'search'},2);          }
                 }  
99    
100                  my $tpl_var = {          #
101                          param   => $param,          # implement functionality and generate HTML
102                          yyyy    => $yyyy,          #
103                          mm      => $mm,          my $html;
104                          dd      => $dd,  
105                          date_limit => $date_limit,          if ($param->{'search_val'} && $param->{'search_fld'} && !$param->{'search'}) {
106                  };                  $param->{'search'} = $param->{'search_fld'}.":".$param->{'search_val'};
107            } elsif ($param->{'search'}) {
108                  # is this access to root of web server?                  ($param->{'search_fld'}, $param->{'search_val'}) = split(/:/,$param->{'search'},2);
109                  if ($url eq "/" && !$param->{'search'}) {          }
                         # if first access, go to current year  
                         $date_limit = $mws->fmtdate($yyyy);  
                         $param->{sort} = "date desc";  
                 }  
110    
111                  # ?show_id=XXXXxxxx___message_id___xxxxXXXX          my $tpl_var = {
112                  if ($param->{'show_id'}) {                  param   => $param,
113                    yyyy    => $yyyy,
114                    mm      => $mm,
115                    dd      => $dd,
116                    date_limit => $date_limit,
117            };
118    
119            # is this access to root of web server?
120            if ($url eq "/" && !$param->{'search'}) {
121                    # if first access, go to current year
122                    $date_limit = $mws->fmtdate($yyyy);
123                    $param->{sort_by} = "date desc";
124            }
125    
126                          $mws->reset_counters;          # ?show_id=XXXXxxxx___message_id___xxxxXXXX
127                          my $row = $mws->fetch_result_by_id($param->{'show_id'});          if ($param->{'show_id'}) {
                         $tpl_var->{message} = $row;  
                 } elsif ($param->{'search'} || $date_limit) {  
128    
129                          # show search results                  $mws->reset_counters;
130                          # ?search=foo:bar                  my $row = $mws->fetch_result_by_id($param->{'show_id'});
131                    $tpl_var->{message} = $row;
132            } elsif ($param->{'search'} || $date_limit) {
133    
134                    # show search results
135                    # ?search=foo:bar
136    
137                    my @search;
138                    push @search, $param->{'search'} if ($param->{'search'});
139    
140                    if ($date_limit) {
141                            push @search, "and" if (@search);
142                            push @search, "date:\"$date_limit\"";
143                    }
144    
145                          my @search;                  if ($param->{sort_by}) {
146                          push @search, $param->{'search'} if ($param->{'search'});                          push @search, "sort:".$param->{sort_by};
147                    }
148    
149                          if ($date_limit) {                  print STDERR "search: ",join(" ",@search),"\n";
                                 push @search, "and" if (@search);  
                                 push @search, "date:\"$date_limit\"";  
                         }  
150    
151                          if ($param->{sort_by}) {                  my $results = $mws->search(@search);
152                                  push @search, "sort:".$param->{sort_by};                  my @res = $mws->fetch_all_results();
                         }  
153    
154                          print STDERR "search: ",join(" ",@search),"\n";                  $tpl_var->{results} = \@res if (@res);
155                    $tpl_var->{total_hits} = $mws->{total_hits} || 0;
156    
157                          my $results = $mws->search(@search);                  # no hits, offer suggestions
158                          my @res = $mws->fetch_all_results();                  if (! $tpl_var->{results}) {
159                            @{$tpl_var->{apropos}} = $mws->apropos_index($param->{'search_fld'}, $param->{'search_val'});
160                    }
161    
162                          $tpl_var->{results} = \@res if (@res);          }
                         $tpl_var->{total_hits} = $mws->{total_hits} || 0;  
163    
164            # push counters to template
165            foreach my $f (qw(from to cc bcc folder)) {
166                    my $h = $mws->counter($f) || next;
167                    my @a;
168                    foreach my $k (sort { $h->{$b}->{usage} <=> $h->{$a}->{usage} } keys %$h) {
169                            push @a, $h->{$k};
170                  }                  }
171                    $tpl_var->{counters}->{$f} = [ @a ] if (@a);
172            }
173    
174            # push calendar in template
175            $tpl_var->{calendar} = $mws->counter('calendar');
176    
177                  # push counters to template          $tt->process($tpl_file, $tpl_var, \$html) || die $tt->error();
178                  foreach my $f (qw(from to cc bcc)) {          return $html;
179                          my $h = $mws->counter($f) || next;  };
                         my @a;  
                         foreach my $k (sort { $h->{$b}->{usage} <=> $h->{$a}->{usage} } keys %$h) {  
                                 push @a, $h->{$k};  
                         }  
                         $tpl_var->{counters}->{$f} = [ @a ] if (@a);  
                 }  
180    
181                  # push calendar in template  # template toolkit filter
                 $tpl_var->{calendar} = $mws->counter('calendar');  
182    
183                  $tt->process($tpl_file, $tpl_var, \$html) || die $tt->error();  sub html_escape($) {
184            my $text = shift || return;
185    
186                  #          # don't re-escape html
187                  # send HTMLto client          #return $text if ($text =~ /&(?:lt|gt|amp|quot);/);
                 #  
188    
189                  my $res = HTTP::Response->new(RC_OK);          # Escape <, >, & and ", and to produce valid XML
190                  $res->header( 'Content-type' => 'text/html; charset=ISO-8859-2' );          my %escape = ('<'=>'&lt;', '>'=>'&gt;', '&'=>'&amp;', '"'=>'&quot;');
191                  $res->content($html);          my $escape_re  = join '|' => keys %escape;
                 $c->send_response($res);  
192    
193                  $c->close;          $text =~ s/($escape_re)/$escape{$1}/gs;
         }  
         undef($c);  
 }  
194    
195  # template toolkit filter          while ($text =~ s/#-#(quote|signature)(\d*)##(.+?)##\1\2#-#/<span class="$1">$3<\/span>/gs) { } ;
196    
197            return $text;
198    }
199    
200  #use Text::Context::EitherSide;  #use Text::Context::EitherSide;
201    
202  sub body5_filter {  sub body5_filter {
203          my $text = shift;          my $text = shift;
204          $text =~ s/^\s+//gs;  
205          $text =~ s/^[\>:\|=]+\s*.*?$//msg;      # remove quoted text          # remove quote
206          $text =~ s/[\n\r]+/\n/gs;               # compress cr/lf          $text =~ s/^[\>:\|=]+[^\n\r]*[\n\r]*$/#-q-#/msg;
207            # remove quote author
208            $text =~ s/[\n\r]+[^\n\r]+:\s*(?:#-q-#[\n\r*])+//gs;
209            $text =~ s/^[^\n\r]+:\s*(?:#-q-#[\n\r]*)+//gs;
210            $text =~ s/#-q-#[\n\r]*//gs;
211            # outlook quoting
212            $text =~ s/(\s*--+\s*Original\s+Message\s*--+.*)$//si;
213            $text =~ s/(\s*--+\s*Forwarded\s+message.+\s*--+.*)$//si;
214    
215            # remove signature
216            $text =~ s/(?:^|[\n\r]+)*--\s*[\n\r]+.*$//s;
217            $text =~ s/(?:^|[\n\r]+)*_____+[\n\r]+.*$//s;
218    
219            # compress cr/lf
220            $text =~ s/[\n\r]+/\n/gs;
221    
222            # remove whitespaces
223            $text =~ s/^\n+//gs;
224            $text =~ s/[\s\n]+$//gs;
225    
226            if ($text eq "") {
227                    $text="#-#quote##forwarded message##quote#-#";
228            }
229    
230            # cut to 5 lines;
231          if ($text =~ s,^((?:.*?[\n\r]){5}).*$,$1,s) {          if ($text =~ s,^((?:.*?[\n\r]){5}).*$,$1,s) {
232                  $text =~ s/[\n\r]*$/ .../;                  $text =~ s/[\n\r]*$/ .../;
233          }          }
         $text =~ s/[\n\r]+--\s*[\n\r]+.*$//s;  
234    
235  #       my $context = Text::Context::EitherSide->new($text, context => 5);  #       my $context = Text::Context::EitherSide->new($text, context => 5);
236  #       return $context->as_string("perl");  #       return $context->as_string("perl");
237    
238            return html_escape($text);
239    }
240    
241    sub body_filter {
242            my $text = shift;
243    
244            my $sig = '';
245    
246            # remove signature
247            if ($text =~ s/([\n\r]+)(--\s*[\n\r]+.*)$//s) {
248                    $sig = "$1#-#signature##$2##signature#-#";
249            } elsif ($text =~s/(^|[\n\r]+)*(_____+[\n\r]+.*)$//s) {
250                    $sig = "$1#-#signature##$2##signature#-#";
251            }
252    
253            # find quoted text
254            $text =~ s/^([\>:\|=]+[^\n\r]*[\n\r]*)$/#-#quote1##$1##quote1#-#/mg;
255            $text =~ s/(--+\s*Original\s+Message\s*--+.*)$/#-#quote2##$1##quote2#-#/si;
256            $text =~ s/(--+\s*Forwarded\s+message.+\s*--+.*)$/#-#quote3##$1##quote3#-#/si;
257    
258            $text = html_escape($text . $sig);
259          return $text;          return $text;
260  }  }
261    

Legend:
Removed from v.27  
changed lines
  Added in v.52

  ViewVC Help
Powered by ViewVC 1.1.26