/[mws]/trunk/httpd.pl
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/httpd.pl

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 21 by dpavlin, Sat May 8 00:54:16 2004 UTC revision 54 by dpavlin, Sun Aug 1 22:30:53 2004 UTC
# Line 1  Line 1 
1  #!/usr/bin/perl  #!/usr/bin/perl
2    
3  # based on post  my $basedir = '';
4  # http://www.mail-archive.com/libwww@perl.org/msg04750.html  BEGIN {
5            $basedir = $0;
6            my $loop = 0;   # to prevent symlink loops
7            while (-l $basedir && $loop++ < 20) {
8                    $basedir = readlink($basedir);
9            }
10            $basedir =~ s#/+[^/]+$#/lib#;
11    }
12    if ($basedir) {
13            use lib "$basedir";
14    }
15    
16    =head1 NAME
17    
18    httpd.pl - http server for Mail::Box Web Search
19    
20    =head1 SYNOPSYS
21    
22     httpd.pl [local.conf]
23    
24    =head1 DESCRIPTION
25    
26    This script implements user interface for Mail::Box Web Search as
27    a small single-user http server.
28    
29    =head1 SEE ALSO
30    
31    C<MWS> perl modules which are part of this package
32    C<HTTP::Daemon::Simple> module which implements the server itself
33    
34    =cut
35    
36  use strict;  use strict;
37  use warnings;  use warnings;
38  use HTTP::Daemon;  use MWS::SWISH;
39  use HTTP::Status;  #use MWS::Plucene;
40  use IO::String;  use HTTP::Daemon::Simple;
 use CGI::Lite;  
41  use Template;  use Template;
42  use MWS;  use URI::Escape;
43    
44  use Data::Dumper;  use Data::Dumper;
45    
46  my $debug = 1;  my $debug = 1;
47    
48  my $d = HTTP::Daemon->new( Reuse => 1, LocalPort => 6969 ) || die;  my $config_file = shift @ARGV || 'global.conf';
49  my $cgi = new CGI::Lite;  
50  my $mws = MWS->new('global.conf');  if (! -f $config_file) {
51            print qq{Usage: $0 [/path/to/local.conf]
52    
53    If local.conf is not specified, global.conf in current directory will
54    be used.
55    };
56            exit 1;
57    }
58    
59    my $mws = MWS::SWISH->new(config_file => $config_file);
60    #my $mws = MWS::Plucene->new(config_file => $config_file, debug => $debug);
61    
62  my $tt = Template->new({  my $tt = Template->new({
63          INCLUDE_PATH => $mws->{config}->val('global', 'templates'),          INCLUDE_PATH => $mws->{config}->val('global', 'templates'),
64          FILTERS => {          FILTERS => {
65                  'body5' => \&body5_filter,                  'body5' => \&body5_filter,
66                  'subject_search' => \&subject_search_filter,                  'body' => \&body_filter,
67          },          },
68          EVAL_PERL => 1,          EVAL_PERL => 1,
69  });  });
70    
71    my $d = new HTTP::Daemon::Simple(
72            'listen' => $mws->{config}->val('global', 'listen'),
73            'static_html' => $mws->{config}->val('global', 'static_html'),
74            'debug' => $debug,
75    ) || die "can't create HTTP::Daemon::Simple: $!";
76    
77    
78  print "Web server ready at: ", $d->url, "\n";  print "Web server ready at: ", $d->url, "\n";
79    
80    $d->run_server( \&request );
81    
82  while ( my $c = $d->accept ) {  sub request($$) {
83          while ( my $r = $c->get_request ) {          my ($url,$param) = @_;
84    
85                  # environs that a webserver should set.          print Dumper($param,$mws->{counter}),"\n" if ($debug);
                 $ENV{'REQUEST_METHOD'}    = $r->method;  
                 $ENV{'GATEWAY_INTERFACE'} = "CGI/1.0";  
                 $ENV{'SERVER_PROTOCOL'}   = $r->protocol;  
                 $ENV{'CONTENT_TYPE'}      = $r->content_type;  
   
                 # this part is based on CGI::Lite  
   
                 $cgi->close_all_files();  
                 $cgi->{web_data}       = {};  
                 $cgi->{ordered_keys}   = [];  
                 $cgi->{all_handles}    = [];  
                 $cgi->{error_status}   = 0;  
                 $cgi->{error_message}  = undef;  
   
                 if ( $r->method eq 'GET' || $r->uri =~ /\?/ ) {  
                         my $query_string = $r->uri;  
                         $query_string =~ s/[^\?]+\?(.*)/$1/;  
                         $cgi->_decode_url_encoded_data (\$query_string, 'form');  
   
                 } elsif ( $r->method eq 'POST' ) {  
   
                         if ($r->content_type eq 'application/x-www-form-urlencoded') {  
 #                               local $^W = 0;  
                                 $cgi->_decode_url_encoded_data (\$r->content, 'form');  
                         } elsif ($r->content_type =~ /multipart\/form-data/) {  
                                 my ($boundary) = $r->content_type =~ /boundary=(\S+)$/;  
                                 $cgi->_parse_multipart_data ($r->content_length, $boundary);  
                         }  
                 } else {  
                          $c->send_error(RC_FORBIDDEN);  
                 }  
86    
87                  my $param = $cgi->{web_data};          # template file name (use ?format=html as default)
88                  my $url = $r->url->path;          my $tpl_file = 'master.';
89            $tpl_file .= $param->{'format'} || 'html';
90    
91                  # XXX LOG          # parse date from url
92                  print $r->method," ",$url,"\n",Dumper($param),"\n" if ($debug);          my ($yyyy,$mm,$dd) = $mws->yyyymmdd;
93    
94                  # template file name (use ?format=html as default)          my $yyyymm;
                 my $tpl_file = 'master.';  
                 $tpl_file .= $param->{'format'} || 'html';  
   
                 # parse date from url  
                 my ($yyyy,$mm,$dd) = $mws->yyyymmdd;  
   
                 my $yyyymm;  
   
                 my $date_limit;  
   
                 if ($url =~ m,^/(\d{4})[/-](\d+)[/-](\d+),) {  
                         ($yyyy, $mm, $dd) = $mws->fmtdate($1,$2,$3);  
                          $date_limit = "$yyyy-$mm-$dd";  
                 } elsif ($url =~ m,^/(\d{4})[/-](\d+),) {  
                         ($yyyy,$mm) = $mws->fmtdate($1,$2);  
                         $date_limit = "$yyyy-$mm";  
                 } elsif ($url =~ m,^/(\d{4}),) {  
                         $date_limit = $mws->fmtdate($1);  
                 }  
95    
96                  #          my $date_limit;
                 # implement functionality and generate HTML  
                 #  
                 my $html;  
   
                 if ($param->{'search_val'} && $param->{'search_fld'} && !$param->{'search'}) {  
                         $param->{'search'} = $param->{'search_fld'}.":".$param->{'search_val'};  
                 } elsif ($param->{'search'}) {  
                         ($param->{'search_fld'}, $param->{'search_val'}) = split(/:/,$param->{'search'},2);  
                 }  
97    
98                  my $tpl_var = {          if ($url =~ m,^/(\d{4})[/-](\d+)[/-](\d+),) {
99                          param   => $param,                  ($yyyy, $mm, $dd) = $mws->fmtdate($1,$2,$3);
100                          yyyy    => $yyyy,                   $date_limit = "$yyyy-$mm-$dd";
101                          mm      => $mm,          } elsif ($url =~ m,^/(\d{4})[/-](\d+),) {
102                          dd      => $dd,                  ($yyyy,$mm) = $mws->fmtdate($1,$2);
103                          date_limit => $date_limit,                  $date_limit = "$yyyy-$mm";
104                  };          } elsif ($url =~ m,^/(\d{4}),) {
105                    $date_limit = $mws->fmtdate($1);
106                  #          }
                 # ?show_id=XXXXxxxx___message_id___xxxxXXXX  
                 if ($param->{'show_id'}) {  
   
                         $mws->reset_counters;  
                         my $row = $mws->fetch_result_by_id($param->{'show_id'});  
                         $tpl_var->{message} = $row;  
                 } elsif ($param->{'search'} || $date_limit) {  
   
                         # show search results  
                         # ?search=foo:bar  
   
                         my @search = ( $param->{'search'} );  
   
                         if ($date_limit) {  
                                 push @search, "and" if (@search);  
                                 push @search, "date:\"$date_limit\"";  
                         }  
107    
108                          print STDERR "search: ",join(" ",@search),"\n";          #
109            # implement functionality and generate HTML
110            #
111            my $html;
112    
113            if ($param->{'search_val'} && $param->{'search_fld'} && !$param->{'search'}) {
114                    $param->{'search'} = $param->{'search_fld'}.":".$param->{'search_val'};
115            } elsif ($param->{'search'}) {
116                    ($param->{'search_fld'}, $param->{'search_val'}) = split(/:/,$param->{'search'},2);
117            }
118    
119                          my $results = $mws->search(@search);          my $tpl_var = {
120                          my @res = $mws->fetch_all_results();                  param   => $param,
121                    yyyy    => $yyyy,
122                    mm      => $mm,
123                    dd      => $dd,
124                    date_limit => $date_limit,
125            };
126    
127            # is this access to root of web server?
128            if ($url eq "/" && !$param->{'search'}) {
129                    # if first access, go to current year
130                    $date_limit = $mws->fmtdate($yyyy);
131                    $param->{sort_by} = "date desc";
132            }
133    
134                          $tpl_var->{results} = \@res if (@res);          # ?show_id=XXXXxxxx___message_id___xxxxXXXX
135                          $tpl_var->{total_hits} = $mws->{total_hits};          if ($param->{'show_id'}) {
136    
137                    $mws->reset_counters;
138                    my $row = $mws->fetch_result_by_id($param->{'show_id'});
139                    $tpl_var->{message} = $row;
140            } elsif ($param->{'search'} || $date_limit) {
141    
142                    # show search results
143                    # ?search=foo:bar
144    
145                    my @search;
146                    push @search, $param->{'search'} if ($param->{'search'});
147    
148                    if ($date_limit) {
149                            push @search, "and" if (@search);
150                            push @search, "date:\"$date_limit\"";
151                  }                  }
152    
153                    if ($param->{sort_by}) {
154                  # push counters to template                          push @search, "sort:".$param->{sort_by};
                 foreach my $f (qw(from to cc bcc)) {  
                         my $h = $mws->counter($f) || next;  
                         my @a;  
                         foreach my $k (sort { $h->{$b}->{usage} <=> $h->{$a}->{usage} } keys %$h) {  
                                 push @a, $h->{$k};  
                         }  
                         $tpl_var->{counters}->{$f} = [ @a ] if (@a);  
155                  }                  }
156    
157                  # push calendar in template                  print STDERR "search: ",join(" ",@search),"\n";
158                  $tpl_var->{calendar} = $mws->counter('calendar');  
159                    my $results = $mws->search(@search);
160                    my @res = $mws->fetch_all_results();
161    
162                  $tt->process($tpl_file, $tpl_var, \$html) || die $tt->error();                  $tpl_var->{results} = \@res if (@res);
163                    $tpl_var->{total_hits} = $mws->{total_hits} || 0;
164    
165                  #                  # no hits, offer suggestions
166                  # send HTMLto client                  if (! $tpl_var->{results} && $param->{'search_fld'} && $param->{'search_val'}) {
167                  #                          @{$tpl_var->{apropos}} = $mws->apropos_index($param->{'search_fld'}, $param->{'search_val'});
168                    }
169    
170                  my $res = HTTP::Response->new(RC_OK);          }
                 $res->header( 'Content-type' => 'text/html; charset=ISO-8859-2' );  
                 $res->content($html);  
                 $c->send_response($res);  
171    
172                  $c->close;          # push counters to template
173            foreach my $f (qw(from to cc bcc folder)) {
174                    my $h = $mws->counter($f) || next;
175                    my @a;
176                    foreach my $k (sort { $h->{$b}->{usage} <=> $h->{$a}->{usage} } keys %$h) {
177                            push @a, $h->{$k};
178                    }
179                    $tpl_var->{counters}->{$f} = [ @a ] if (@a);
180          }          }
181          undef($c);  
182  }          # push calendar in template
183            $tpl_var->{calendar} = $mws->counter('calendar');
184    
185            $tt->process($tpl_file, $tpl_var, \$html) || die $tt->error();
186            return $html;
187    };
188    
189  # template toolkit filter  # template toolkit filter
190    
191    sub html_escape($) {
192            my $text = shift || return;
193    
194            # don't re-escape html
195            #return $text if ($text =~ /&(?:lt|gt|amp|quot);/);
196    
197            # Escape <, >, & and ", and to produce valid XML
198            my %escape = ('<'=>'&lt;', '>'=>'&gt;', '&'=>'&amp;', '"'=>'&quot;');
199            my $escape_re  = join '|' => keys %escape;
200    
201            $text =~ s/($escape_re)/$escape{$1}/gs;
202    
203            while ($text =~ s/#-#(quote|signature)(\d*)##(.+?)##\1\2#-#/<span class="$1">$3<\/span>/gs) { } ;
204    
205            return $text;
206    }
207    
208  #use Text::Context::EitherSide;  #use Text::Context::EitherSide;
209    
210  sub body5_filter {  sub body5_filter {
211          my $text = shift;          my $text = shift;
212          $text =~ s/^\s+//gs;  
213          $text =~ s/^[\>:\|=]+\s*.*?$//msg;      # remove quoted text          # remove quote
214          $text =~ s/[\n\r]+/\n/gs;               # compress cr/lf          $text =~ s/^[\>:\|=]+[^\n\r]*[\n\r]*$/#-q-#/msg;
215            # remove quote author
216            $text =~ s/[\n\r]+[^\n\r]+:\s*(?:#-q-#[\n\r*])+//gs;
217            $text =~ s/^[^\n\r]+:\s*(?:#-q-#[\n\r]*)+//gs;
218            $text =~ s/#-q-#[\n\r]*//gs;
219            # outlook quoting
220            $text =~ s/(\s*--+\s*Original\s+Message\s*--+.*)$//si;
221            $text =~ s/(\s*--+\s*Forwarded\s+message.+\s*--+.*)$//si;
222    
223            # remove signature
224            $text =~ s/(?:^|[\n\r]+)*--\s*[\n\r]+.*$//s;
225            $text =~ s/(?:^|[\n\r]+)*_____+[\n\r]+.*$//s;
226    
227            # compress cr/lf
228            $text =~ s/[\n\r]+/\n/gs;
229    
230            # remove whitespaces
231            $text =~ s/^\n+//gs;
232            $text =~ s/[\s\n]+$//gs;
233    
234            if ($text eq "") {
235                    $text="#-#quote##forwarded message##quote#-#";
236            }
237    
238            # cut to 5 lines;
239          if ($text =~ s,^((?:.*?[\n\r]){5}).*$,$1,s) {          if ($text =~ s,^((?:.*?[\n\r]){5}).*$,$1,s) {
240                  $text =~ s/[\n\r]*$/ .../;                  $text =~ s/[\n\r]*$/ .../;
241          }          }
         $text =~ s/[\n\r]+--\s*[\n\r]+.*$//s;  
242    
243  #       my $context = Text::Context::EitherSide->new($text, context => 5);  #       my $context = Text::Context::EitherSide->new($text, context => 5);
244  #       return $context->as_string("perl");  #       return $context->as_string("perl");
245    
246          return $text;          return html_escape($text);
247  }  }
248    
249  sub subject_search_filter {  sub body_filter {
250          my $s = shift;          my $text = shift;
251          # remove re: fdw: [list] preffixes from e-mail  
252          while ( $s =~ s/^\s*\[(?:re|fwd|fw):\s+(.+)\]\s*$/$1/ig ||          my $sig = '';
253                  $s =~ s/^\s*(?:re|fwd|fw):\s+(.+?)\s*$/$1/ig ||  
254                  $s =~ s/^\[\S+\]\s*//ig ||          # remove signature
255                  $s =~ s/^\[[^@]+@\w+\.\w+\s*:\s+(.+)\s*\]\s*$/$1/g ||          if ($text =~ s/([\n\r]+)(--\s*[\n\r]+.*)$//s) {
256                  $s =~ s/\(fwd\)\s*$//ig ||                  $sig = "$1#-#signature##$2##signature#-#";
257                  $s =~ s/\"//g          } elsif ($text =~s/(^|[\n\r]+)*(_____+[\n\r]+.*)$//s) {
258          ) { };                  $sig = "$1#-#signature##$2##signature#-#";
259          return $s;          }
260    
261            # find quoted text
262            $text =~ s/^([\>:\|=]+[^\n\r]*[\n\r]*)$/#-#quote1##$1##quote1#-#/mg;
263            $text =~ s/(--+\s*Original\s+Message\s*--+.*)$/#-#quote2##$1##quote2#-#/si;
264            $text =~ s/(--+\s*Forwarded\s+message.+\s*--+.*)$/#-#quote3##$1##quote3#-#/si;
265    
266            $text = html_escape($text . $sig);
267            return $text;
268  }  }
269    

Legend:
Removed from v.21  
changed lines
  Added in v.54

  ViewVC Help
Powered by ViewVC 1.1.26