/[mws]/trunk/httpd.pl
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /trunk/httpd.pl

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 12 by dpavlin, Thu May 6 12:40:11 2004 UTC revision 53 by dpavlin, Fri Jun 18 14:56:40 2004 UTC
# Line 1  Line 1 
1  #!/usr/bin/perl  #!/usr/bin/perl
2    
3  # based on post  my $basedir = '';
4  # http://www.mail-archive.com/libwww@perl.org/msg04750.html  BEGIN {
5            $basedir = $0;
6            my $loop = 0;   # to prevent symlink loops
7            while (-l $basedir && $loop++ < 20) {
8                    $basedir = readlink($basedir);
9            }
10            $basedir =~ s#/+[^/]+$#/lib#;
11    }
12    if ($basedir) {
13            use lib "$basedir";
14    }
15    
16    =head1 NAME
17    
18    httpd.pl - http server for Mail::Box Web Search
19    
20    =head1 SYNOPSYS
21    
22     httpd.pl [local.conf]
23    
24    =head1 DESCRIPTION
25    
26    This script implements user interface for Mail::Box Web Search as
27    a small single-user http server.
28    
29    =head1 SEE ALSO
30    
31    C<MWS> perl modules which are part of this package
32    C<MWS::HTTPD> module which implements the server itself
33    
34    =cut
35    
36  use strict;  use strict;
37  use warnings;  use warnings;
38  use HTTP::Daemon;  use MWS::SWISH;
39  use HTTP::Status;  #use MWS::Plucene;
40  use IO::String;  use HTTP::Daemon::Simple;
 use CGI::Lite;  
41  use Template;  use Template;
42  use MWS;  use URI::Escape;
43    
44  use Data::Dumper;  use Data::Dumper;
45    
46  my $d = HTTP::Daemon->new( Reuse => 1, LocalPort => 6969 ) || die;  my $debug = 1;
47  print "Please contact me at: <URL:", $d->url, ">\n";  
48    my $config_file = shift @ARGV || 'global.conf';
49    
50    if (! -f $config_file) {
51            print qq{Usage: $0 [/path/to/local.conf]
52    
53    If local.conf is not specified, global.conf in current directory will
54    be used.
55    };
56            exit 1;
57    }
58    
59    my $mws = MWS::SWISH->new(config_file => $config_file);
60    #my $mws = MWS::Plucene->new(config_file => $config_file, debug => $debug);
61    
 my $cgi = new CGI::Lite;  
 my $mws = MWS->new('global.conf');  
62  my $tt = Template->new({  my $tt = Template->new({
63          INCLUDE_PATH => $mws->{config}->val('global', 'templates'),          INCLUDE_PATH => $mws->{config}->val('global', 'templates'),
64          FILTERS => {          FILTERS => {
65                  'body5' => \&body5_filter,                  'body5' => \&body5_filter,
66                    'body' => \&body_filter,
67          },          },
68            EVAL_PERL => 1,
69  });  });
70    
71    my $d = new HTTP::Daemon::Simple(
72            'listen' => $mws->{config}->val('global', 'listen'),
73            'static_html' => $mws->{config}->val('global', 'static_html'),
74            'debug' => $debug,
75    ) || die "can't create HTTP::Daemon::Simple: $!";
76    
 while ( my $c = $d->accept ) {  
         while ( my $r = $c->get_request ) {  
77    
78                  # environs that a webserver should set.  print "Web server ready at: ", $d->url, "\n";
                 $ENV{'REQUEST_METHOD'}    = $r->method;  
                 $ENV{'GATEWAY_INTERFACE'} = "CGI/1.0";  
                 $ENV{'SERVER_PROTOCOL'}   = $r->protocol;  
                 $ENV{'CONTENT_TYPE'}      = $r->content_type;  
   
                 # this part is based on CGI::Lite  
   
                 $cgi->close_all_files();  
                 $cgi->{web_data}       = {};  
                 $cgi->{ordered_keys}   = [];  
                 $cgi->{all_handles}    = [];  
                 $cgi->{error_status}   = 0;  
                 $cgi->{error_message}  = undef;  
   
                 if ( $r->method eq 'GET' || $r->uri =~ /\?/ ) {  
                         my $query_string = $r->uri;  
                         $query_string =~ s/[^\?]+\?(.*)/$1/;  
                         $cgi->_decode_url_encoded_data (\$query_string, 'form');  
   
                 } elsif ( $r->method eq 'POST' ) {  
   
                         if ($r->content_type eq 'application/x-www-form-urlencoded') {  
 #                               local $^W = 0;  
                                 $cgi->_decode_url_encoded_data (\$r->content, 'form');  
                         } elsif ($r->content_type =~ /multipart\/form-data/) {  
                                 my ($boundary) = $r->content_type =~ /boundary=(\S+)$/;  
                                 $cgi->_parse_multipart_data ($r->content_length, $boundary);  
                         }  
                 } else {  
                          $c->send_error(RC_FORBIDDEN);  
                 }  
79    
80                  my $param = $cgi->{web_data};  $d->run_server( \&request );
                 my $url = $r->url->path;  
81    
82                  # XXX LOG  sub request($$) {
83                  print $r->method," ",$url,Dumper($param);          my ($url,$param) = @_;
84    
85                  # template file name (use ?format=html as default)          print Dumper($param,$mws->{counter}),"\n" if ($debug);
                 my $tpl_file = 'master.';  
                 $tpl_file .= $param->{'format'} || 'html';  
   
                 #  
                 # implement functionality and generate HTML  
                 #  
                 my $html;  
86    
87                  if ($param->{'search_val'} && $param->{'search_fld'} && !$param->{'search'}) {          # template file name (use ?format=html as default)
88                          $param->{'search'} = $param->{'search_fld'}.":".$param->{'search_val'};          my $tpl_file = 'master.';
89                  }          $tpl_file .= $param->{'format'} || 'html';
90    
91            # parse date from url
92            my ($yyyy,$mm,$dd) = $mws->yyyymmdd;
93    
94            my $yyyymm;
95    
96            my $date_limit;
97    
98            if ($url =~ m,^/(\d{4})[/-](\d+)[/-](\d+),) {
99                    ($yyyy, $mm, $dd) = $mws->fmtdate($1,$2,$3);
100                     $date_limit = "$yyyy-$mm-$dd";
101            } elsif ($url =~ m,^/(\d{4})[/-](\d+),) {
102                    ($yyyy,$mm) = $mws->fmtdate($1,$2);
103                    $date_limit = "$yyyy-$mm";
104            } elsif ($url =~ m,^/(\d{4}),) {
105                    $date_limit = $mws->fmtdate($1);
106            }
107    
108            #
109            # implement functionality and generate HTML
110            #
111            my $html;
112    
113            if ($param->{'search_val'} && $param->{'search_fld'} && !$param->{'search'}) {
114                    $param->{'search'} = $param->{'search_fld'}.":".$param->{'search_val'};
115            } elsif ($param->{'search'}) {
116                    ($param->{'search_fld'}, $param->{'search_val'}) = split(/:/,$param->{'search'},2);
117            }
118    
119            my $tpl_var = {
120                    param   => $param,
121                    yyyy    => $yyyy,
122                    mm      => $mm,
123                    dd      => $dd,
124                    date_limit => $date_limit,
125            };
126    
127            # is this access to root of web server?
128            if ($url eq "/" && !$param->{'search'}) {
129                    # if first access, go to current year
130                    $date_limit = $mws->fmtdate($yyyy);
131                    $param->{sort_by} = "date desc";
132            }
133    
134            # ?show_id=XXXXxxxx___message_id___xxxxXXXX
135            if ($param->{'show_id'}) {
136    
137                    $mws->reset_counters;
138                    my $row = $mws->fetch_result_by_id($param->{'show_id'});
139                    $tpl_var->{message} = $row;
140            } elsif ($param->{'search'} || $date_limit) {
141    
142                  # show search results                  # show search results
143                  # ?search=foo:bar                  # ?search=foo:bar
                 if ($param->{'search'}) {  
144    
145                          print STDERR "search: ",$param->{'search'},"\n";                  my @search;
146                    push @search, $param->{'search'} if ($param->{'search'});
147    
148                    if ($date_limit) {
149                            push @search, "and" if (@search);
150                            push @search, "date:\"$date_limit\"";
151                    }
152    
153                    if ($param->{sort_by}) {
154                            push @search, "sort:".$param->{sort_by};
155                    }
156    
157                    print STDERR "search: ",join(" ",@search),"\n";
158    
159                          my $results = $mws->search($param->{'search'});                  my $results = $mws->search(@search);
160                          my @res = $mws->fetch_all_results();                  my @res = $mws->fetch_all_results();
161    
162                          $tt->process($tpl_file, {                  $tpl_var->{results} = \@res if (@res);
163                                  query   => $param->{'search'},                  $tpl_var->{total_hits} = $mws->{total_hits} || 0;
164                                  results => \@res,  
165                                  param   => $param,                  # no hits, offer suggestions
166                          }, \$html) || die $tt->error();                  if (! $tpl_var->{results} && $param->{'search_fld'} && $param->{'search_val'}) {
167                            @{$tpl_var->{apropos}} = $mws->apropos_index($param->{'search_fld'}, $param->{'search_val'});
                 #  
                 # ?show_id=XXXXxxxx___message_id___xxxxXXXX  
                 } elsif ($param->{'show_id'}) {  
                           
                         my $row = $mws->fetch_result_by_id($param->{'show_id'});  
                         $tt->process($tpl_file, {  
                                 message => $row,  
                         }, \$html) || die $tt->error();  
168                  }                  }
169    
170                  #          }
                 # send HTMLto client  
                 #  
   
                 my $res = HTTP::Response->new(RC_OK);  
                 $res->header( 'Content-type' => 'text/html; charset=iso-8859-2' );  
                 $res->content($html);  
                 $c->send_response($res);  
171    
172                  $c->close;          # push counters to template
173            foreach my $f (qw(from to cc bcc folder)) {
174                    my $h = $mws->counter($f) || next;
175                    my @a;
176                    foreach my $k (sort { $h->{$b}->{usage} <=> $h->{$a}->{usage} } keys %$h) {
177                            push @a, $h->{$k};
178                    }
179                    $tpl_var->{counters}->{$f} = [ @a ] if (@a);
180          }          }
181          undef($c);  
182  }          # push calendar in template
183            $tpl_var->{calendar} = $mws->counter('calendar');
184    
185            $tt->process($tpl_file, $tpl_var, \$html) || die $tt->error();
186            return $html;
187    };
188    
189  # template toolkit filter  # template toolkit filter
190    
191    sub html_escape($) {
192            my $text = shift || return;
193    
194            # don't re-escape html
195            #return $text if ($text =~ /&(?:lt|gt|amp|quot);/);
196    
197            # Escape <, >, & and ", and to produce valid XML
198            my %escape = ('<'=>'&lt;', '>'=>'&gt;', '&'=>'&amp;', '"'=>'&quot;');
199            my $escape_re  = join '|' => keys %escape;
200    
201            $text =~ s/($escape_re)/$escape{$1}/gs;
202    
203            while ($text =~ s/#-#(quote|signature)(\d*)##(.+?)##\1\2#-#/<span class="$1">$3<\/span>/gs) { } ;
204    
205            return $text;
206    }
207    
208  #use Text::Context::EitherSide;  #use Text::Context::EitherSide;
209    
210  sub body5_filter {  sub body5_filter {
211          my $text = shift;          my $text = shift;
212          $text =~ s/^\s+//gs;  
213          $text =~ s/^[\>:\|=]+\s*.*?$//msg;      # remove quoted text          # remove quote
214          $text =~ s/[\n\r]+/\n/gs;               # compress cr/lf          $text =~ s/^[\>:\|=]+[^\n\r]*[\n\r]*$/#-q-#/msg;
215          $text =~ s,^((?:.*?[\n\r]){5}).*$,$1<span style="color:#808080">--8&lt;--[cut]--8&lt;--</span>,s;          # remove quote author
216          $text =~ s/[\n\r]+--\s*[\n\r]+.*$//s;          $text =~ s/[\n\r]+[^\n\r]+:\s*(?:#-q-#[\n\r*])+//gs;
217            $text =~ s/^[^\n\r]+:\s*(?:#-q-#[\n\r]*)+//gs;
218            $text =~ s/#-q-#[\n\r]*//gs;
219            # outlook quoting
220            $text =~ s/(\s*--+\s*Original\s+Message\s*--+.*)$//si;
221            $text =~ s/(\s*--+\s*Forwarded\s+message.+\s*--+.*)$//si;
222    
223            # remove signature
224            $text =~ s/(?:^|[\n\r]+)*--\s*[\n\r]+.*$//s;
225            $text =~ s/(?:^|[\n\r]+)*_____+[\n\r]+.*$//s;
226    
227            # compress cr/lf
228            $text =~ s/[\n\r]+/\n/gs;
229    
230            # remove whitespaces
231            $text =~ s/^\n+//gs;
232            $text =~ s/[\s\n]+$//gs;
233    
234            if ($text eq "") {
235                    $text="#-#quote##forwarded message##quote#-#";
236            }
237    
238            # cut to 5 lines;
239            if ($text =~ s,^((?:.*?[\n\r]){5}).*$,$1,s) {
240                    $text =~ s/[\n\r]*$/ .../;
241            }
242    
243  #       my $context = Text::Context::EitherSide->new($text, context => 5);  #       my $context = Text::Context::EitherSide->new($text, context => 5);
244  #       return $context->as_string("perl");  #       return $context->as_string("perl");
245    
246            return html_escape($text);
247    }
248    
249    sub body_filter {
250            my $text = shift;
251    
252            my $sig = '';
253    
254            # remove signature
255            if ($text =~ s/([\n\r]+)(--\s*[\n\r]+.*)$//s) {
256                    $sig = "$1#-#signature##$2##signature#-#";
257            } elsif ($text =~s/(^|[\n\r]+)*(_____+[\n\r]+.*)$//s) {
258                    $sig = "$1#-#signature##$2##signature#-#";
259            }
260    
261            # find quoted text
262            $text =~ s/^([\>:\|=]+[^\n\r]*[\n\r]*)$/#-#quote1##$1##quote1#-#/mg;
263            $text =~ s/(--+\s*Original\s+Message\s*--+.*)$/#-#quote2##$1##quote2#-#/si;
264            $text =~ s/(--+\s*Forwarded\s+message.+\s*--+.*)$/#-#quote3##$1##quote3#-#/si;
265    
266            $text = html_escape($text . $sig);
267          return $text;          return $text;
268  }  }
269    

Legend:
Removed from v.12  
changed lines
  Added in v.53

  ViewVC Help
Powered by ViewVC 1.1.26