/[Grep]/lib/Grep/Search.pm
This is repository of my old source code which isn't updated any more. Go to git.rot13.org for current projects!
ViewVC logotype

Diff of /lib/Grep/Search.pm

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 47 by dpavlin, Wed Feb 21 03:04:48 2007 UTC revision 112 by dpavlin, Wed Mar 14 21:10:53 2007 UTC
# Line 2  package Grep::Search; Line 2  package Grep::Search;
2    
3  use strict;  use strict;
4  use warnings;  use warnings;
5    use base qw( Class::Accessor );
6    Grep::Search->mk_accessors( qw( analyzer store writer create index_path ) );
7    
8  use Data::Dump qw/dump/;  use Data::Dump qw/dump/;
9  use Lucene;  use Lucene;
10  use Jifty::Util;  use Jifty::Util;
11    
12  my $index_path = Jifty::Util->app_root . '/var/lucene';  my $debug = 0;
13    
14  my ( $analyzer, $store, $writer );  =head1 NAME
15    
16  my $debug = 0;  Grep::Search - full text search
17    
18  sub reopen_index {  =head1 METHODS
19          my $self = shift;  
20    =head2 new
21    
22      my $search = Grep::Search->new();
23    
24    =cut
25    
26    sub log { Jifty->web->log }
27    
28    sub new {
29            my $class = shift;        
30            my $self = $class->SUPER::new(@_);
31    
32            my $index_path = Jifty::Util->app_root . '/var/lucene';
33    
34            $self->index_path( $index_path );
35    
         $analyzer ||= new Lucene::Analysis::Standard::StandardAnalyzer();  
         my $create = 0;  
36          if (! -e "$index_path/segments") {          if (! -e "$index_path/segments") {
37                  $create = 1;                  $self->create( 1 );
38                  Jifty->log->debug("creating index $index_path") unless ($store);                  $self->log->debug("Creating new index $index_path");
39          } else {          } else {
40                  Jifty->log->debug("using index: $index_path") unless ($store);                  $self->create( 0 );
41                    $self->log->debug("Opening index: $index_path");
42          }          }
43          $store ||= Lucene::Store::FSDirectory->getDirectory( $index_path, $create );  
44            $self->analyzer( new Lucene::Analysis::Standard::StandardAnalyzer() );
45            $self->log->debug($self->analyzer . " created");
46    
47            $self->store( Lucene::Store::FSDirectory->getDirectory( $index_path, $self->create ) );
48            $self->log->debug($self->store, " created");
49    
50            return $self;
51  }  }
52    
53  =head2 add  =head2 add
54    
55    Grep::Search->add( $record );    $search->add( $record, $owner_id );
56    
57  =cut  =cut
58    
# Line 37  sub add { Line 60  sub add {
60          my $self = shift;          my $self = shift;
61    
62          my $i = shift or die "no record to add";          my $i = shift or die "no record to add";
63            my $uid = shift;
64    
65          die "record not Jifty::Record but ", ref $i unless ($i->isa('Jifty::Record'));          die "record not Jifty::Record but ", ref $i unless ($i->isa('Jifty::Record'));
66    
         $self->reopen_index;  
   
         $writer ||= new Lucene::Index::IndexWriter( $store, $analyzer, 0 );  
   
67          my $pk = { $i->primary_keys };          my $pk = { $i->primary_keys };
68    
69          my $doc = new Lucene::Document;          my $doc = new Lucene::Document;
# Line 55  sub add { Line 75  sub add {
75                  my $v = $i->$c;                  my $v = $i->$c;
76    
77                  if ( ref($v) ne '' ) {                  if ( ref($v) ne '' ) {
78                          if ($i->$c->can('id')) {  
79                                  $v = $i->$c->id;                          foreach my $f_c ( qw/id name title/ ) {
80                                  warn "  # $c = $v [id]\n" if ($debug);                                  if ( $i->$c->can( $f_c ) ) {
81                                  $doc->add(Lucene::Document::Field->Keyword( $c, $v ));                                          my $f_v = $i->$c->$f_c || $i->$c->{values}->{ $f_c };
82                          } elsif ($v->isa('Jifty::DateTime')) {                                          my $col = $c . '_' . $f_c;
83                                            if ( $f_v ) {
84                                                    warn "  # $col = $f_v\n" if ($debug);
85                                                    $doc->add(Lucene::Document::Field->Text( $col, $f_v ));
86                                            } else {
87                                                    warn "  . $col is NULL\n" if ($debug);
88                                            }
89                                    }
90                            }
91    
92                            if ($v->isa('Jifty::DateTime')) {
93                                  warn "  d $c = $v\n" if ($debug);                                  warn "  d $c = $v\n" if ($debug);
94                                  $doc->add(Lucene::Document::Field->Keyword( $c, "$v" ));                                  $doc->add(Lucene::Document::Field->Keyword( $c, "$v" ));
95                          } else {                          } else {
# Line 77  sub add { Line 107  sub add {
107                          warn "  * $c = $v\n" if ($debug);                          warn "  * $c = $v\n" if ($debug);
108                  } else {                  } else {
109                          $doc->add(Lucene::Document::Field->Text( $c, $v ));                          $doc->add(Lucene::Document::Field->Text( $c, $v ));
110                          warn "  + $c = $v\n" if ($debug);                          warn "  + $c = ", $self->snippet( 50, $v ), "\n" if ($debug);
111                  }                  }
112          }          }
113    
114          $writer->addDocument($doc);          # add _owner_id to speed up filtering of search results
115            $uid ||= Jifty->web->current_user->id;
116            $doc->add(Lucene::Document::Field->Keyword( '_owner_id', $uid ));
117    
118            if (! defined( $self->writer )) {
119                    $self->writer( new Lucene::Index::IndexWriter( $self->store, $self->analyzer, $self->create ) );
120                    $self->log->debug($self->writer, " created");
121            }
122    
123            $self->writer->addDocument($doc);
124    
125          Jifty->log->debug("added ", $i->id, " to index");          $self->log->debug("added ", $i->id, " for user $uid to index");
126  }  }
127    
128  =head2  =head2 collection
129    
130    my $ItemCollection = Grep::Search->collection( 'search query' );    my $ItemCollection = $search->collection( 'search query' );
131    
132  =cut  =cut
133    
# Line 97  sub collection { Line 136  sub collection {
136    
137          my $q = shift or die "no q?";          my $q = shift or die "no q?";
138    
139          $self->reopen_index;          return if ( $self->create );
140    
141          my $searcher = new Lucene::Search::IndexSearcher($store);          my $searcher = new Lucene::Search::IndexSearcher($self->store);
142          my $parser = new Lucene::QueryParser("content", $analyzer);          $self->log->debug("$searcher created");
143          my $query = $parser->parse( $q );          my $parser = new Lucene::QueryParser("content", $self->analyzer);
144            $self->log->debug("$parser created");
145    
146          Jifty->log->debug("searching for '$q'");          my $full_q = "($q) AND _owner_id:" . Jifty->web->current_user->id;
147    
148            my $query = $parser->parse( $full_q );
149    
150            $self->log->debug("searching for '$q' using ", $query->toString);
151    
152          my $hits = $searcher->search($query);          my $hits = $searcher->search($query);
153          my $num_hits = $hits->length();          my $num_hits = $hits->length();
154    
155          Jifty->log->debug("found $num_hits results");          $self->log->debug("found $num_hits results");
156    
157          my $collection = Grep::Model::ItemCollection->new();          my $collection = Grep::Model::ItemCollection->new();
158    
# Line 122  sub collection { Line 166  sub collection {
166                  my $title = $doc->get("title");                  my $title = $doc->get("title");
167                  my $id = $doc->get("id");                  my $id = $doc->get("id");
168    
169                  warn "## $i $score $title\n";                  $self->log->debug("result $i $score $title");
170    
171                  my $item = Grep::Model::Item->new();                  my $item = Grep::Model::Item->new();
172                  my ($ok,$msg) = $item->load_by_cols( id => $id );                  my ($ok,$msg) = $item->load_by_cols( id => $id );
# Line 138  sub collection { Line 182  sub collection {
182          undef $hits;          undef $hits;
183          undef $query;          undef $query;
184          undef $parser;          undef $parser;
185            $searcher->close;
186          undef $searcher;          undef $searcher;
187    
188          return $collection;          return $collection;
# Line 145  sub collection { Line 190  sub collection {
190    
191  =head2 finish  =head2 finish
192    
193    Grep::Search->finish    $search->finish
194    
195  =cut  =cut
196    
197  sub finish {  sub finish {
198          my $self = shift;          my $self = shift;
199          if ($writer) {          if ($self->writer) {
200                  warn "closing index\n";                  $self->log->debug("closing index");
201                  $writer->close;                  $self->writer->close;
202          }          }
203          undef $writer;  
204            $self->log->debug("finish");
205    
206            undef $self;
207    
208            return;
209  }  }
210    
211    =for TODO
212    
213  sub _signal {  sub _signal {
214          my $s = shift;          my $s = shift;
215          warn "catched SIG $s\n";          warn "catched SIG $s\n";
# Line 169  $SIG{'__DIE__'} = \&_signal; Line 221  $SIG{'__DIE__'} = \&_signal;
221  $SIG{'INT'} = \&_signal;  $SIG{'INT'} = \&_signal;
222  $SIG{'QUIT'} = \&_signal;  $SIG{'QUIT'} = \&_signal;
223    
224    =cut
225    
226    =head2 snippet
227    
228      my $short = $self->snippet( 50, $text );
229    
230    =cut
231    
232    sub snippet {
233            my $self = shift;
234    
235            my $len = shift or die "no len?";
236            my $m = join(" ", @_);
237    
238            $m =~ s/\s+/ /gs;
239    
240            if (length($m) > $len) {
241                    return substr($m,0,$len) . '...';
242            } else {
243                    return $m;
244            }
245    }
246    
247  1;  1;

Legend:
Removed from v.47  
changed lines
  Added in v.112

  ViewVC Help
Powered by ViewVC 1.1.26