line |
stmt |
bran |
cond |
sub |
pod |
time |
code |
1
|
|
|
|
|
|
|
package Lingua::StopWords::FI; |
2
|
|
|
|
|
|
|
|
3
|
1
|
|
|
1
|
|
7
|
use strict; |
|
1
|
|
|
|
|
2
|
|
|
1
|
|
|
|
|
32
|
|
4
|
1
|
|
|
1
|
|
5
|
use warnings; |
|
1
|
|
|
|
|
2
|
|
|
1
|
|
|
|
|
25
|
|
5
|
|
|
|
|
|
|
|
6
|
1
|
|
|
1
|
|
5
|
use utf8; |
|
1
|
|
|
|
|
2
|
|
|
1
|
|
|
|
|
5
|
|
7
|
|
|
|
|
|
|
|
8
|
1
|
|
|
1
|
|
25
|
use Encode qw(encode); |
|
1
|
|
|
|
|
2
|
|
|
1
|
|
|
|
|
45
|
|
9
|
|
|
|
|
|
|
|
10
|
1
|
|
|
1
|
|
5
|
use Exporter; |
|
1
|
|
|
|
|
2
|
|
|
1
|
|
|
|
|
334
|
|
11
|
|
|
|
|
|
|
our @ISA = qw(Exporter); |
12
|
|
|
|
|
|
|
|
13
|
|
|
|
|
|
|
our %EXPORT_TAGS = ( 'all' => [ qw( getStopWords ) ] ); |
14
|
|
|
|
|
|
|
our @EXPORT_OK = ( @{ $EXPORT_TAGS{'all'} } ); |
15
|
|
|
|
|
|
|
our $VERSION = 0.11; |
16
|
|
|
|
|
|
|
|
17
|
|
|
|
|
|
|
sub getStopWords { |
18
|
2
|
100
|
66
|
2
|
0
|
13
|
if ( @_ and $_[0] eq 'UTF-8' ) { |
19
|
1
|
|
|
|
|
3
|
my %stoplist = map { ( $_, 1 ) } _stopwords(); |
|
235
|
|
|
|
|
441
|
|
20
|
1
|
|
|
|
|
22
|
return \%stoplist; |
21
|
|
|
|
|
|
|
} |
22
|
|
|
|
|
|
|
else { |
23
|
1
|
|
|
|
|
3
|
my %stoplist = map { ( encode("iso-8859-1", $_), 1 ) } _stopwords(); |
|
235
|
|
|
|
|
5979
|
|
24
|
1
|
|
|
|
|
170
|
return \%stoplist; |
25
|
|
|
|
|
|
|
} |
26
|
|
|
|
|
|
|
} |
27
|
|
|
|
|
|
|
|
28
|
|
|
|
|
|
|
sub _stopwords { |
29
|
2
|
|
|
2
|
|
40
|
return qw( |
30
|
|
|
|
|
|
|
olla olen olet on olemme olette ovat ole oli olisi olisit |
31
|
|
|
|
|
|
|
olisin olisimme olisitte olisivat olit olin olimme olitte |
32
|
|
|
|
|
|
|
olivat ollut olleet en et ei emme ette eivät minä minun minut |
33
|
|
|
|
|
|
|
minua minussa minusta minuun minulla minulta minulle sinä sinun |
34
|
|
|
|
|
|
|
sinut sinua sinussa sinusta sinuun sinulla sinulta sinulle hän |
35
|
|
|
|
|
|
|
hänen hänet häntä hänessä hänestä häneen hänellä häneltä |
36
|
|
|
|
|
|
|
hänelle me meidän meidät meitä meissä meistä meihin meillä |
37
|
|
|
|
|
|
|
meiltä meille te teidän teidät teitä teissä teistä teihin |
38
|
|
|
|
|
|
|
teillä teiltä teille he heidän heidät heitä heissä heistä |
39
|
|
|
|
|
|
|
heihin heillä heiltä heille tämä tämän tätä tässä tästä tähän |
40
|
|
|
|
|
|
|
tallä tältä tälle tänä täksi tuo tuon tuotä tuossa tuosta |
41
|
|
|
|
|
|
|
tuohon tuolla tuolta tuolle tuona tuoksi se sen sitä siinä |
42
|
|
|
|
|
|
|
siitä siihen sillä siltä sille sinä siksi nämä näiden näitä |
43
|
|
|
|
|
|
|
näissä näistä näihin näillä näiltä näille näinä näiksi nuo |
44
|
|
|
|
|
|
|
noiden noita noissa noista noihin noilla noilta noille noina |
45
|
|
|
|
|
|
|
noiksi ne niiden niitä niissä niistä niihin niillä niiltä |
46
|
|
|
|
|
|
|
niille niinä niiksi kuka kenen kenet ketä kenessä kenestä |
47
|
|
|
|
|
|
|
keneen kenellä keneltä kenelle kenenä keneksi ketkä keiden |
48
|
|
|
|
|
|
|
ketkä keitä keissä keistä keihin keillä keiltä keille keinä |
49
|
|
|
|
|
|
|
keiksi mikä minkä minkä mitä missä mistä mihin millä miltä |
50
|
|
|
|
|
|
|
mille minä miksi mitkä joka jonka jota jossa josta johon jolla |
51
|
|
|
|
|
|
|
jolta jolle jona joksi jotka joiden joita joissa joista joihin |
52
|
|
|
|
|
|
|
joilla joilta joille joina joiksi että ja jos koska kuin mutta |
53
|
|
|
|
|
|
|
niin sekä sillä tai vaan vai vaikka kanssa mukaan noin poikki |
54
|
|
|
|
|
|
|
yli kun niin nyt itse |
55
|
|
|
|
|
|
|
); |
56
|
|
|
|
|
|
|
} |
57
|
|
|
|
|
|
|
|
58
|
|
|
|
|
|
|
1; |