line |
stmt |
bran |
cond |
sub |
pod |
time |
code |
1
|
|
|
|
|
|
|
package Lingua::StopWords::HU; |
2
|
|
|
|
|
|
|
|
3
|
1
|
|
|
1
|
|
8
|
use strict; |
|
1
|
|
|
|
|
2
|
|
|
1
|
|
|
|
|
35
|
|
4
|
1
|
|
|
1
|
|
5
|
use warnings; |
|
1
|
|
|
|
|
1
|
|
|
1
|
|
|
|
|
25
|
|
5
|
|
|
|
|
|
|
|
6
|
1
|
|
|
1
|
|
5
|
use utf8; |
|
1
|
|
|
|
|
2
|
|
|
1
|
|
|
|
|
6
|
|
7
|
|
|
|
|
|
|
|
8
|
1
|
|
|
1
|
|
25
|
use Encode qw(encode); |
|
1
|
|
|
|
|
2
|
|
|
1
|
|
|
|
|
41
|
|
9
|
|
|
|
|
|
|
|
10
|
1
|
|
|
1
|
|
5
|
use Exporter; |
|
1
|
|
|
|
|
2
|
|
|
1
|
|
|
|
|
362
|
|
11
|
|
|
|
|
|
|
our @ISA = qw(Exporter); |
12
|
|
|
|
|
|
|
|
13
|
|
|
|
|
|
|
our %EXPORT_TAGS = ( 'all' => [ qw( getStopWords ) ] ); |
14
|
|
|
|
|
|
|
our @EXPORT_OK = ( @{ $EXPORT_TAGS{'all'} } ); |
15
|
|
|
|
|
|
|
our $VERSION = 0.12; |
16
|
|
|
|
|
|
|
|
17
|
|
|
|
|
|
|
sub getStopWords { |
18
|
2
|
100
|
66
|
2
|
0
|
12
|
if ( @_ and $_[0] eq 'UTF-8' ) { |
19
|
1
|
|
|
|
|
2
|
my %stoplist = map { ( $_, 1 ) } _stopwords(); |
|
199
|
|
|
|
|
389
|
|
20
|
1
|
|
|
|
|
20
|
return \%stoplist; |
21
|
|
|
|
|
|
|
} |
22
|
|
|
|
|
|
|
else { |
23
|
1
|
|
|
|
|
3
|
my %stoplist = map { ( encode("iso-8859-2", $_), 1 ) } _stopwords(); |
|
199
|
|
|
|
|
8040
|
|
24
|
1
|
|
|
|
|
155
|
return \%stoplist; |
25
|
|
|
|
|
|
|
} |
26
|
|
|
|
|
|
|
} |
27
|
|
|
|
|
|
|
|
28
|
|
|
|
|
|
|
sub _stopwords { |
29
|
2
|
|
|
2
|
|
37
|
return qw( |
30
|
|
|
|
|
|
|
a ahogy ahol aki akik akkor alatt által általában amely amelyek |
31
|
|
|
|
|
|
|
amelyekben amelyeket amelyet amelynek ami amit amolyan amíg |
32
|
|
|
|
|
|
|
amikor át abban ahhoz annak arra arról az azok azon azt azzal |
33
|
|
|
|
|
|
|
azért aztán azután azonban bár be belül benne cikk cikkek |
34
|
|
|
|
|
|
|
cikkeket csak de e eddig egész egy egyes egyetlen egyéb egyik |
35
|
|
|
|
|
|
|
egyre ekkor el elég ellen elő először előtt első én éppen ebben |
36
|
|
|
|
|
|
|
ehhez emilyen ennek erre ez ezt ezek ezen ezzel ezért és fel |
37
|
|
|
|
|
|
|
felé hanem hiszen hogy hogyan igen így illetve ill. ill ilyen |
38
|
|
|
|
|
|
|
ilyenkor ison ismét itt jó jól jobban kell kellett keresztül |
39
|
|
|
|
|
|
|
keressünk ki kívül között közül legalább lehet lehetett legyen |
40
|
|
|
|
|
|
|
lenne lenni lesz lett maga magát majd majd már más másik meg |
41
|
|
|
|
|
|
|
még mellett mert mely melyek mi mit míg miért milyen mikor |
42
|
|
|
|
|
|
|
minden mindent mindenki mindig mint mintha mivel most nagy |
43
|
|
|
|
|
|
|
nagyobb nagyon ne néha nekem neki nem néhány nélkül nincs olyan |
44
|
|
|
|
|
|
|
ott össze ő ők őket pedig persze rá s saját sem semmi sok sokat |
45
|
|
|
|
|
|
|
sokkal számára szemben szerint szinte talán tehát teljes tovább |
46
|
|
|
|
|
|
|
továbbá több úgy ugyanis új újabb újra után utána utolsó vagy |
47
|
|
|
|
|
|
|
vagyis valaki valami valamint való vagyok van vannak volt |
48
|
|
|
|
|
|
|
voltam voltak voltunk vissza vele viszont volna |
49
|
|
|
|
|
|
|
); |
50
|
|
|
|
|
|
|
} |
51
|
|
|
|
|
|
|
|
52
|
|
|
|
|
|
|
1; |