File Coverage

blib/lib/Lingua/Identify/EN.pm
Criterion Covered Total %
statement 6 6 100.0
branch n/a
condition n/a
subroutine 2 2 100.0
pod n/a
total 8 8 100.0


line stmt bran cond sub pod time code
1 7     7   35 use utf8;
  7         12  
  7         34  
2 7     7   176 use strict;
  7         12  
  7         6509  
3              
4             ${Lingua::Identify::languages{'_versions'}{'en'}} = '0.02';
5              
6             ${Lingua::Identify::languages{'_names'}{'en'}} = 'english';
7              
8             ${Lingua::Identify::languages{'_sets'}{'en'}} = '';
9              
10              
11             =head1 NAME
12              
13             Lingua::Identify::EN - Meta-information on English
14              
15             =head1 SYNOPSIS
16              
17             Nothing here is meant for public consumption. This module is to be
18             loaded by Lingua::Identify.
19              
20             =head1 DESCRIPTION
21              
22             Automatically generated. Do not change this module yourself unless
23             you know what you're doing.
24              
25             =head1 SEE ALSO
26              
27             Lingua::Identify(3).
28              
29             =head1 AUTHOR
30              
31             Jose Castro, C<< >>
32              
33             =head1 COPYRIGHT AND LICENSE
34              
35             Copyright (C) 2010 by Alberto Simoes
36              
37             This library is free software; you can redistribute it and/or modify
38             it under the same terms as Perl itself, either Perl version 5.8.4 or,
39             at your option, any later version of Perl 5 you may have available.
40              
41             =cut
42              
43             ${Lingua::Identify::languages{'prefixes1'}{'en'}} = {
44             't' => 0.170758391694659,
45             'a' => 0.0952308999612686,
46             'i' => 0.0744895997155101,
47             'o' => 0.0713993554869753,
48             'w' => 0.0530210514273427,
49             's' => 0.0476842809668798,
50             'c' => 0.0448318008460267,
51             'p' => 0.0400873731407881,
52             'b' => 0.0368787637369075,
53             'f' => 0.0352433601788537,
54             'r' => 0.0311676009532618,
55             'm' => 0.0292978791441595,
56             'd' => 0.0250694684697226,
57             'h' => 0.0249516201728717,
58             'e' => 0.0237466041082881,
59             'n' => 0.0202326918067178,
60             'l' => 0.0163762613558205,
61             'E' => 0.0140146435123479,
62             'T' => 0.0131173424450972,
63             'C' => 0.0124012934367458,
64             };
65              
66             ${Lingua::Identify::languages{'prefixes2'}{'en'}} = {
67             'th' => 0.14773642550096,
68             'an' => 0.0420250770380145,
69             'co' => 0.0309584871050066,
70             're' => 0.0291803293568269,
71             'pr' => 0.0213847889712726,
72             'fo' => 0.0200085968783693,
73             'in' => 0.0183300661017392,
74             'ha' => 0.0182008319824622,
75             'wi' => 0.0181969419922498,
76             'wh' => 0.0156276034569911,
77             'be' => 0.0143957732230795,
78             'Th' => 0.0133469886397158,
79             'de' => 0.0131989529010791,
80             'ar' => 0.0122294808959339,
81             'al' => 0.012083174041836,
82             'Co' => 0.0119249811065336,
83             'ma' => 0.0118707373541281,
84             'no' => 0.0116243713073457,
85             'Eu' => 0.0114746066841702,
86             'po' => 0.0101749177321098,
87             };
88              
89             ${Lingua::Identify::languages{'prefixes3'}{'en'}} = {
90             'tha' => 0.033426693062962,
91             'pro' => 0.0190548257157897,
92             'the' => 0.018297267296821,
93             'thi' => 0.0174839219096881,
94             'con' => 0.0166794452200581,
95             'Eur' => 0.0151852127343053,
96             'wit' => 0.0132609914631634,
97             'hav' => 0.0124153182431969,
98             'com' => 0.0110601240473302,
99             'Com' => 0.00998357860526858,
100             'whi' => 0.00908126015608908,
101             'wil' => 0.00896053143524134,
102             'int' => 0.00843212871627034,
103             'res' => 0.00803933124299087,
104             'imp' => 0.00763051289680269,
105             'cou' => 0.00747688416908887,
106             'sho' => 0.00681230403039388,
107             'Pre' => 0.00655310919369235,
108             'par' => 0.00635256219531733,
109             'wor' => 0.0061328473668551,
110             };
111              
112             ${Lingua::Identify::languages{'prefixes4'}{'en'}} = {
113             'Euro' => 0.0198695043275931,
114             'Comm' => 0.0130219439034349,
115             'whic' => 0.0110534973226175,
116             'Pres' => 0.0085832898486506,
117             'inte' => 0.00763766355002265,
118             'woul' => 0.00719985257462747,
119             'shou' => 0.00714763311515942,
120             'poli' => 0.00710373849705584,
121             'Memb' => 0.00689750947234507,
122             'ther' => 0.00688048138773592,
123             'comp' => 0.00650813393761591,
124             'coun' => 0.00647521297403823,
125             'Stat' => 0.00640710063560164,
126             'cont' => 0.00616416662851114,
127             'cons' => 0.00611724479536594,
128             'Unio' => 0.00577138547686016,
129             'comm' => 0.00553374909609251,
130             'repo' => 0.00551331539456153,
131             'impo' => 0.00548228644038487,
132             'part' => 0.00541493090570868,
133             };
134              
135             ${Lingua::Identify::languages{'suffixes1'}{'en'}} = {
136             'e' => 0.215404337364344,
137             's' => 0.132237835677075,
138             't' => 0.108556098594789,
139             'n' => 0.106317375561167,
140             'd' => 0.0817060678819144,
141             'y' => 0.0592910968846893,
142             'r' => 0.0555547227613847,
143             'o' => 0.0500687916702204,
144             'f' => 0.0418268862141837,
145             'l' => 0.0381420304613134,
146             'g' => 0.0295515575691944,
147             'h' => 0.0229155090109765,
148             'm' => 0.0123532092584887,
149             'w' => 0.00823484106410419,
150             'k' => 0.00724565389131691,
151             'a' => 0.00670617557081579,
152             'p' => 0.00497832868548035,
153             'c' => 0.00488890382174988,
154             'u' => 0.00275356213348082,
155             'U' => 0.00255799908852114,
156             };
157              
158             ${Lingua::Identify::languages{'suffixes2'}{'en'}} = {
159             'he' => 0.0984437952904326,
160             'nd' => 0.0455569533233677,
161             'on' => 0.0413252538944018,
162             'ng' => 0.0365448447544843,
163             'es' => 0.0350476171540616,
164             'ed' => 0.0348029777713136,
165             're' => 0.028900080156137,
166             'nt' => 0.0282508781192332,
167             'at' => 0.0280336850276592,
168             'er' => 0.0279316799140045,
169             'al' => 0.0239294919907616,
170             'ly' => 0.019966420435255,
171             've' => 0.019406472872799,
172             'an' => 0.0184045751886824,
173             'ts' => 0.0180425867027258,
174             'or' => 0.0179098936099631,
175             'll' => 0.0156525982452959,
176             'se' => 0.0155363297047319,
177             'is' => 0.0153794320087292,
178             'en' => 0.0151929268962632,
179             };
180              
181             ${Lingua::Identify::languages{'suffixes3'}{'en'}} = {
182             'ion' => 0.04985545391476,
183             'ing' => 0.0456096182867606,
184             'hat' => 0.0352148880322135,
185             'ent' => 0.029132938054743,
186             'his' => 0.0174090418189491,
187             'ons' => 0.0131014111302631,
188             'ies' => 0.0125438251428653,
189             'ave' => 0.0123976340502228,
190             'uld' => 0.0120703490991796,
191             'ted' => 0.0116137522618852,
192             'ean' => 0.011505038729196,
193             'ith' => 0.0113179370176731,
194             'ity' => 0.0110924994814651,
195             'ill' => 0.010091476715993,
196             'ate' => 0.00951472281625267,
197             'nce' => 0.00930273142750881,
198             'ere' => 0.00927040345594599,
199             'ive' => 0.00909102612700888,
200             'ich' => 0.00847393378487594,
201             'ers' => 0.00840727522404286,
202             };
203              
204             ${Lingua::Identify::languages{'suffixes4'}{'en'}} = {
205             'tion' => 0.043447396134284,
206             'ment' => 0.0215948509592771,
207             'ions' => 0.0163236609077118,
208             'ould' => 0.0159641755847407,
209             'pean' => 0.0142515118249859,
210             'sion' => 0.0135945996979566,
211             'ting' => 0.0117653870124386,
212             'hich' => 0.0110664718634622,
213             'port' => 0.00964518041811549,
214             'ther' => 0.00915779400128734,
215             'mber' => 0.00844487784499523,
216             'tive' => 0.00838395454289171,
217             'dent' => 0.00814896466334956,
218             'here' => 0.00805549847937708,
219             'ents' => 0.00732820291016613,
220             'ates' => 0.00726538758004698,
221             'ally' => 0.00695395976867309,
222             'onal' => 0.00681130085629404,
223             'ding' => 0.00676854102314064,
224             'nion' => 0.00676135131668122,
225             };
226              
227             ${Lingua::Identify::languages{'smallwords'}{'en'}} = {
228             'the' => 0.0701104399345048,
229             'of' => 0.0365143240841526,
230             'to' => 0.0329557853898738,
231             'and' => 0.0291434460137306,
232             'in' => 0.0219181203028555,
233             'that' => 0.016723699654538,
234             'is' => 0.0164339272224879,
235             'a' => 0.016432928007205,
236             'for' => 0.0114395161666371,
237             'I' => 0.0104373032378572,
238             'on' => 0.0102784280078712,
239             'we' => 0.00844420182017056,
240             'be' => 0.00829931560414554,
241             'this' => 0.00787215107069248,
242             'are' => 0.00718569017131879,
243             'have' => 0.0068547833767881,
244             'not' => 0.00631154333463453,
245             'with' => 0.00629389053130275,
246             'it' => 0.00629355745954177,
247             'as' => 0.00627990151734171,
248             };
249              
250             ${Lingua::Identify::languages{'ngrams1'}{'en'}} = {
251             'e' => 0.125890889211489,
252             't' => 0.0989762624225809,
253             'o' => 0.0802197780766555,
254             'i' => 0.0800499358147479,
255             'a' => 0.0775778139473822,
256             'n' => 0.0745558602611499,
257             's' => 0.0644019685963574,
258             'r' => 0.0631647956817092,
259             'h' => 0.0453599617533292,
260             'l' => 0.0389057847268491,
261             'c' => 0.0327976561767857,
262             'd' => 0.0320229304845271,
263             'u' => 0.0298258271709914,
264             'm' => 0.0279955749316243,
265             'p' => 0.0247245032943548,
266             'f' => 0.0213395305914346,
267             'g' => 0.0178665232108577,
268             'w' => 0.0157363098292377,
269             'y' => 0.0143180721986317,
270             'b' => 0.0137603025464125,
271             };
272              
273             ${Lingua::Identify::languages{'ngrams2'}{'en'}} = {
274             'th' => 0.0370351591712443,
275             'he' => 0.0267079287024732,
276             'in' => 0.0232758770962344,
277             'on' => 0.020911717392357,
278             're' => 0.0204802307001167,
279             'an' => 0.0193096858540155,
280             'at' => 0.0169485820658636,
281             'er' => 0.0164712566377395,
282             'en' => 0.0159675900768821,
283             'ti' => 0.0155715261824188,
284             'es' => 0.0141409272121763,
285             'is' => 0.014120913116227,
286             'or' => 0.0128245592325778,
287             'nt' => 0.012530803953322,
288             'it' => 0.0123146517170695,
289             'nd' => 0.0121674512694425,
290             'io' => 0.0115121510311026,
291             'te' => 0.0112025996804201,
292             'al' => 0.0111979512452319,
293             'to' => 0.0110733473575475,
294             };
295              
296             ${Lingua::Identify::languages{'ngrams3'}{'en'}} = {
297             'the' => 0.0321360300483628,
298             'ion' => 0.0141982828884038,
299             'and' => 0.0114744529132272,
300             'ent' => 0.00983327004982701,
301             'ing' => 0.00980854186195337,
302             'tio' => 0.00970664566319795,
303             'hat' => 0.00711385787155594,
304             'tha' => 0.00707340921157701,
305             'ati' => 0.00687288713125596,
306             'for' => 0.00643827918892921,
307             'men' => 0.00600200740101467,
308             'res' => 0.0051133991091656,
309             'com' => 0.0048660598564434,
310             'pro' => 0.00473823061611284,
311             'thi' => 0.00473662414451084,
312             'ate' => 0.00473582090870984,
313             'con' => 0.00442410804393608,
314             'ons' => 0.0041405658061831,
315             'ope' => 0.00407114328338239,
316             'her' => 0.00394245343326505,
317             };
318              
319             ${Lingua::Identify::languages{'ngrams4'}{'en'}} = {
320             'tion' => 0.0131262017745609,
321             'that' => 0.00865535437089381,
322             'atio' => 0.00726512703095898,
323             'ment' => 0.00678617461517829,
324             'this' => 0.00475554759210813,
325             'euro' => 0.00423855704415438,
326             'port' => 0.00420825150969207,
327             'rope' => 0.00419778516531591,
328             'ther' => 0.00405555223166675,
329             'urop' => 0.004055317910524,
330             'comm' => 0.00396596344808873,
331             'sion' => 0.00394612425800257,
332             'with' => 0.00371625521696498,
333             'ions' => 0.00342108868414775,
334             'ould' => 0.00330463107620108,
335             'have' => 0.00326932669069344,
336             'opea' => 0.00301524446490502,
337             'pean' => 0.00301516635785744,
338             'pres' => 0.00290159871067134,
339             'ssio' => 0.00276311491530619,
340             };