File Coverage

blib/lib/Lingua/KAZ/Word2Num.pm
Criterion Covered Total %
statement 23 38 60.5
branch 0 6 0.0
condition 2 4 50.0
subroutine 9 11 81.8
pod 4 4 100.0
total 38 63 60.3


line stmt bran cond sub pod time code
1             # For Emacs: -*- mode:cperl; eval: (folding-mode 1); coding:utf-8 -*-
2             package Lingua::KAZ::Word2Num;
3             # ABSTRACT: Word to number conversion in Kazakh
4              
5 1     1   101863 use 5.16.0;
  1         5  
6 1     1   4 use utf8;
  1         3  
  1         13  
7 1     1   23 use warnings;
  1         1  
  1         215  
8              
9             # {{{ use block
10              
11 1     1   537 use Export::Attrs;
  1         9405  
  1         7  
12 1     1   1235 use Parse::RecDescent;
  1         35916  
  1         7  
13              
14             # }}}
15             # {{{ var block
16             our $VERSION = '0.2603300';
17             my $parser = kaz_numerals();
18              
19             # }}}
20              
21             # {{{ w2n convert text to number
22              
23             sub w2n :Export {
24 15   100 15 1 595230 my $input = shift // return;
25              
26 14         198 return $parser->numeral($input);
27 1     1   126 }
  1         1  
  1         9  
28              
29             # }}}
30             # {{{ kaz_numerals create parser for kazakh numerals
31              
32             sub kaz_numerals {
33 1     1 1 4 return Parse::RecDescent->new(q{
34            
35              
36             numeral: mega
37             | kOhOd
38             | { }
39              
40             number: 'нөл' { 0 }
41             | 'бір' { 1 }
42             | 'екі' { 2 }
43             | 'үш' { 3 }
44             | 'төрт' { 4 }
45             | 'бес' { 5 }
46             | 'алты' { 6 }
47             | 'жеті' { 7 }
48             | 'сегіз' { 8 }
49             | 'тоғыз' { 9 }
50              
51             tens: 'он' { 10 }
52             | 'жиырма' { 20 }
53             | 'отыз' { 30 }
54             | 'қырық' { 40 }
55             | 'елу' { 50 }
56             | 'алпыс' { 60 }
57             | 'жетпіс' { 70 }
58             | 'сексен' { 80 }
59             | 'тоқсан' { 90 }
60              
61             deca: tens number { $item[1] + $item[2] }
62             | tens
63             | number
64              
65             hecto: number 'жүз' deca { $item[1] * 100 + $item[3] }
66             | number 'жүз' { $item[1] * 100 }
67             | 'жүз' deca { 100 + $item[2] }
68             | 'жүз' { 100 }
69              
70             hOd: hecto
71             | deca
72              
73             kilo: hOd 'мың' hOd { $item[1] * 1000 + $item[3] }
74             | hOd 'мың' { $item[1] * 1000 }
75             | 'мың' hOd { 1000 + $item[2] }
76             | 'мың' { 1000 }
77              
78             kOhOd: kilo
79             | hOd
80              
81             mega: hOd 'миллион' kOhOd { $item[1] * 1_000_000 + $item[3] }
82             | hOd 'миллион' { $item[1] * 1_000_000 }
83             });
84             }
85              
86             # }}}
87              
88             # {{{ capabilities declare supported features
89              
90             sub capabilities {
91             return {
92 0     0 1   w2n => 1,
93             };
94             }
95              
96             # }}}
97             # {{{ ordinal2cardinal convert ordinal text to cardinal text
98              
99             sub ordinal2cardinal :Export {
100 0   0 0 1   my $input = shift // return;
101              
102             # Known cardinal words (from parser vocabulary).
103 0           state $cardinals = { map { $_ => 1 } qw(
  0            
104             нөл бір екі үш төрт бес алты жеті сегіз тоғыз
105             он жиырма отыз қырық елу алпыс жетпіс сексен тоқсан
106             жүз мың миллион
107             )};
108              
109             # Kazakh ordinal suffixes (Cyrillic, 2-way vowel harmony).
110             # After vowel-final stem: -ншы (back) -нші (front)
111             # After consonant-final stem: -ыншы (back) -інші (front)
112 0           my @harmony = (
113             [ 'ншы', 'ыншы' ],
114             [ 'нші', 'інші' ],
115             );
116              
117 0           for my $pair (@harmony) {
118 0           my ($short, $long) = @{$pair};
  0            
119              
120 0           for my $suffix ($long, $short) {
121 0 0         next unless $input =~ /\Q$suffix\E\z/xms;
122 0           my $candidate = $input =~ s/\Q$suffix\E\z//xmsr;
123 0 0         next unless length $candidate;
124              
125 0           my ($last_word) = $candidate =~ /(\S+)\z/xms;
126 0 0         return $candidate if exists $cardinals->{$last_word};
127             }
128             }
129              
130 0           return; # not an ordinal
131 1     1   553 }
  1         2  
  1         5  
132              
133             # }}}
134              
135             1;
136              
137             __END__