File Coverage

blib/lib/Lingua/LO/NLP/Romanize/IPA.pm
Criterion Covered Total %
statement 41 41 100.0
branch 4 4 100.0
condition n/a
subroutine 14 14 100.0
pod 2 2 100.0
total 61 61 100.0


line stmt bran cond sub pod time code
1             package Lingua::LO::NLP::Romanize::IPA;
2 1     1   6 use strict;
  1         2  
  1         30  
3 1     1   4 use warnings;
  1         2  
  1         20  
4 1     1   14 use 5.012000;
  1         3  
5 1     1   4 use utf8;
  1         2  
  1         4  
6 1     1   22 use feature qw/ unicode_strings say /;
  1         1  
  1         84  
7 1     1   7 use charnames qw/ :full lao /;
  1         2  
  1         5  
8 1     1   478 use version 0.77; our $VERSION = version->declare('v1.0.1');
  1         15  
  1         6  
9 1     1   81 use Carp;
  1         1  
  1         54  
10 1     1   290 use Lingua::LO::NLP::Analyze;
  1         3  
  1         6  
11 1     1   50 use parent 'Lingua::LO::NLP::Romanize::PCGN';
  1         2  
  1         5  
12              
13             =encoding utf8
14              
15             =head1 NAME
16              
17             Lingua::LO::NLP::Romanize::IPA - Convert Lao syllables to the International Phonetic Alphabet
18              
19             =head1 FUNCTION
20              
21             This class is not supposed to be used directly. Rather use
22             L as a factory:
23              
24             my $o = Lingua::LO::NLP::Romanize->new(variant => 'IPA');
25              
26             =cut
27              
28             my %CONSONANTS = (
29             'ກ' => 'k',
30             'ຂ' => 'kʰ',
31             'ຄ' => 'kʰ',
32             'ງ' => 'ŋ',
33             'ຈ' => 'tɕ',
34             'ສ' => 's',
35             'ຊ' => 's',
36             'ຍ' => 'ɲ',
37             'ດ' => [qw/ d t /],
38             'ຕ' => 't',
39             'ຖ' => 'tʰ',
40             'ທ' => 'tʰ',
41             'ນ' => 'n',
42             'ບ' => [qw/ b p /],
43             'ປ' => 'p',
44             'ຜ' => 'pʰ',
45             'ຝ' => 'f',
46             'ພ' => 'pʰ',
47             'ຟ' => 'f',
48             'ມ' => 'm',
49             'ຢ' => 'j',
50             'ລ' => 'l',
51             "\N{LAO SEMIVOWEL SIGN LO}" => 'l',
52             'ວ' => [qw/ ʋ w /],
53             'ຫ' => 'h',
54             'ອ' => 'ʔ',
55             'ຮ' => 'h',
56             'ຣ' => 'r',
57             'ໜ' => 'n',
58             'ໝ' => 'm',
59             'ຫຼ' => 'l',
60             'ຫຍ' => 'ɲ',
61             'ຫນ' => 'n',
62             'ຫມ' => 'm',
63             'ຫຣ' => 'r',
64             'ຫລ' => 'l',
65             'ຫວ' => 'ʋ',
66             );
67              
68             my %VOWELS = (
69             ### Monophthongs
70             'Xະ' => 'aʔ',
71             'Xັ' => 'a',
72             'Xາ' => 'aː',
73             'Xາວ' => 'aːo',
74              
75             'Xິ' => 'i',
76             'Xີ' => 'iː',
77             'Xິວ' => 'iu', # TODO correct?
78             'Xີວ' => 'iːu', # TODO correct?
79              
80             'Xຶ' => 'ɯ',
81             'Xື' => 'ɯː',
82              
83             'Xຸ' => 'u',
84             'Xູ' => 'uː',
85              
86             'ເXະ' => 'eʔ',
87             'ເXັ' => 'e',
88             'ເX' => 'eː',
89              
90             'ແXະ' => 'ɛʔ',
91             'ແXັ' => 'ɛ',
92             'ແX' => 'ɛː',
93             'ແXວ' => 'ɛːo',
94              
95             'ໂXະ' => 'oʔ',
96             'Xົ' => 'o',
97             'ໂX' => 'oː',
98             'ໂXຍ' => 'oːi',
99              
100             'ເXາະ' => 'ɔʔ',
101             'Xັອ' => 'ɔ',
102             'Xໍ' => 'ɔː',
103             'Xອ' => 'ɔː',
104             'Xອຍ' => 'ɔːi',
105              
106             'ເXິ' => 'ɤ',
107             'ເXີ' => 'ɤː',
108              
109             'ເXັຍ' => 'iə',
110             'Xັຽ' => 'iə',
111             'ເXຍ' => 'iːə',
112             'Xຽ' => 'iːə',
113             'Xຽວ' => 'iːəo', # TODO correct?
114              
115             'ເXີຍ' => 'ɤːi',
116             'ເXິຍ' => 'ɤi',
117              
118             'ເXຶອ' => 'ɯə',
119             'ເXືອ' => 'ɯːə',
120             'ເXືອຍ' => 'ɯːəi',
121              
122             'Xົວະ' => 'uəʔ',
123             'Xົວ' => 'uːə',
124             'Xວຍ' => 'uːəi',
125              
126             'ໄX' => 'aj',
127             'ໃX' => 'aj',
128             'Xາຍ' => 'aːj',
129             'Xັຍ' => 'aj',
130              
131             'ເXົາ' => 'aw',
132             'Xຳ' => 'am', # composed U+0EB3
133             'Xໍາ' => 'am',
134             );
135             {
136             # Replace "X" in %VOWELS keys with DOTTED CIRCLE. Makes code easier to edit.
137             my %v;
138             foreach my $v (keys %VOWELS) {
139             (my $w = $v) =~ s/X/\N{DOTTED CIRCLE}/;
140             $v{$w} = $VOWELS{$v};
141             }
142             %VOWELS = %v;
143             }
144              
145             my %TONE_DIACRITICS = (
146             LOW => "\N{COMBINING GRAVE ACCENT}",
147             MID => "\N{COMBINING MACRON}", MID_STOP => "\N{COMBINING MACRON}",
148             HIGH => "\N{COMBINING ACUTE ACCENT}", HIGH_STOP => "\N{COMBINING ACUTE ACCENT}",
149             RISING => "\N{COMBINING CARON}",
150             HIGH_FALLING => "\N{COMBINING CIRCUMFLEX ACCENT}",
151             MID_FALLING => "\N{COMBINING CIRCUMFLEX ACCENT BELOW}",
152             );
153              
154             =head2 new
155              
156             You don't call this constructor directly but via L.
157             It adds the following attribute:
158              
159             =over 4
160              
161             =item C: boolean indicating whether to add dicacritics for tone
162              
163             =back
164              
165             =cut
166              
167             sub new {
168 2     2 1 7 my ($class, %args) = @_;
169 2         5 my $self = bless {}, $class;
170 2 100       18 $self->{romanize_vowel} = $args{tone} ? \&_vowel_with_tone : \&_vowel_without_tone;
171 2         8 return $self;
172             }
173              
174             sub _vowel_with_tone {
175 14     14   60 my ($lao_vowel, $tone) = @_;
176 14         21 my $vowel = $VOWELS{ $lao_vowel };
177             # Insert tone diacritic after first character
178 14         44 substr($vowel, 1, 0) = $TONE_DIACRITICS{ $tone };
179 14         34 return $vowel;
180             }
181              
182 14     14   69 sub _vowel_without_tone { return $VOWELS{ $_[0] } }
183              
184             =head2 romanize_consonant
185              
186             Overrides L to access
187             module-local data.
188              
189             =cut
190              
191             sub romanize_consonant {
192 36     36 1 62 my (undef, $cons, $position) = @_;
193 36         57 my $consdata = $CONSONANTS{ $cons };
194 36 100       90 return ref $consdata ? $consdata->[$position] : $consdata;
195             }
196              
197             1;
198