File Coverage

blib/lib/Pod/Escapes.pm
Criterion Covered Total %
statement 29 32 90.6
branch 16 22 72.7
condition 3 12 25.0
subroutine 6 6 100.0
pod 2 2 100.0
total 56 74 75.6


line stmt bran cond sub pod time code
1             package Pod::Escapes;
2 3     3   18900 use strict;
  3         6  
  3         116  
3 3     3   14 use warnings;
  3         6  
  3         99  
4 3     3   49 use 5.006;
  3         11  
  3         141  
5              
6 3         4647 use vars qw(
7             %Code2USASCII
8             %Name2character
9             %Name2character_number
10             %Latin1Code_to_fallback
11             %Latin1Char_to_fallback
12             $FAR_CHAR
13             $FAR_CHAR_NUMBER
14             $NOT_ASCII
15             @ISA $VERSION @EXPORT_OK %EXPORT_TAGS
16 3     3   16 );
  3         6  
17              
18             require Exporter;
19             @ISA = ('Exporter');
20             $VERSION = '1.07';
21             @EXPORT_OK = qw(
22             %Code2USASCII
23             %Name2character
24             %Name2character_number
25             %Latin1Code_to_fallback
26             %Latin1Char_to_fallback
27             e2char
28             e2charnum
29             );
30             %EXPORT_TAGS = ('ALL' => \@EXPORT_OK);
31              
32             #==========================================================================
33              
34             $FAR_CHAR = "?" unless defined $FAR_CHAR;
35             $FAR_CHAR_NUMBER = ord($FAR_CHAR) unless defined $FAR_CHAR_NUMBER;
36              
37             $NOT_ASCII = 'A' ne chr(65) unless defined $NOT_ASCII;
38              
39             #--------------------------------------------------------------------------
40             sub e2char {
41 61     61 1 1218 my $in = $_[0];
42 61 50 33     539 return undef unless defined $in and length $in;
43            
44             # Convert to decimal:
45 61 100       282 if($in =~ m/^(0[0-7]*)$/s ) {
    100          
46 12         21 $in = oct $in;
47             } elsif($in =~ m/^0?x([0-9a-fA-F]+)$/s ) {
48 23         52 $in = hex $1;
49             } # else it's decimal, or named
50              
51 61 100       212 if($in =~ m/^\d+$/s) {
52 40 50 33     144 if($] < 5.007 and $in > 255) { # can't be trusted with Unicode
    50          
    0          
53 0         0 return $FAR_CHAR;
54             } elsif ($] >= 5.007003) {
55 40         272 return chr(utf8::unicode_to_native($in));
56             } elsif ($NOT_ASCII) {
57 0   0     0 return $Code2USASCII{$in} # so "65" => "A" everywhere
58             || $Latin1Code_to_fallback{$in} # Fallback.
59             || $FAR_CHAR; # Fall further back
60             } else {
61 0         0 return chr($in);
62             }
63             } else {
64 21         113 return $Name2character{$in}; # returns undef if unknown
65             }
66             }
67              
68             #--------------------------------------------------------------------------
69             sub e2charnum {
70 56     56 1 1200 my $in = $_[0];
71 56 50 33     210 return undef unless defined $in and length $in;
72            
73             # Convert to decimal:
74 56 100       198 if($in =~ m/^(0[0-7]*)$/s ) {
    100          
75 12         14 $in = oct $in;
76             } elsif($in =~ m/^0?x([0-9a-fA-F]+)$/s ) {
77 17         30 $in = hex $1;
78             } # else it's decimal, or named
79              
80 56 100       136 if($in =~ m/^[0-9]+$/s) {
81 34         130 return 0 + $in;
82             } else {
83 22         127 return $Name2character_number{$in}; # returns undef if unknown
84             }
85             }
86              
87             #--------------------------------------------------------------------------
88              
89             %Code2USASCII = (
90             # mostly generated by
91             # perl -e "printf qq{ \x25 3s, '\x25s',\n}, $_, chr($_) foreach (32 .. 126)"
92             32, ' ',
93             33, '!',
94             34, '"',
95             35, '#',
96             36, '$',
97             37, '%',
98             38, '&',
99             39, "'", #!
100             40, '(',
101             41, ')',
102             42, '*',
103             43, '+',
104             44, ',',
105             45, '-',
106             46, '.',
107             47, '/',
108             48, '0',
109             49, '1',
110             50, '2',
111             51, '3',
112             52, '4',
113             53, '5',
114             54, '6',
115             55, '7',
116             56, '8',
117             57, '9',
118             58, ':',
119             59, ';',
120             60, '<',
121             61, '=',
122             62, '>',
123             63, '?',
124             64, '@',
125             65, 'A',
126             66, 'B',
127             67, 'C',
128             68, 'D',
129             69, 'E',
130             70, 'F',
131             71, 'G',
132             72, 'H',
133             73, 'I',
134             74, 'J',
135             75, 'K',
136             76, 'L',
137             77, 'M',
138             78, 'N',
139             79, 'O',
140             80, 'P',
141             81, 'Q',
142             82, 'R',
143             83, 'S',
144             84, 'T',
145             85, 'U',
146             86, 'V',
147             87, 'W',
148             88, 'X',
149             89, 'Y',
150             90, 'Z',
151             91, '[',
152             92, "\\", #!
153             93, ']',
154             94, '^',
155             95, '_',
156             96, '`',
157             97, 'a',
158             98, 'b',
159             99, 'c',
160             100, 'd',
161             101, 'e',
162             102, 'f',
163             103, 'g',
164             104, 'h',
165             105, 'i',
166             106, 'j',
167             107, 'k',
168             108, 'l',
169             109, 'm',
170             110, 'n',
171             111, 'o',
172             112, 'p',
173             113, 'q',
174             114, 'r',
175             115, 's',
176             116, 't',
177             117, 'u',
178             118, 'v',
179             119, 'w',
180             120, 'x',
181             121, 'y',
182             122, 'z',
183             123, '{',
184             124, '|',
185             125, '}',
186             126, '~',
187             );
188              
189             #--------------------------------------------------------------------------
190              
191             %Latin1Code_to_fallback = ();
192             @Latin1Code_to_fallback{0xA0 .. 0xFF} = (
193             # Copied from Text/Unidecode/x00.pm:
194              
195             ' ', qq{!}, qq{C/}, 'PS', qq{\$?}, qq{Y=}, qq{|}, 'SS', qq{"}, qq{(c)}, 'a', qq{<<}, qq{!}, "", qq{(r)}, qq{-},
196             'deg', qq{+-}, '2', '3', qq{'}, 'u', 'P', qq{*}, qq{,}, '1', 'o', qq{>>}, qq{1/4}, qq{1/2}, qq{3/4}, qq{?},
197             'A', 'A', 'A', 'A', 'A', 'A', 'AE', 'C', 'E', 'E', 'E', 'E', 'I', 'I', 'I', 'I',
198             'D', 'N', 'O', 'O', 'O', 'O', 'O', 'x', 'O', 'U', 'U', 'U', 'U', 'U', 'Th', 'ss',
199             'a', 'a', 'a', 'a', 'a', 'a', 'ae', 'c', 'e', 'e', 'e', 'e', 'i', 'i', 'i', 'i',
200             'd', 'n', 'o', 'o', 'o', 'o', 'o', qq{/}, 'o', 'u', 'u', 'u', 'u', 'y', 'th', 'y',
201              
202             );
203              
204             {
205             # Now stuff %Latin1Char_to_fallback:
206             %Latin1Char_to_fallback = ();
207             my($k,$v);
208             while( ($k,$v) = each %Latin1Code_to_fallback) {
209             $Latin1Char_to_fallback{chr $k} = $v;
210             #print chr($k), ' => ', $v, "\n";
211             }
212             }
213              
214             #--------------------------------------------------------------------------
215              
216             %Name2character_number = (
217             # General XML/XHTML:
218             'lt' => 60,
219             'gt' => 62,
220             'quot' => 34,
221             'amp' => 38,
222             'apos' => 39,
223              
224             # POD-specific:
225             'sol' => 47,
226             'verbar' => 124,
227              
228             'lchevron' => 171, # legacy for laquo
229             'rchevron' => 187, # legacy for raquo
230              
231             # Remember, grave looks like \ (as in virtu\)
232             # acute looks like / (as in re/sume/)
233             # circumflex looks like ^ (as in papier ma^che/)
234             # umlaut/dieresis looks like " (as in nai"ve, Chloe")
235              
236             # From the XHTML 1 .ent files:
237             'nbsp' , 160,
238             'iexcl' , 161,
239             'cent' , 162,
240             'pound' , 163,
241             'curren' , 164,
242             'yen' , 165,
243             'brvbar' , 166,
244             'sect' , 167,
245             'uml' , 168,
246             'copy' , 169,
247             'ordf' , 170,
248             'laquo' , 171,
249             'not' , 172,
250             'shy' , 173,
251             'reg' , 174,
252             'macr' , 175,
253             'deg' , 176,
254             'plusmn' , 177,
255             'sup2' , 178,
256             'sup3' , 179,
257             'acute' , 180,
258             'micro' , 181,
259             'para' , 182,
260             'middot' , 183,
261             'cedil' , 184,
262             'sup1' , 185,
263             'ordm' , 186,
264             'raquo' , 187,
265             'frac14' , 188,
266             'frac12' , 189,
267             'frac34' , 190,
268             'iquest' , 191,
269             'Agrave' , 192,
270             'Aacute' , 193,
271             'Acirc' , 194,
272             'Atilde' , 195,
273             'Auml' , 196,
274             'Aring' , 197,
275             'AElig' , 198,
276             'Ccedil' , 199,
277             'Egrave' , 200,
278             'Eacute' , 201,
279             'Ecirc' , 202,
280             'Euml' , 203,
281             'Igrave' , 204,
282             'Iacute' , 205,
283             'Icirc' , 206,
284             'Iuml' , 207,
285             'ETH' , 208,
286             'Ntilde' , 209,
287             'Ograve' , 210,
288             'Oacute' , 211,
289             'Ocirc' , 212,
290             'Otilde' , 213,
291             'Ouml' , 214,
292             'times' , 215,
293             'Oslash' , 216,
294             'Ugrave' , 217,
295             'Uacute' , 218,
296             'Ucirc' , 219,
297             'Uuml' , 220,
298             'Yacute' , 221,
299             'THORN' , 222,
300             'szlig' , 223,
301             'agrave' , 224,
302             'aacute' , 225,
303             'acirc' , 226,
304             'atilde' , 227,
305             'auml' , 228,
306             'aring' , 229,
307             'aelig' , 230,
308             'ccedil' , 231,
309             'egrave' , 232,
310             'eacute' , 233,
311             'ecirc' , 234,
312             'euml' , 235,
313             'igrave' , 236,
314             'iacute' , 237,
315             'icirc' , 238,
316             'iuml' , 239,
317             'eth' , 240,
318             'ntilde' , 241,
319             'ograve' , 242,
320             'oacute' , 243,
321             'ocirc' , 244,
322             'otilde' , 245,
323             'ouml' , 246,
324             'divide' , 247,
325             'oslash' , 248,
326             'ugrave' , 249,
327             'uacute' , 250,
328             'ucirc' , 251,
329             'uuml' , 252,
330             'yacute' , 253,
331             'thorn' , 254,
332             'yuml' , 255,
333              
334             'fnof' , 402,
335             'Alpha' , 913,
336             'Beta' , 914,
337             'Gamma' , 915,
338             'Delta' , 916,
339             'Epsilon' , 917,
340             'Zeta' , 918,
341             'Eta' , 919,
342             'Theta' , 920,
343             'Iota' , 921,
344             'Kappa' , 922,
345             'Lambda' , 923,
346             'Mu' , 924,
347             'Nu' , 925,
348             'Xi' , 926,
349             'Omicron' , 927,
350             'Pi' , 928,
351             'Rho' , 929,
352             'Sigma' , 931,
353             'Tau' , 932,
354             'Upsilon' , 933,
355             'Phi' , 934,
356             'Chi' , 935,
357             'Psi' , 936,
358             'Omega' , 937,
359             'alpha' , 945,
360             'beta' , 946,
361             'gamma' , 947,
362             'delta' , 948,
363             'epsilon' , 949,
364             'zeta' , 950,
365             'eta' , 951,
366             'theta' , 952,
367             'iota' , 953,
368             'kappa' , 954,
369             'lambda' , 955,
370             'mu' , 956,
371             'nu' , 957,
372             'xi' , 958,
373             'omicron' , 959,
374             'pi' , 960,
375             'rho' , 961,
376             'sigmaf' , 962,
377             'sigma' , 963,
378             'tau' , 964,
379             'upsilon' , 965,
380             'phi' , 966,
381             'chi' , 967,
382             'psi' , 968,
383             'omega' , 969,
384             'thetasym' , 977,
385             'upsih' , 978,
386             'piv' , 982,
387             'bull' , 8226,
388             'hellip' , 8230,
389             'prime' , 8242,
390             'Prime' , 8243,
391             'oline' , 8254,
392             'frasl' , 8260,
393             'weierp' , 8472,
394             'image' , 8465,
395             'real' , 8476,
396             'trade' , 8482,
397             'alefsym' , 8501,
398             'larr' , 8592,
399             'uarr' , 8593,
400             'rarr' , 8594,
401             'darr' , 8595,
402             'harr' , 8596,
403             'crarr' , 8629,
404             'lArr' , 8656,
405             'uArr' , 8657,
406             'rArr' , 8658,
407             'dArr' , 8659,
408             'hArr' , 8660,
409             'forall' , 8704,
410             'part' , 8706,
411             'exist' , 8707,
412             'empty' , 8709,
413             'nabla' , 8711,
414             'isin' , 8712,
415             'notin' , 8713,
416             'ni' , 8715,
417             'prod' , 8719,
418             'sum' , 8721,
419             'minus' , 8722,
420             'lowast' , 8727,
421             'radic' , 8730,
422             'prop' , 8733,
423             'infin' , 8734,
424             'ang' , 8736,
425             'and' , 8743,
426             'or' , 8744,
427             'cap' , 8745,
428             'cup' , 8746,
429             'int' , 8747,
430             'there4' , 8756,
431             'sim' , 8764,
432             'cong' , 8773,
433             'asymp' , 8776,
434             'ne' , 8800,
435             'equiv' , 8801,
436             'le' , 8804,
437             'ge' , 8805,
438             'sub' , 8834,
439             'sup' , 8835,
440             'nsub' , 8836,
441             'sube' , 8838,
442             'supe' , 8839,
443             'oplus' , 8853,
444             'otimes' , 8855,
445             'perp' , 8869,
446             'sdot' , 8901,
447             'lceil' , 8968,
448             'rceil' , 8969,
449             'lfloor' , 8970,
450             'rfloor' , 8971,
451             'lang' , 9001,
452             'rang' , 9002,
453             'loz' , 9674,
454             'spades' , 9824,
455             'clubs' , 9827,
456             'hearts' , 9829,
457             'diams' , 9830,
458             'OElig' , 338,
459             'oelig' , 339,
460             'Scaron' , 352,
461             'scaron' , 353,
462             'Yuml' , 376,
463             'circ' , 710,
464             'tilde' , 732,
465             'ensp' , 8194,
466             'emsp' , 8195,
467             'thinsp' , 8201,
468             'zwnj' , 8204,
469             'zwj' , 8205,
470             'lrm' , 8206,
471             'rlm' , 8207,
472             'ndash' , 8211,
473             'mdash' , 8212,
474             'lsquo' , 8216,
475             'rsquo' , 8217,
476             'sbquo' , 8218,
477             'ldquo' , 8220,
478             'rdquo' , 8221,
479             'bdquo' , 8222,
480             'dagger' , 8224,
481             'Dagger' , 8225,
482             'permil' , 8240,
483             'lsaquo' , 8249,
484             'rsaquo' , 8250,
485             'euro' , 8364,
486             );
487              
488              
489             # Fill out %Name2character...
490             {
491             %Name2character = ();
492             my($name, $number);
493             while( ($name, $number) = each %Name2character_number) {
494             if($] < 5.007 and $number > 255) {
495             $Name2character{$name} = $FAR_CHAR;
496             # substitute for Unicode characters, for perls
497             # that can't reliably handle them
498             } elsif ($] >= 5.007003) {
499             $Name2character{$name} = chr utf8::unicode_to_native($number);
500             # normal case for more recent Perls where we can translate from Unicode
501             # to the native character set.
502             }
503             elsif (exists $Code2USASCII{$number}) {
504             $Name2character{$name} = $Code2USASCII{$number};
505             # on older Perls, we can use the translations we have hard-coded in this
506             # file, but these don't include the non-ASCII-range characters
507             }
508             elsif ($NOT_ASCII && $number > 127 && $number < 256) {
509             # this range on old non-ASCII-platform perls is wrong
510             if (exists $Latin1Code_to_fallback{$number}) {
511             $Name2character{$name} = $Latin1Code_to_fallback{$number};
512             } else {
513             $Name2character{$name} = $FAR_CHAR;
514             }
515             } else {
516             $Name2character{$name} = chr $number;
517             }
518             }
519             }
520              
521             #--------------------------------------------------------------------------
522             1;
523             __END__