先日書いた「日本語と英語以外の言語がローソンの多機能コピー機で読めるかどうか」試してみました。
第1ラウンドはエスペラントの単語集。
...うーん、ぶっちゃけます。
だめだこりゃ。
えー、たとえば原文には次のような箇所があったわけですね。
(註:一部携帯電話では表示できない文字があります。
また「ヒリピン」は原文ママの表記です。おそらくこの本が刊行された1958年当時はそれでよかったのでしょう):
Ĉinujo [t∫i'nuːjo] 中国 ĉinoDanujo [da′ nuːjo] デンマーク dano
Egipto [e′ giːpto] エジプト egiptano
Filipinoj [fili'piːnoj] ヒリピン filipinano
Finnlando [fin′ lando] フィンランド finno
これをOCRくんは以下のように読みました:
Cinujo[t∫ ifnuxJO] 中国 ein。Danu」o[da′ nuX10] デンマーク dano
Egipto[e′ giXpto] エジプト egiptanoFilipinoj[fili'pix■ oj] ヒリピン nlipinanO
Finnlando[fin′ lando] フインランド Il■no
はい、ツィルコンフレクソつきの「Ĉ」「ĉ」がてんで読めてませんね。
この文例にはありませんが「ŭ」に至っては「tt」になってたりお豆腐になってたり...
まあ、この単語集、書体の相性が悪いのか文字が小さすぎるのか、日本語や英語と共通の屋根なしアルファベットも一部ちゃんと読まれてないのは確か。
そんなわけでもう少し大き目の文字を使った第2ラウンドを近々企画中。
ただ、文字の化け具合あたりからして、望み薄な気がしないでもないけど。汗