OCRで誤認識されやすい字(追加)
2016-11-22


(屏は異体字で、正式な字は〓なのに、〓を屏に変換してしまう)
衝 衙
式 弍
匂 句
句 旬
襞 襲
嘗 甞(甞は嘗の異体字)
〓 難(〓は鶏の異体字。現在は殆ど使われない)
動 勣

○片仮名
エ ヱ
ゲ グ
シ ツ
ン ツ
ソ ン特に誤認識が多い)
チ テ
ラ ヲ

○片仮名と平仮名(当然ながら似た形が多い)
ウ う
ヘ へ前者が片仮名、後者が平仮名。最も判別困難!)
モ も
リ り
レ し

○片仮名と漢字(片仮名には似た漢字が多く、特に注意が必要)
エ 工右は漢字の工(こう)
オ 才
カ 力右は漢字の力(ちから)
タ 夕右は漢字の夕(ゆう)
ト 卜右は漢字の卜(ぼく)
ニ 二右は漢数字の二)
ハ 八右は漢数字の八)
ミ 三
ロ 口右は漢字の口(くち)

○平仮名
き さ
か が(「き」「く」「こ」などはまず濁音と誤認識しないのに、「か」と「け」は時々誤認識する)
け げ(活字によって右側の「ナ」の部分のハネが強いので濁点と誤りやすいらしい)
け は
げ ば
は に(稀にある)
ば ぱ(濁点と半濁点の誤りは多い。ば行音すべてに当てはまる)
ば ぼ

○追加(2017.1.5、1.28、6.1)
風 虱
高 咼
雨 兩
爾 爽
雁 匯
〓 撫
蟠 幡
茣 莫 (茣蓙などは辞書登録されていないのだろうか。莫蓙にしてしまうことあり。)
殿 毆
隈 隕
鷹 縻
蕈 草
沿 洽
卿 喞
拠 抛 「拠(よ)る」が「抛(ほう)る」になってしまったりする。)
噛 喘
遺 遣
句 旬
品 晶
体 休
活 恬
覚 党
截 裁
哲 晢
春 眷
集 梟
譬 臂
〓 鱆(エイがタコに)
巨 亘
来 束
潮 懶
黙 獣
餌 餅
束 朿
恒 怛
裏 裹 (裹は「裹(つつ)む」などと使う語)
速 達
鷲 鵞
影 彭
昔 音 
因 囚 

こうして並べてみると、校正・校閲がいかに精確な日本語の知識と厳密な注意力を要求される仕事か、改めて痛感せずにはいない。


戻る
[お知らせ・覚書]
[校正ノート]

コメント(全0件)


記事を書く
powered by ASAHIネット