高度経済成長期
郵便物自動処理装置
発明技術開発の概要
郵便の自動処理システムは、郵便番号の自動認識だけにとどまらず、①郵便物を一通ずつ送り出し、向きを整え、押印し、②住所を読み取り、区域ごとに区分し、③配達順に並べるといった一連の要件を満たすために、多様な要素技術の集積から成り立っている。以下では特に応用範囲が広いと思われる搬送技術と光学読み取りによる文字認識技術についてその概要を紹介する。
搬送作業では、押印機や区分機の供給部で、大きさや材質の異なる郵便物を一通一通取り出し、区分ポケット等へ送る技術が必要となる11。各社は、エアー吸着により一通ずつ取り出す方法を採用している。吸着時に二通取り出してしまった場合に異常を検知する仕組みが組み入れられている。主な開発上の課題は、エアー吸着方式は高速で利用すると騒音が大きくなるので、その騒音を低減させることである。また、一通ずつ送り出した郵便物を数十メートルもの処理システム内を搬送させていると、郵便物の摩擦係数等の違いにより郵便物の進むスピードが異なるために、前の郵便物と後ろの郵便物との間隔が詰まってしまうことがある。このような搬送の最中にも微修正が必要となる。
光学読み取りについては初期の開発と近年の開発に分けて説明する。初期段階には二つの光学読み取り方式が考えられた12、13、14。一つめの方法は重ね合わせ法あるいはマッチング法と呼ばれるやり方で、あらかじめ機械に標準的な文字の形状を記憶させて、郵便物の文字と重ね合わせて判別するというやり方である。この方法は何よりも簡便であり、活字のようにある程度文字の形状が定形化されている場合に適している。ただし、手書き文字の多様さはもちろんのことながら、活字にも書体の違いや印刷の違いなどがあるために、この方法では正確な読み取りは難しかった。
もう一つの方法は、構造解析法と呼ばれる方法である。書かれている線分が縦であるとか横であるとか交差しているという特徴を捉え、その特徴から文字を判別する方法である。
この方法では、郵便番号の書かれた赤い枠の中を3×3の9つの領域に分割し、それぞれの領域を、7つのパターンで認識し(縦の線分、右上がりの線分、右下がりの線分、上の横棒、下の横棒、空白、不明)、それらのパターンの組合せを基に、数字を判定するプログラムが用意された。
東芝は1965 年にプロジェクトを立ち上げ、郵便局内の作業を系統的に分析することから着手し、翌年に制限手書数字を読み取る最初の試作機を製作し、1967 年に世界初の手書き文字読取試作機TR-2 を完成させた。自由手書きでは、使用する筆記用具、字の大きさと位置、線の太さと濃度など千差万別である。そこで東芝は30万字に及ぶ手書き文字データを用意し、10万字をもって試作機を開発、残りの20万字を用いてテストを行い、TR-2の実用機であるTR-3(区分ポケット50口)とTR-4(区分ポケット100口)を完成させた。
NECが納入したNAS-5B機は、毎秒6通、認識率は当初50%程度であった。しかし郵便番号制度発足後1年程度の間に学習を進めることで、認識率を80-90%程度まで上げることに成功した。
近年は郵便番号だけでなく、住所の全般を読み取りや、最新の区分機では名前の読み取りも行っている。また、日本語だけでなく欧文やその他の外国語の文字にも対応するように進歩している。浜村倫行「郵便物の欧文手書き住所認識技術」を参考に、その方法を確認しておくことにしよう15。まず、郵便物を画像で撮影し、白黒2値の画像に変換する等の前処理を行う。複数行にわたって書かれている住所について、文字の濃淡から行を判別し、行ごとに区分する。さらに行から単語を区分する。単語単位に区分する際に区分する箇所の候補が複数存在することもあるので、この処理のことを単語仮説の生成という。単語の認識の仕方には分析的手法と全体的手法の2つの方法がある。分析的手法とは、単語を一文字ずつの文字に分割し、文字の羅列から単語を特定する方法である。全体的手法とは、前後関係や線の切れ端等の特徴を読み取り、単語を直接認識しようとする方法である。これらの方法は組み合わせて利用されることもある。これらの方法により各単語の候補が明らかになると、住所データベースとの照合を行い、最も可能性の高い住所を判別する。限られた時間内にデータベースとの照合を行うために、明らかに正解に到達したものについては早めに探索を打ち切る、あるいは明らかに読み取ることができないものについては早めに探索をやめて手入力に回すなどの工夫が取られる。
近年の郵便物自動処理装置では、単なる画像認識ではなく、蓄積されたデータベースを基に、機械学習によって精度の高い判別を実現する手法が重要となっている。住所が郵便物のどの部分に書いてあるのかに関する統計的なデータを蓄積することで読み取り位置の判別を行ったり、手書き文字の情報を、既存の蓄積された文字情報と照らし合わせながら、どのように単語や文字単位に分割するのか、その分割結果が実在する住所と合致しているかどうかを判断するなど、これまでの文字認識の経験をいかすことでより精度の高い自動処理が行われている。
(本文中の記載について)
※ 社名や商品名等は、各社の商標又は登録商標です。
※ 「株式会社」等を省略し統一しています。
※ 氏名は敬称を省略しています。