数億枚の名刺データ化は、手入力に支えられている

2007年の設立以来、名刺管理のクラウドサービスという新しいビジネスモデルを確立し、急成長を続けるSansan。法人向けの名刺管理サービス「Sansan」の利用企業は4000社超、2012年に提供を開始した個人向けサービス「Eight」の会員も100万ユーザーに達している。

両サービスでデータ化している名刺の数は、実に年間数億枚。そして驚くべきことに、その多くが手作業で行われているという。

名刺数億枚の手入力――これを実現するためには、作業の効率化が不可欠。しかも名刺データだけに、データの精度を担保しつつ、セキュリティを担保する仕組みも求められる。

本稿では、他に例を見ないほどの厳しい要件に応える同社のバックエンドシステムについて、開発責任者のSansan 取締役CISO・ Data Strategy & Operation Centerセンター長の常樂 諭氏に話を聞いたのでご紹介しよう。

かつてはすべてアナログ手入力! スケールのために必要だったこと

Sansan 取締役CISO・ Data Strategy & Operation Centerセンター長の常樂 諭氏

創業当時のSansanは、名刺情報の文字起こしに関して、数名のオペレーターが名刺画像を見て手入力していくというアナログな手法を採用していた。

名刺には決まったフォーマットがない。そのため、どこに何の情報が記載されるのか、確実な”あたり”をつけるのは難しい。なかには、視認性よりもデザイン性を重視し、ソフトウェアで認識できない文字も使われたりする。

結果として、一般的なOCRの読取成功率は6~7割程度。これでは使い物にならないため、「データ化のほとんどの工程を人手に頼らざるをえない」(常樂氏)状況だったという。

当時、オペレーターの入力作業効率は、2カ月程度の経験者で1枚当たり平均2分。1日(8時間)にデータ化できる量は数百枚ほどしかなく、事業をスケールさせるうえでは何らかの対策が必要だった。

繁忙期は4・12・1月、人員を柔軟に確保するには

常樂氏によると、Sansanでは当初、オペレーターを一箇所に集めてデータ入力してもらう、センターオペレーター形式をとっていたという。センターオペレーターは、教育が行き届くうえ、セキュリティ面も管理しやすい。作業を効率化する環境も整えられるのがメリットだ。

ただし課題もある。名刺データ化のニーズには大きな波があり、それに合わせたリソース調整が難しいという点だ。

「ユーザーから送られてくる名刺の件数は、4月、12月、1月が非常に多く、8月あたりは減る傾向にあります。繁忙期に合わせて人員やファシリティを確保してしまうと、閑散期に無駄なコストを背負うことになります。ニーズに合わせてリソースを増減できるようにするためには、センターオペレーター形式以外にも対応できる環境を構築する必要がありました」(常樂氏)

入力オペレーターの頭の中にすら情報を残さない

センターオペレーター形式以外にも対応できる環境を構築する上で、常樂氏が気にかけていたのがセキュリティだ。

名刺データは、個人情報の塊。外部からの攻撃はもちろん、入力オペレーターの不正に向けた対策も必要だ。

そのためには、データを持ち出せないようにするのは当然のことながら、オペレーターの入力作業時に、名刺情報と認識できないようなかたちにする必要があった。