Business Card System
杜芬宅 看見一位同事在整理一大堆名片,足足整理了一個下午。雖然 杜芬宅 不太清楚那位同事真正想如何,不過就忽然想弄一個名片電子化系統。
杜芬宅 患了心血來潮不可抵擋直衝的病,『認真』到一個地步寫了一份Specification。
那一份Specification看看就好,有點亂來的。各位朋友不要學。
那份 DOC 如想索取請與杜芬宅聯絡
作者︰杜芬宅
版本︰第一版
日期︰
===================================================================
功能性需求
===================================================================
功能︰尋找對方名片
假設你是Sale, Support 或是其它經常要見客的職業,應該說互派名片對你來說是家常便飯。
若果與某公司有業務關係,只記得對方所屬公司名、昵稱,想致電給對方可能真是要花一段時間找名片。
用家只需搜尋對方名稱,職位名。立即可以找到名片。
功能︰名片新增、修改、刪除
在能夠搜尋名片之前,先要提供一個輸入的介面。好像在說廢話,不過那是必需的。
關於名片上的資料不外符分為公司資料、名片持有人的資料
公司資料一般包括︰
公司LOGO
公司名
公司地址
公司聯絡電話
公司傳真電話
公司網址
公司電郵地址
名片持有人的資料可能有︰
員工中文全名
員工英文昵稱
員工英文姓氏
員工職位
員工直線電話
員工電郵地址
員工手提電話
員工傳真電話
除此之外,還需要處理有些工種例如保險經紀會有保險經紀牌照號碼,不少名片上會列印公司多間辦事署的資料……
換言之需要提供一個
功能︰為名片進行 Optical Character Recognition
在能夠搜尋名片之前,背後必須先輸入了一堆資料才能夠實現。
不過一想到要手動輸入名片上的資料,少說也有十多項。接著還有一大堆名片要處理,想到就無力了。
因此之故,OCR是必須的。 用家只要把名片掃瞄進電腦/拍照再傳送到電腦,系統就進行文字辨識,節省手動輸入帶來『成本』。
包括人力資源、時間。
注︰名片卡涉及敏感內容,部份已經由*號覆蓋
===================================================================
開始 Rapid Application Development
請注意︰以下含有時間性內容,結果/圖片/介面或許會隨時間改變
===================================================================
功能性需求
===================================================================
功能︰尋找對方名片
假設你是Sale, Support 或是其它經常要見客的職業,應該說互派名片對你來說是家常便飯。
若果與某公司有業務關係,只記得對方所屬公司名、昵稱,想致電給對方可能真是要花一段時間找名片。
用家只需搜尋對方名稱,職位名。立即可以找到名片。
功能︰名片新增、修改、刪除
在能夠搜尋名片之前,先要提供一個輸入的介面。好像在說廢話,不過那是必需的。
關於名片上的資料不外符分為公司資料、名片持有人的資料
公司資料一般包括︰
公司LOGO
公司名
公司地址
公司聯絡電話
公司傳真電話
公司網址
公司電郵地址
名片持有人的資料可能有︰
員工中文全名
員工英文昵稱
員工英文姓氏
員工職位
員工直線電話
員工電郵地址
員工手提電話
員工傳真電話
除此之外,還需要處理有些工種例如保險經紀會有保險經紀牌照號碼,不少名片上會列印公司多間辦事署的資料……
換言之需要提供一個
功能︰為名片進行 Optical Character Recognition
在能夠搜尋名片之前,背後必須先輸入了一堆資料才能夠實現。
不過一想到要手動輸入名片上的資料,少說也有十多項。接著還有一大堆名片要處理,想到就無力了。
因此之故,OCR是必須的。 用家只要把名片掃瞄進電腦/拍照再傳送到電腦,系統就進行文字辨識,節省手動輸入帶來『成本』。
包括人力資源、時間。
注︰名片卡涉及敏感內容,部份已經由*號覆蓋
===================================================================
開始 Rapid Application Development
請注意︰以下含有時間性內容,結果/圖片/介面或許會隨時間改變
===================================================================
開發環境
OS︰Windows 8.1 ProWeb Server︰XAMPP Package 1.8.3
PHP︰5.5
時間關係,杜芬宅 就開始 Try & Error ,經查探發現 Tesseract 是一個不錯的選擇
Tesseract 是一免費的OCR︰
- 是免費 和 開源
- 能夠辨識 多種不同語言
- 提供 Command-Line Interface
- Tesseract Installation on Windows 安裝教學
- Tesseract Execution on Windows
- Tesseract Testcase
Try & Error 中的 Error 已經整理好,或許對您有幫助
杜芬宅 也與上阻礙。請看 排解疑難
Tesseract Installation on Windows 安裝教學
Tesseract Execution on Windows
安裝成功後,請試試在CMD 輸入
tessaract
以及
tessaract --list-langs
如此可以列出所以已安裝的 Language Data ,那列表一會會用到。
前往 TesseractOCR for PHP ,那是有人將 Tessaract 整合到PHP,大家不客氣打包下載就可以。
解壓到你的Web Server 的相關路徑,在Test Folder底下有三張圖片。
用Cmd 前往Test folder 輸入
tessaract hello.png -l eng output
eng 即是辨別英文,如果想辨識繁體中文則是 chi_tra
ouput 即是輸出文字檔案的檔名
最後,那是成功的。
tessaract
以及
tessaract --list-langs
如此可以列出所以已安裝的 Language Data ,那列表一會會用到。
前往 TesseractOCR for PHP ,那是有人將 Tessaract 整合到PHP,大家不客氣打包下載就可以。
解壓到你的Web Server 的相關路徑,在Test Folder底下有三張圖片。
用Cmd 前往Test folder 輸入
tessaract hello.png -l eng output
eng 即是辨別英文,如果想辨識繁體中文則是 chi_tra
ouput 即是輸出文字檔案的檔名
最後,那是成功的。
Tesseract Testcase
很簡單,只需在解壓的目錄建立一個PHP。
內容如下︰
分別使用 English 及 繁體中文進行
耗時︰5.7496 seconds
中文辨識成功率︰25%
英文辨識成功率︰35%
Testcase T002
分別使用 English 及 繁體中文進行
耗時︰7.8967 seconds
中文辨識成功率︰0%
英文辨識成功率︰0%
Testcase T003
分別使用 English 及 繁體中文進行
耗時︰15.49 seconds
中文辨識成功率︰21.43%
英文辨識成功率︰50%
Testcase T004
分別使用 English 及 繁體中文進行
耗時︰9.69 seconds
中文辨識成功率︰0%
英文辨識成功率︰0%
Testcase T005
分別使用 English 及 繁體中文進行
耗時︰10.52 seconds
中文辨識成功率︰33.33%
英文辨識成功率︰35.71%
Testcase T006
使用 English 進行
耗時︰0.86 seconds
英文辨識成功率︰81.25%
Testcase T007
分別使用 English 及 繁體中文進行
耗時︰19.41 seconds
中文辨識成功率︰50%
英文辨識成功率︰92.86%
Testcase T008
分別使用 English 及 繁體中文進行
耗時︰13.41 seconds
中文辨識成功率︰17.86%
英文辨識成功率︰50%
Testcase T009
分別使用 English 及 繁體中文進行
耗時︰ 7.55 seconds
中文辨識成功率︰25%
英文辨識成功率︰58.33%
Testcase T010
分別使用 English 及 繁體中文進行
耗時︰ 8.67 seconds
中文辨識成功率︰%
英文辨識成功率︰%
Testcase T011
分別使用 English 及 繁體中文進行
耗時︰13.63 seconds
中文辨識成功率︰%
英文辨識成功率︰%
Testcase T012
使用 English 進行
耗時︰0.65 seconds
英文辨識成功率︰%
Testcase T013
分別使用 English 及 繁體中文進行
耗時︰19.78 seconds
中文辨識成功率︰%
英文辨識成功率︰%
Testcase T014
分別使用 English 及 繁體中文進行
耗時︰21.05 seconds
中文辨識成功率︰%
英文辨識成功率︰%
內容如下︰
setLanguage('eng');
$tesseract->setTempDir(".\my-temp-dir");
echo "
English Result:
";
echo $tesseract->recognize();
echo "
";
echo "
Chinese Traditional Result:
";
$tesseract->setLanguage('chi_tra');
echo $tesseract->recognize();
echo "
";
$time_end = microtime_float();
$time = $time_end - $time_start;
echo "
Process Time: $time seconds\n";
?>
Testcase T001
分別使用 English 及 繁體中文進行
耗時︰5.7496 seconds
中文辨識成功率︰25%
英文辨識成功率︰35%
| 預期辨識的文字 | 判定 |
| Hopes CONTRACTING CO., LTD | 正確 |
| 中文全名 | 失敗 |
| Nick Name | 正確 |
| Last Name | 失敗 |
| Title / Post | 部份正確 |
| 合適營造工程有限公司 | 部份正確 |
| Direct: (852) 2600 5782 | 部份正確 |
| M: (852) 9879 9924 | 失敗 |
| Fax: (852) 2601 0813 | 部份正確 |
| Tel: (852) 2604 2002-782 | 失敗 |
| 失敗 | |
| Website: www.hopescon.com | 失敗 |
| SA8000 : 2008 | 正確 |
| Certificate No.: SA0001 | 部份正確 |
Testcase T002
分別使用 English 及 繁體中文進行
耗時︰7.8967 seconds
中文辨識成功率︰0%
英文辨識成功率︰0%
Testcase T003
分別使用 English 及 繁體中文進行
耗時︰15.49 seconds
中文辨識成功率︰21.43%
英文辨識成功率︰50%
| 預期辨識的文字 | 判定 |
| 香港辦事處: | 失敗 |
| 香港新界沙田火炭山尾街19-21號 | 部份正確 |
| 宇宙工業大廈3樓I,J室 | 部份正確 |
| 上海辦事處: | 失敗 |
| 中國上海徐匯區柳州路399號(甲) | 失敗 |
| 恒地倉國際大廈603室 | 部份正確 |
| Hong Kong Head office: | 部份正確 |
| B1ock I,J, 3/F., Universal Ind. Centre, | 部份正確 |
| 19-21 Shan Mei S1., E0 Tan, Shatin, | 部份正確 |
| N.T., Hong Kong | 失敗 |
| Direct line: (852) 2600 5782 | 部份正確 |
| Mobile: (852) 9879 9924 | 失敗 |
| Tel: (852) 2604 2002-782 | 失敗 |
| Fax: (852) 2601 0813 | 失敗 |
| Email: melody@hopescon.com.hk | 失敗 |
| Website: www.hopescon.com | 失敗 |
| Shanghai office: | 正確 |
| Room 603, | 正確 |
| Hengdicang International Mansion. | 正確 |
| (a) No. 399, Liuzhou Road. Xu Hui District, | 正確 |
| Shanghai 200235, P.R.China | 正確 |
| Tel: (8621) 6426 2123 | 正確 |
| Fax: (8621) 6426 2125 | 部份正確 |
| 廠房地址:中山市板芙鎮里溪村順景工業園嘉景路 | 失敗 |
Testcase T004
分別使用 English 及 繁體中文進行
耗時︰9.69 seconds
中文辨識成功率︰0%
英文辨識成功率︰0%
Testcase T005
分別使用 English 及 繁體中文進行
耗時︰10.52 seconds
中文辨識成功率︰33.33%
英文辨識成功率︰35.71%
| 預期辨識的文字 | 判定 |
| speedo | 部份正確 |
| 技術及支援中心 | 部份正確 |
| Technical and Service Center | 部份正確 |
| 顧客請出示有效的發票(收據),以供保修之用。 | 部份正確 |
| Please pesent official purchase receipt for service reference. | 部份正確 |
| Unit D, 5/F., Gemstar Tower, No. 23 Man Lok Street, Hung Hom, KLN, HK | 部份正確 |
| 九龍紅磡民樂街23號駿昇中心5樓D室 | 失敗 |
| www.gregory-marketing.com | 失敗 |
| Tel: 852 3188 0268 | 失敗 |
| support2@gregory-marketing.com | 部份正確 |
Testcase T006
使用 English 進行
耗時︰0.86 seconds
英文辨識成功率︰81.25%
| 預期辨識的文字 | 判定 |
| Ricky Poon B.A.S C.G.A | 部份正確 |
| CERTIFIED GENERAL ACCOUNTANT | 部份正確 |
| 36 Connery Crescent | 正確 |
| Markham, Ontario | 正確 |
| Canada L3S 4E5 | 正確 |
| Tel: (416) 985-9852 | 正確 |
| Fax: (905) 471-4436 | 正確 |
| Email: rickcga@rogers.com | 部份正確 |
Testcase T007
分別使用 English 及 繁體中文進行
耗時︰19.41 seconds
中文辨識成功率︰50%
英文辨識成功率︰92.86%
| 預期辨識的文字 | 判定 |
| 宏未 | 部份正確 |
| Manulife | 正確 |
| For your future TM | 部份正確 |
| Henry Hiu-Kong Man | 正確 |
| Financial Planning Officer | 正確 |
| Licensed MPF Intermediary | 正確 |
| Higher Diploma in Financial Planning and Investment | 正確 |
| Insurance Agent Flag. No.: 13244296 | 正確 |
| MPFlntem1ediary Reg. No.: 106495 (Reg. Name: Man Hiu Kong) | 正確 |
| Manullfe (International) Limited (incorporated in Bennuda) | 正確 |
| 5/F.. Tower B, Manulife Financial Centre, | 正確 |
| 223 - 231 Wai Yip Street, Kwun Tong, Kowloon, Hong Kong | 正確 |
| Tel: (852) 2956 8182 Mobile: (852) 6798 2731 Fax: (852) 3579 2259 | 正確 |
| E-mail: henty_hK_man@manulife.com.hk www.manulife.com.hk | 部份正確 |
| A Manulife Financial Company. Corporate Headquarters in Toronto, Canada. | 正確 |
Testcase T008
分別使用 English 及 繁體中文進行
耗時︰13.41 seconds
中文辨識成功率︰17.86%
英文辨識成功率︰50%
| 預期辨識的文字 | 判定 |
| 宏未 | 失敗 |
| Manulife | 正確 |
| 與你共創未來 TM | 部份正確 |
| 文曉光 | 失敗 |
| 理財策劃主任 | 失敗 |
| 認可強積金中介人 | 失敗 |
| 財務策劃及投資學高級文憑 | 失敗 |
| 保險代理登記號碼: 13244296 | 失敗 |
| 強積金中介人註冊編號: 106495 (註冊姓名︰文曉光) | 失敗 |
| 宏利人壽保險(國際)有限公司 (百慕達註冊成立) | 失敗 |
| 香港九龍觀塘偉業街223-231號宏利金融中心B座5樓 | 失敗 |
| 電話: (852) 2956 8182 | 部份正確 |
| 手提電話: (852) 6798 2731 | 部份正確 |
| 傳真: (852) 3579 2259 | 部份正確 |
| 電子郵址: henry_hk_man@manulife.com.hk www.manulife.com.hk | 部份正確 |
| A Manulife Financial Company. Corporate Headquarters in Toronto, Canada. | 失敗 |
Testcase T009
分別使用 English 及 繁體中文進行
耗時︰ 7.55 seconds
中文辨識成功率︰25%
英文辨識成功率︰58.33%
| 預期辨識的文字 | 判定 |
| Hopes CONTRACTING CO., LTD | 部份正確 |
| 中文全名 | 部份正確 |
| Nick Name | 正確 |
| Last Name | 失敗 |
| Title / Post | 部份正確 |
| 合適營造工程有限公司 | 失敗 |
| Direct: (852) 2600 5782 | 正確 |
| M: (852) 9879 9924 | 失敗 |
| Fax: (852) 2601 0813 | 正確 |
| Tel: (852) 2604 2002-782 | 失敗 |
| 正確 | |
| Website: www.hopescon.com | 部份正確 |
| SA8000 : 2008 | 部份正確 |
| Certificate No.: SA0001 | 正確 |
Testcase T010
分別使用 English 及 繁體中文進行
耗時︰ 8.67 seconds
中文辨識成功率︰%
英文辨識成功率︰%
| 預期辨識的文字 | 判定 |
| 香港辦事處: | 失敗 |
| 香港新界沙田火炭山尾街19-21號 | 失敗 |
| 宇宙工業大廈3樓I,J室 | 失敗 |
| 上海辦事處: | 正確 |
| 中國上海徐匯區柳州路399號(甲) | 部份正確 |
| 恒地倉國際大廈603室 | 部份正確 |
| Hong Kong Head office: | 失敗 |
| B1ock I,J, 3/F., Universal Ind. Centre, | 失敗 |
| 19-21 Shan Mei S1., E0 Tan, Shatin, | 失敗 |
| N.T., Hong Kong | 失敗 |
| Direct line: (852) 2600 5782 | 失敗 |
| Mobile: (852) 9879 9924 | 失敗 |
| Tel: (852) 2604 2002-782 | 失敗 |
| Fax: (852) 2601 0813 | 失敗 |
| Email: melody@hopescon.com.hk | 失敗 |
| Website: www.hopescon.com | 失敗 |
| Shanghai office: | 正確 |
| Room 603, | 正確 |
| Hengdicang International Mansion. | 正確 |
| (a) No. 399, Liuzhou Road. Xu Hui District, | 正確 |
| Shanghai 200235, P.R.China | 正確 |
| Tel: (8621) 6426 2123 | 正確 |
| Fax: (8621) 6426 2125 | 正確 |
| 廠房地址:中山市板芙鎮里溪村順景工業園嘉景路 | 失敗 |
Testcase T011
分別使用 English 及 繁體中文進行
耗時︰13.63 seconds
中文辨識成功率︰%
英文辨識成功率︰%
| 預期辨識的文字 | 判定 |
| speedo | 部份正確 |
| 技術及支援中心 | 部份正確 |
| Technical and Service Center | 正確 |
| 顧客請出示有效的發票(收據),以供保修之用。 | 部份正確 |
| Please pesent official purchase receipt for service reference. | 部份正確 |
| Unit D, 5/F., Gemstar Tower, No. 23 Man Lok Street, Hung Hom, KLN, HK | 正確 |
| 九龍紅磡民樂街23號駿昇中心5樓D室 | 失敗 |
| www.gregory-marketing.com | 正確 |
| Tel: 852 3188 0268 | 正確 |
| support2@gregory-marketing.com | 正確 |
Testcase T012
使用 English 進行
耗時︰0.65 seconds
英文辨識成功率︰%
| 預期辨識的文字 | 判定 |
| Ricky Poon B.A.S C.G.A | 部份正確 |
| CERTIFIED GENERAL ACCOUNTANT | 部份正確 |
| 36 Connery Crescent | 正確 |
| Markham, Ontario | 正確 |
| Canada L3S 4E5 | 部份正確 |
| Tel: (416) 985-9852 | 正確 |
| Fax: (905) 471-4436 | 正確 |
| Email: rickcga@rogers.com | 部份正確 |
Testcase T013
分別使用 English 及 繁體中文進行
耗時︰19.78 seconds
中文辨識成功率︰%
英文辨識成功率︰%
| 預期辨識的文字 | 判定 |
| 宏未 | 部份正確 |
| Manulife | 正確 |
| For your future TM | 正確 |
| Henry Hiu-Kong Man | 正確 |
| Financial Planning Officer | 正確 |
| Licensed MPF Intermediary | 正確 |
| Higher Diploma in Financial Planning and Investment | 正確 |
| Insurance Agent Flag. No.: 13244296 | 正確 |
| MPFlntem1ediary Reg. No.: 106495 (Reg. Name: Man Hiu Kong) | 部份正確 |
| Manullfe (International) Limited (incorporated in Bennuda) | 正確 |
| 5/F.. Tower B, Manulife Financial Centre, | 正確 |
| 223 - 231 Wai Yip Street, Kwun Tong, Kowloon, Hong Kong | 正確 |
| Tel: (852) 2956 8182 Mobile: (852) 6798 2731 Fax: (852) 3579 2259 | 正確 |
| E-mail: henty_hK_man@manulife.com.hk www.manulife.com.hk | 部份正確 |
| A Manulife Financial Company. Corporate Headquarters in Toronto, Canada. | 正確 |
Testcase T014
分別使用 English 及 繁體中文進行
耗時︰21.05 seconds
中文辨識成功率︰%
英文辨識成功率︰%
| 預期辨識的文字 | 判定 |
| 宏利 | 部份正確 |
| Manulife | 正確 |
| 與你共創未來 TM | 失敗 |
| 文曉光 | 正確 |
| 理財策劃主任 | 正確 |
| 認可強積金中介人 | 部份正確 |
| 財務策劃及投資學高級文憑 | 部份正確 |
| 保險代理登記號碼: 13244296 | 部份正確 |
| 強積金中介人註冊編號: 106495 (註冊姓名︰文曉光) | 部份正確 |
| 宏利人壽保險(國際)有限公司 (百慕達註冊成立) | 失敗 |
| 香港九龍觀塘偉業街223-231號宏利金融中心B座5樓 | 部份正確 |
| 電話: (852) 2956 8182 | 部份正確 |
| 手提電話: (852) 6798 2731 | 部份正確 |
| 傳真: (852) 3579 2259 | 部份正確 |
| 電子郵址: henry_hk_man@manulife.com.hk www.manulife.com.hk | 部份正確 |
| A Manulife Financial Company. Corporate Headquarters in Toronto, Canada. | 正確 |
Documentation / Initial Report
如有興趣知道更多詳情,請與杜芬宅聯絡
====================================================================
外部連結︰
- Google Code: tesseract-ocr
- Github: TesseractOCR for PHP
No comments:
Post a Comment