昨天下午给我气够呛,对着扫描仪直拍桌。写工作总结需要扫描几份文件,汉王OCR愣把"资产负债表"扫成"赌产附债表",领导签字那块干脆整段空白。急得我满脑门汗,琢磨着再不修好今晚得通宵。
死马当活马医的基础操作
直接把软件卸了重装,连安装包都去官网下最新版。装完兴冲冲试扫发票,结果更离谱——358.7元变成"3S8.7无"。气得我差点把扫描仪扔了,抄起抹布把扫描仪玻璃板来回擦了三遍,连边缝都用牙签抠干净。
换招数搞扫描技巧
琢磨着是不是操作有问题,试了几种奇葩姿势:
- 把文件斜着45度放扫描仪
- 拿手机打手电筒从侧面补光
- 扫描时在文件上压两本辞海
别说还真管点用!斜放那次终于认出"增值税专用发票"七个字,就是数字还是乱码。压辞海那次把A4纸压出褶子,OCR直接把褶皱线识别成乱码字符。
钻进设置里死磕参数
半夜两点红着眼扒拉高级设置,没想到藏着大玄机:分辨率调到300dpi——原来默认150dpi扫小字就是马赛克把色彩模式从彩色切成黑白——立马解决背景水印干扰手动框选识别区域——避开页眉页脚的印章位置
折腾完扫了张带表格的文件,表格线居然能连贯显示,就是单元格里的数字还有两个识别错误。
终极大招人工较对
发现软件自带校对功能简直救命!操作比想象简单:
- 先让OCR跑完全文
- 在错误单词上右键选"修正"
- 用键盘手工敲正确文字
吐血总结的避坑指南
- 扫前必做:用眼镜布擦玻璃板 + 300dpi起步
- 文件带印章:开黑白模式 + 避开红章区域
- 遇表格用鼠标框出范围
- 专业术语错别字记得加入自定义词库
实在搞不定就上笨办法:用手机扫完传电脑。这破软件跟驴似的,顺着毛撸还能凑合用,较劲能把你气进ICU。