yedome
第27楼2007/11/30
PDF文件有两种:一种为图片类;一种为文字类.
文字类就容易了,可以用另存为文本再用Word打开编辑,也可下载专门的转换软件.列如:PDF2Word、ScanSoft PDF Converter V1.0等很多,用百度找就可以找到很多.
图片转换主要用OCR技术。
最间单的转换就是用安装Microsoft Office 时自带的Microsoft Office Document Image Writer虚拟打印,具体操作是用Adobe Acrobat Professional打开PDF文件,点菜单里的"文件"--"打印..."弹出打印窗口,在打印机名称选"Microsoft Office Document Image Writer",然后"确定"弹出"另存为"窗口保存为dmi文件.接下来就是用Microsoft Office Document Image Writer打开dmi文件,点菜单"工具"--"将文本发送到Word..."弹出窗口选好要保存到的文件夹"确定",它会提示你"Microsoft Office Document Image必须您在执行此操作前识别该文档中的文本(OCR)。这可能需要一些时间。"点"确定"就可以了。
OCR软件还有
清华TH-OCR XP专业版 或 清华TH-OCR 2000千禧专业版
ABBYY FineReader OCR Professional 7.0.0.963
扫描小精灵 V1.30 Build 2003.03.21
Mini Ocr 汉字显示字体识别软件 1.0
奥普印刷体文字识别OCR系统 专业版
尚书六号
"ABBYY FineReader OCR Professional 7.0.0.963"主要中对英文
"清华TH-OCR XP专业版"和"尚书六号"还不错,我试过.
以上软件各有优缺点。"Microsoft Office Document Image Writer"最大的优点是可以成批文件合一识别也不受文件格式限制因为任何软件都有打印这一功能,只是在修改错别字时比较麻烦。
这些只是小知识,有什么错的地方请多多指教。