Office 2007 docx文档在线转换

Office 2007 的 Word 文档格式为 Microsoft Open Office XML Format (.docx),这种格式不被老版本的 Office 兼容。要查看该类型的文档,你需要安装Office 2007(如果这是一种选项的话),或者安装 Office 2007 Compatibility Pack for Windows

如果你手头有个docx格式的文档,并且你仅仅对它的文本内容感兴趣,你可以使用http://docx-converter.com/这个网站,它提供抽取docx文档文本内容的在线服务。虽然只能抽取文本,功能稍显弱了点,但总比读不出来要强。

从开发者角度来讲,从.docx文档中抽取纯文本是相当容易的。因为不需要 parse 结构信息,仅仅把段落节点的内容输出就完成一大半了。

题外话:在WPS工作的两年中,有一半的时间是跟MS Office文档格式、UFO格式标准及OpenOffice文档格式打交道。国内办公软件厂家(金山,永中,中文2000等)长期以来都以兼容MS Office的格式、排版及UI为第一要务。现在MS Office的界面有了颠覆性的改变,默认文档也使用了基于XML的…x格式,在协同办办工上更是把其他厂家远远落在了后面。兼容的口号在一定程度上不再成为借口,不知道WPS和永中Office等办公软件的路该怎么走。

(Update)其他在线文档转换工具:

  • Zamzar: Free online file conversion