用于从 MSDN 网站上下载指定章节下的所有文章,读取内容中的文本及图片等。读取完成后,转换为 Word 文件,并生成相应的目录。(有了 word 文件,Word 2010 就可以把它导出为 pdf 等其它格式了。)
一个 MSDN 到 Word/PDF 转换器。我已经用它转换了 WPF、VSPackage、WWF 等 MSDN 章节为 PDF。
现在的 MSDN 已经做得非常好了,章节非常清晰,从入门到精通各个层次都有。我常常会把 MSDN 当作一个系统的学习书籍来看。有时候,特别想把 MSDN 下载下来,转换为 PDF,放到平板电脑上看。
软件截图
例如,我期望转换 MSDN 中 《Windows Workflow Fundation》 中的所有内容到 PDF。
步骤
打开你要下载的 MSDN 页面,查看该页面的标识。如下图,其中标识为 dd489441。
编辑配置文件
打开 MSDNConverter.exe.config,编辑以下配置:
把页面的标识“RootId”设置为上面的 dd489441。
有时候,你不想下载某一些子章节,例如大量类型的 API 说明。你可以把这些不想下载的子章节标识,都加入到 “ExcludeSubIdList” 配置中,以逗号分隔即可。
运行软件即可
点击回车,开始全自动运行……
先下载整本书的目录结构……
目录下载完毕后,会开始下载每一篇文章的文本内容:
文本下载完毕,会开始下载所有的图片:
文本和图片,会下载到程序对应文件夹下缓存着。防止中途中断不再重复下载。
待文本和图片下载完成后,程序会打开 Word,开始把内容输出到 Word 文档中。在转换过程中,打开 Word 只是方便查看,不要去人为编辑 Word 文档,否则会影响转换。
输出完成
转换完成后,程序为整个文档生成了目录和导航。这时,保存为 Word、或者 PDF 即可。:)
输出
结语
目前软件是 1.3 版本,还有一些问题没有解决。例如没识别表格、列表、许多样式等。