2009-05-06 108 views
14

我有一些.tex文件,我想从中收到没有任何乳胶标记(如\ section {...}或\ newpage)的纯文本。
有没有人有任何想法如何实现这一目标? 我也有.pdf文件,但是当我从那里复制代码时,有些单词会被连接起来,这是非常糟糕的。
有没有你知道的工具?从tex中提取文本,删除乳胶标记

回答

6

opendetex可用于Windows和Linux的

从这里下载该程序opendetex
http://opendetex.googlecode.com/files/opendetex-2.8.1.tar.bz2
http://code.google.com/p/opendetex/downloads/list

用法: http://code.google.com/p/opendetex/wiki/Usage

它解压到您选择的任何目录。假设你把它解压到Downloads目录下。

在该目录中创建任何名称的另一个目录(可选,但如果您创建它,那么它很好)。说目录名是“my_paper”。把你的论文放在“my_paper”目录下。说你的论文的名字是project.tex

通过导航路径

cd ~/Downloads/opendetex 

运行以下命令:

detex -n my_paper/project.tex > out.txt 

通用的形式

detex -n full_path_to_tex_file.tex > output_text_file.txt