TexファイルをHTMLに変換する

tex4htを使用してみる。インストールに関しては、このサイトを参考にしてやってみる。

インストール

  • 【tex4htを導入する】:ここからアーカイブファイル(tex4htk-w32.tar.tar)を持ってきて、c:/tex/で展開する。
  • 【TEX4ht に画像処理アプリケーションを認識させる】:tex4ht.env ファイルをエディターで開き以下の文章を探し出す。
Gdvipsk -Pdl -mode ibmvga -D 110 -f \%\%1 -pp \%\%2 > zz\%\%4.ps  
Gc:\imagemagick\convert -crop 0x0 -density 110x110 -transparent #FFFFFF zz\%\%4.ps \%\%3  

この文章を以下のように変える。

Gc:\ImageMagick-6.2.6-Q8\convert -trim +repage -density 110x110 -transparent "#FFFFFF" zz%%4.ps %%3
  • 【NTT-jTEX のインストール】-1.9.1-w32.tar.gz を、 TEXアーカイブセンターからダウンロードして、c:\tex\ の下で展開する。

使い方

  • pLATEX に依存する source ファイルは、TEX4ht が 認識しないので使えないらしい。なので、 jsarticle ではなく、 jarticle を指定する。
htlatex sample "jp"
  • このHTMLは、全て1文字づつで囲まれているので、それを削除する。削除プログラムはここの記述を参考に修正。以下のPerlプログラムを実行パスの通った所において、当該ディレクトリでコマンドプロンプトから以下のように、インプットファイルとアウトプットファイルを指定して使う。
postht4.pl infile.html outfile.html
#!c:/perl/bin/perl -w
open (IN, $ARGV[0]);     
  open (OUT, "> temp.html");
    while(  ){
        chomp($_) if /span.*?$/gi ;
        print OUT $_;
    }
  close(OUT);
close(IN);
open(IN, "temp.html");
open(OUT, ">$ARGV[1]");
while(  ){
    $_ =~ s/(.*?)<\/span>/$1/gi;
    $_ =~ s//\n\n

/gi; print OUT $_; } close(OUT); close(IN); my $message=`rm temp.html`; exit;