TexファイルをHTMLに変換する
tex4htを使用してみる。インストールに関しては、このサイトを参考にしてやってみる。
インストール
- 【ImageMagicを導入する】:ftp://ftp.u-aizu.ac.jp/pub/graphics/image/ImageMagick/imagemagick.org/binaries/ からImageMagick-6.2.6-8-Q8-windows-static.exe をダウンロードして、C:\ImageMagick-6.2.6-Q8 にインストールする。
- 【TEX4ht に画像処理アプリケーションを認識させる】:tex4ht.env ファイルをエディターで開き以下の文章を探し出す。
Gdvipsk -Pdl -mode ibmvga -D 110 -f \%\%1 -pp \%\%2 > zz\%\%4.ps Gc:\imagemagick\convert -crop 0x0 -density 110x110 -transparent #FFFFFF zz\%\%4.ps \%\%3
この文章を以下のように変える。
Gc:\ImageMagick-6.2.6-Q8\convert -trim +repage -density 110x110 -transparent "#FFFFFF" zz%%4.ps %%3
使い方
- pLATEX に依存する source ファイルは、TEX4ht が 認識しないので使えないらしい。なので、 jsarticle ではなく、 jarticle を指定する。
- 変換は、コマンドラインから以下のように"jp"を指定して変換する。
htlatex sample "jp"
- このHTMLは、全て1文字づつで囲まれているので、それを削除する。削除プログラムはここの記述を参考に修正。以下のPerlプログラムを実行パスの通った所において、当該ディレクトリでコマンドプロンプトから以下のように、インプットファイルとアウトプットファイルを指定して使う。
postht4.pl infile.html outfile.html
#!c:/perl/bin/perl -w open (IN, $ARGV[0]); open (OUT, "> temp.html"); while(){ chomp($_) if /span.*?$/gi ; print OUT $_; } close(OUT); close(IN); open(IN, "temp.html"); open(OUT, ">$ARGV[1]"); while( ){ $_ =~ s/ (.*?)<\/span>/$1/gi; $_ =~ s/ /\n\n
/gi; print OUT $_; } close(OUT); close(IN); my $message=`rm temp.html`; exit;