編集からもらったWordデータをそのまま使うと、あっちこっちで事故ります。
地雷を踏まぬよう、Wordデータを
[その1]Wordをテキストに変換
[その2](事故らないように)加工します。
これをテキスト加工と呼んでいます。 “[テキスト加工①]Wordのテキストファイル化とテキスト加工” の続きを読む
正規表現は見よう見まね
編集からもらったWordデータをそのまま使うと、あっちこっちで事故ります。
地雷を踏まぬよう、Wordデータを
[その1]Wordをテキストに変換
[その2](事故らないように)加工します。
これをテキスト加工と呼んでいます。 “[テキスト加工①]Wordのテキストファイル化とテキスト加工” の続きを読む
Wordのデータをテキストデータ化したら、
文字化けしました!
よくあることですが、いい加減腹がたつので、これを防ぎたい。 “文字化け防止。Wordをテキスト化するときは、書式なし(.txt)のUnidode(UTF-8)です。” の続きを読む
例えば、「4-5 山田かつてない乱れ」みたいな数字付きに見出しで、
“数字付きの見出しのとき、例えば「3-4 ほにゃらら〜」みたいな見出しで、数字と見出しの間で改行を入れ、それぞれの文頭に記号を付けます。ついでに1行アキも取りました。” の続きを読む