ok pour les *.doc mais PAS pour les *.RTF; pour word une autre solution: utiliser antiword

pour RTF: catdoc (mais problème d'accents doublés, je cherche encore sinon faudra faire du sed), ou sdf ou unrtf ou unoconv

#! /usr/bin/bash
# [[word2txt]] Script to automatically convert word doc files to plain txt files
# Usage:
# Required: http://wvware.sourceforge.net/ + elinks
# apt-get install wv elinks
#
# Authors:
# FR, radeff@akademia.ch
# History
# 2005.11.18: FR, created
# To do:
#########
echo "Script to automatically convert word doc files to plain txt files"
echo "************"
WD=`pwd`
echo "Now converting all files under" .$WD
echo "************"
j=0
find . -name "*.doc"  -o -name "*.DOC"  | while read i
do
j=$j+1
echo "$j Converting wvText $i TO $i.txt"
wvText "$i" "$i.txt"

done
echo "************"
#echo "Finished, $k  files converted"
echo "Finished, all  files converted"
  • info/word2txt.txt
  • Dernière modification: 2018/07/18 09:46
  • par radeff