Salut,
j'ai un peu le meme pb que toi, j'utilise DMS egalement
swish-e sait (par le biais de filters) indexer des pdf
la readme de DMS dit qu'on peut coupler swish-e et DMS, mais en regardant comment il fait ca ne peut pas marcher.
en effet, les documents stockés via DMS dans son repository sont renommés en 1.dat, 2.dat etc, donc on ne sait plus , sauf a repasser par les table SQL retrouver de quel type est le fichier
le filtre qu'il construit quand tu actives la recherche swish dans DMS est simplissime (et ne marche que sous unix), on passe chaque fichier .dat a une commande "strings" qui extrait les chaines de caracteres du fichier: ca marche tres bien avec un fichier texte, moyen avec un word et tres peu avec un PDF
la solution (a ecrire) consisterait a ecrire un filtre (un script perl,php ou autre qui:
- rechercherait dans la table xoops_dms_version, le fichier .dat qu'il recoit et en fonction du type, lancerait le pgm "qui va bien" pdftotext pour les pdf, catdoc pour les word etc...
Cf : la doc de swish-e
lourde tache en perspective
peut-etre je m'y attaquerai... un jour, mais bon faut pas trop rever. en attendant je me contente de la recherche sur les champs de DMS
Patron
webmestre de l'intranet DSF (Dassault Systemes Ventes France)