
Indexer ses documents bureautique avec la suite Elastic et FSCrawler
Vous avez sous la main des tonnes de documents Open Office, Microsoft Office, PDF voire des images… Et vous aimeriez être capable de chercher dans leurs meta-données et dans le contenu lui-même.
Comment faire ? Surtout depuis l’annonce de la fin de Google Search Appliance.
Dans cette session, David expliquera comment Apache Tika peut fournir ce service et comment combiner cette fantastique librairie avec elasticsearch :
- Elasticsearch ingest-attachment plugin
- FSCrawler
Resources
- Demo: FSCrawler — This repository contains the code for the FSCrawler demo.
- Documentation: FSCrawler — The official FSCrawler documentation