Indexer ses documents bureautique avec la suite Elastic et FSCrawler

Indexer ses documents bureautique avec la suite Elastic et FSCrawler

🏳️ EN 🏳️ FR #elasticsearch #fscrawler

Vous avez sous la main des tonnes de documents Open Office, Microsoft Office, PDF voire des images… Et vous aimeriez être capable de chercher dans leurs meta-données et dans le contenu lui-même.

Comment faire ? Surtout depuis l’annonce de la fin de Google Search Appliance.

Dans cette session, David expliquera comment Apache Tika peut fournir ce service et comment combiner cette fantastique librairie avec elasticsearch :

Resources