Firecrawl offre de puissantes fonctionnalités d’analyse de documents, vous permettant d’extraire du contenu structuré à partir de divers formats. Cette fonctionnalité est particulièrement utile pour traiter des fichiers comme des feuilles de calcul, des documents Word, et plus encore.Documentation Index
Fetch the complete documentation index at: https://firecrawl-docs-improve-deep-research-headings.mintlify.app/llms.txt
Use this file to discover all available pages before exploring further.
Formats de documents pris en charge
-
Feuilles de calcul Excel (
.xlsx,.xls)- Chaque feuille est convertie en tableau HTML
- Les feuilles sont séparées par des titres H2 portant le nom de la feuille
- Préserve le formatage des cellules et les types de données
-
Documents Word (
.docx,.doc,.odt,.rtf)- Extrait le contenu textuel tout en préservant la structure du document
- Conserve les titres, paragraphes, listes et tableaux
- Préserve le formatage et le style de base
-
Documents PDF (
.pdf)- Extrait le contenu textuel avec les informations de mise en page
- Préserve la structure du document, y compris les sections et les paragraphes
- Prend en charge les PDF textuels et les PDF scannés (avec OCR)
- Prend en charge l’option
modepour contrôler la stratégie d’analyse :fast(texte uniquement),auto(texte avec recours à l’OCR en cas d’échec, par défaut) ouocr(forcer l’OCR) - Facturé 1 crédit par page. Voir la tarification pour plus de détails.
Modes d’analyse PDF
parsers pour contrôler le traitement des PDF :
| Mode | Description |
|---|---|
auto | Tente d’abord une extraction rapide basée sur le texte, puis bascule sur l’OCR si nécessaire. C’est l’option par défaut. |
fast | Analyse basée uniquement sur le texte (texte intégré). Option la plus rapide, mais n’extrait pas le texte des pages scannées ou contenant beaucoup d’images. |
ocr | Force l’analyse OCR sur chaque page. À utiliser pour les documents scannés ou lorsque auto se trompe dans la classification d’une page. |
Comment utiliser l’analyse de documents
- Analyse à partir d’une URL (
/v2/scrape) : fournissez une URL pointant vers un type de document pris en charge. - Analyse par téléversement de fichier (
/v2/parse) : téléversez directement le contenu binaire du fichier avecmultipart/form-data.
Importer des documents avec /v2/parse
/v2/parse lorsque le document source est local ou n’est pas accessible publiquement via une URL.
Exemple : extraction d’un fichier Excel
Node
Exemple : Scraper un document Word
Node
Format de sortie
Êtes-vous un agent IA ayant besoin d’une clé API Firecrawl ? Consultez firecrawl.dev/agent-onboarding/SKILL.md pour obtenir des instructions d’intégration automatisée.

