快速开始
本页展示一个最短路径:从一个文档 URL 开始,得到干净、结构化的 Markdown 输出。
你会得到什么
Section titled “你会得到什么”- 文档内容的 Markdown(标题、段落、列表、表格等结构尽量保留)
- PDF 场景下:支持文本 PDF 与扫描 PDF(必要时 OCR)
- 可控的 PDF 解析策略:
fast/auto/ocr
当 URL 指向受支持的文档类型时,会自动选择解析器并输出 markdown。
import Firecrawl from '@mendable/firecrawl-js'
const firecrawl = new Firecrawl({ apiKey: 'fc-YOUR-API-KEY' })
const doc = await firecrawl.scrape('https://example.com/file.pdf', { formats: ['markdown'], parsers: [{ type: 'pdf' }],})
console.log(doc.markdown)- 想控制 PDF 行为:阅读 PDF 解析模式
- 想把扫描件/图片 PDF 解析更稳:阅读 扫描 PDF 与 OCR
- 想理解输出 Markdown 结构:阅读 输出 Markdown