metadata 位于响应的 data.metadata 下。不同站点/不同 formats 可能会产生额外字段,以下是最常见的字段集合。
| 字段 | 类型 | 说明 |
|---|
title | string | 页面标题 |
description | string | 页面描述 |
language | string | 语言标识 |
keywords | string | keywords(若页面提供) |
robots | string | robots meta(若页面提供) |
sourceURL | string | 最终抓取的来源 URL |
url | string | URL(某些响应同时返回 sourceURL 与 url) |
| 字段 | 类型 | 说明 |
|---|
ogTitle | string | og:title |
ogDescription | string | og:description |
ogUrl | string | og:url |
ogImage | string | og:image |
ogSiteName | string | og:site_name |
ogLocaleAlternate | string[] | og:locale:alternate |
| 字段 | 类型 | 说明 |
|---|
statusCode | number | HTTP status code |
contentType | string | Content-Type |
error | string | 失败/异常信息(若有) |
| 字段 | 类型 | 说明 |
|---|
concurrencyLimited | boolean | 是否触发并发限制 |
concurrencyQueueDurationMs | number | 在队列中等待的时间(ms) |
文档站点/博客等页面通常会携带额外元数据(例如 twitter:*、canonical 等)。Firecrawl 可能会把它们透传到 metadata 中,以 "<any other metadata>" 的形式表示“还有其他键”。