Scrape 响应字段
/v2/scrape 的响应是一个 JSON 对象:
{ "success": true, "data": { "markdown": "...", "metadata": { "title": "...", "statusCode": 200 } } }| 字段 | 类型 | 说明 |
|---|---|---|
success | boolean | 是否成功 |
data | object | 结果数据(详见下方) |
data 字段(常见)
Section titled “data 字段(常见)”这些字段是否出现,取决于 formats 里选择了什么输出格式(详见 输出格式)。
| 字段 | 类型 | 说明 |
|---|---|---|
markdown | string | 清洗后的 Markdown |
html | string | 清洗后的 HTML |
rawHtml | string | 原始 HTML |
links | string[] | 页面链接列表 |
images | string[] | 图片 URL 列表 |
summary | string | LLM 生成的摘要(需要 formats 包含 summary) |
screenshot | string | 截图资源(URL/标识,存在有效期) |
audio | string | 音频资源(通常为签名 URL,存在有效期) |
json | object | 结构化抽取结果(formats 使用 { type: "json", ... }) |
metadata | object | 页面/文档元数据(详见 Metadata 字段) |
warning | string | 警告信息(例如内容截断等场景) |
data.actions(当使用 actions 时)
Section titled “data.actions(当使用 actions 时)”当请求里提供 actions 时,响应里会包含动作相关产物:
| 字段 | 类型 | 说明 |
|---|---|---|
actions.screenshots | string[] | actions 产生的截图 |
actions.scrapes | array | action 过程中抓取的 HTML 片段({ url, html }) |
actions.javascriptReturns | array | 执行 JavaScript 的返回值({ type, value }) |
actions.pdfs | string[] | action 生成的 PDF 资源 |
data.changeTracking(当 formats 包含 changeTracking 时)
Section titled “data.changeTracking(当 formats 包含 changeTracking 时)”| 字段 | 类型 | 说明 |
|---|---|---|
changeTracking.previousScrapeAt | string (datetime) | 上一次抓取时间 |
changeTracking.changeStatus | string | 变化状态(例如 new) |
changeTracking.visibility | string | 可见性 |
changeTracking.diff | string | 差异内容(模式相关) |
changeTracking.json | object | 结构化差异(模式相关) |
data.branding(当 formats 包含 branding 时)
Section titled “data.branding(当 formats 包含 branding 时)”branding 是一个体积较大的设计系统对象,包含颜色、字体、排版、间距、组件等。建议只在确实需要“品牌/设计分析”时启用。