跳转到内容

Scrape 响应字段

/v2/scrape 的响应是一个 JSON 对象:

{ "success": true, "data": { "markdown": "...", "metadata": { "title": "...", "statusCode": 200 } } }
字段类型说明
successboolean是否成功
dataobject结果数据(详见下方)

这些字段是否出现,取决于 formats 里选择了什么输出格式(详见 输出格式)。

字段类型说明
markdownstring清洗后的 Markdown
htmlstring清洗后的 HTML
rawHtmlstring原始 HTML
linksstring[]页面链接列表
imagesstring[]图片 URL 列表
summarystringLLM 生成的摘要(需要 formats 包含 summary
screenshotstring截图资源(URL/标识,存在有效期)
audiostring音频资源(通常为签名 URL,存在有效期)
jsonobject结构化抽取结果(formats 使用 { type: "json", ... }
metadataobject页面/文档元数据(详见 Metadata 字段
warningstring警告信息(例如内容截断等场景)

当请求里提供 actions 时,响应里会包含动作相关产物:

字段类型说明
actions.screenshotsstring[]actions 产生的截图
actions.scrapesarrayaction 过程中抓取的 HTML 片段({ url, html }
actions.javascriptReturnsarray执行 JavaScript 的返回值({ type, value }
actions.pdfsstring[]action 生成的 PDF 资源

data.changeTracking(当 formats 包含 changeTracking 时)

Section titled “data.changeTracking(当 formats 包含 changeTracking 时)”
字段类型说明
changeTracking.previousScrapeAtstring (datetime)上一次抓取时间
changeTracking.changeStatusstring变化状态(例如 new)
changeTracking.visibilitystring可见性
changeTracking.diffstring差异内容(模式相关)
changeTracking.jsonobject结构化差异(模式相关)

data.branding(当 formats 包含 branding 时)

Section titled “data.branding(当 formats 包含 branding 时)”

branding 是一个体积较大的设计系统对象,包含颜色、字体、排版、间距、组件等。建议只在确实需要“品牌/设计分析”时启用。