通过 /files/upload 上传的图片,主要用途是作为对话或工作流的输入附件
1. 在 对话型应用(Chat / Chatflow)里
- 上传后会得到一个
id(upload_file_id),你在调用 /chat-messages 时把它放进 files 数组。
- 模型就能在生成回答时同时参考这张图,比如:
- 让模型描述图片内容(图像识别)
- 对图片进行分析、提取文字(OCR)
- 结合图片和文字一起回答问题
- 但前提是你使用的模型要支持多模态(text+image),比如 OpenAI GPT-4o、Claude 3.5 Sonnet 等,并且你的 Dify 应用已经配置为使用这样的模型。
2. 在 Workflow 应用里
- 上传的文件可以作为某个节点的输入(例如“图像理解”、“文档解析”节点)。
- 可以和后续处理节点串联,比如:
- 图片 → 图像识别节点 → 提取结果 → 传给文本处理节点
- 图片 → 视觉问答节点 → 输出分析结果
- Workflow 的好处是可以多步处理,比如先 OCR,再翻译,再生成报告。
接口是 multipart/form-data 格式,文件直接作为表单字段传输,所以没有普通的 JSON 请求体
不能用 application/json,必须用 multipart/form-data
表单字段名固定为 "file"
Chatflow 场景仅支持图片;Workflow 可支持更多类型