我要投稿

全网首发Dify Nano Banana工作流

发布日期：2025-09-17 17:59:24 浏览次数： 2905

作者：考拉的Ai树屋

微信搜一搜，关注“考拉的Ai树屋”

全网首发Nano Banana dify工作流

使用的是本地私有化部署的Dify

效果展示：

工作流编排

工作流编排全览

基础设置

• 设置开场白

开场白中编写便捷用户体验的谷歌官方Nano Banana提示词。

• 打开图片上传功能

1. 开始节点

接收用户的输入和上传的图片。

2. 列表操作

操作用户上传的文件，这里取用户上传的最后一张图片。

3.HTTP请求节点

使用form-data的方式向服务端发送用户选择的图片和提示词。

理论上，也可以使用Dify内置的代码节点直接向openrouter api 接口发起请求。

服务端采用的是Python + FastAPI的方式，给Dify提供API接口。

核心代码如下，采用openrouter提供的Nana Banana API接口。

@app.post("/upload")
async def upload_chat(prompt: str = Form(...), image: Optional[UploadFile] = File(None)):
    """处理 form-data 方式上传的图片和 prompt，单轮对话"""
    print(f"[upload-chat] 收到请求 - prompt长度: {len(prompt)}, 是否有图片: {image is not None}")
    print(f"[upload-chat] prompt内容: {prompt[:100]}{'...' if len(prompt) > 100 else ''}")
    
    if not OPENROUTER_API_KEY:
        print("[upload-chat] 错误: OPENROUTER_API_KEY 未配置")
        raise HTTPException(status_code=500, detail="OPENROUTER_API_KEY 未配置")
    
    # 构造消息内容
    content = [{"type": "text", "text": prompt}]
    print(f"[upload-chat] 初始消息内容构造完成")
    
    # 如果有图片，处理图片数据
    if image and image.filename:
        print(f"[upload-chat] 开始处理图片 - 文件名: {image.filename}, 类型: {image.content_type}")
        try:
            # 读取图片数据
            image_data = await image.read()
            print(f"[upload-chat] 图片读取完成 - 大小: {len(image_data)} bytes")
            
            # 转换为 base64
            image_b64 = base64.b64encode(image_data).decode('utf-8')
            print(f"[upload-chat] base64转换完成 - 长度: {len(image_b64)}")
            
            # 获取文件类型
            content_type = image.content_type or "image/jpeg"
            print(f"[upload-chat] 文件类型: {content_type}")
            
            # 构造 data URL
            data_url = f"data:{content_type};base64,{image_b64}"
            
            # 添加图片到消息内容
            content.append({
                "type": "image_url",
                "image_url": {"url": data_url}
            })
            print(f"[upload-chat] 图片添加到消息内容完成")
        except Exception as e:
            print(f"[upload-chat] 图片处理错误: {str(e)}")
            raise HTTPException(status_code=400, detail=f"图片处理错误: {str(e)}")
    else:
        print("[upload-chat] 无图片上传，仅处理文本")
    
    # 构造符合 Gemini 格式的消息
    messages = [{
        "role": "user",
        "content": content
    }]
    print(f"[upload-chat] 消息格式构造完成 - 内容项数: {len(content)}")
    
    payload: dict[str, Any] = {
        "model": "google/gemini-2.5-flash-image-preview",
        "messages": messages,
        "modalities": ["image", "text"]  # 明确要求返回图片和文本
    }
    print(f"[upload-chat] API请求载荷构造完成")
    
    headers = {
        "Authorization": f"Bearer {OPENROUTER_API_KEY}",
        "Content-Type": "application/json",
    }
    
    url = "https://openrouter.ai/api/v1/chat/completions"
    print(f"[upload-chat] 开始请求API: {url}")
    
    try:
        resp = requests.post(url, headers=headers, json=payload, timeout=120)
        print(f"[upload-chat] API响应状态码: {resp.status_code}")
        
        if resp.status_code >= 400:
            print(f"[upload-chat] API错误响应: {resp.text[:200]}...")
            # 将上游错误信息透传给前端
            raise HTTPException(status_code=resp.status_code, detail=resp.text)
        
        response_data = resp.json()
        print(f"[upload-chat] API请求成功，响应数据长度: {len(str(response_data))}")
        
        # 打印响应的基本信息
        if 'choices' in response_data and len(response_data['choices']) > 0:
            choice = response_data['choices'][0]
            if 'message' in choice:
                message_content = choice['message'].get('content', '')
                print(f"[upload-chat] 响应消息长度: {len(str(message_content))}")
        
        return response_data
    except requests.RequestException as e:
        print(f"[upload-chat] 网络请求异常: {str(e)}")
        raise HTTPException(status_code=502, detail=f"上游网络错误: {str(e)}")

4.条件分支节点

判断上一个HTTP请求点，返回的status code状态码是否为200，200代表请求成功。

5.代码节点

解析Nano Banana API返回的数据，获取content（文字回复）和image_url（生成的图片，是base64字符串格式）。

6.Base64转图片节点

首先需要在插件市场安装Base64插件，将Base64格式的图片转成File类型，用于在最终的回复节点中展示。

7.最终回复节点

给用户展示Nano Banana生成的文字回复和生成的图片。

注意

由于Nano Banana返回的结果较长，超过了本地Dify的限制，所以我们需要修改Dify的.env环境配置文件，加入如下设置：

HTTP_REQUEST_NODE_MAX_BINARY_SIZE=10485760
HTTP_REQUEST_NODE_MAX_TEXT_SIZE=10485760
CODE_MAX_STRING_LENGTH=8000000

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-18

Dify记忆能力实战（上）：上下文记忆与会话变量，让AI告别“金鱼脑”

2026-06-15

Dify也开始CLI了，来看看有啥用途？

2026-06-11

现在用 Dify 上生产？先搞清楚该用哪个版本 !

2026-06-03

Dify做门面，n8n当胶水，LangGraph扛大活——制造业Agent选型真相

2026-06-02

Dify 可观测性方案全解：从内置仪表盘到七大外部集成

2026-05-22

从零上手Dify：让大模型拥有Skill并跑通第一单

2026-04-18

Dify实战：不用写SQL，问就行

2026-04-12

Dify 和 OpenClaw 到底怎么选？不是取代，是分工

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Dify v1.13.3发布了：这次让AI工作流真正"懂"人话

2026-03-28

Dify实战：不用写SQL，问就行

2026-04-18

Dify 和 OpenClaw 到底怎么选？不是取代，是分工

2026-04-12

从零上手Dify：让大模型拥有Skill并跑通第一单

2026-05-22

Dify做门面，n8n当胶水，LangGraph扛大活——制造业Agent选型真相

2026-06-03

现在用 Dify 上生产？先搞清楚该用哪个版本 !

2026-06-11

Dify 可观测性方案全解：从内置仪表盘到七大外部集成

2026-06-02

Dify也开始CLI了，来看看有啥用途？

2026-06-15

Dify记忆能力实战（上）：上下文记忆与会话变量，让AI告别“金鱼脑”

2026-06-18

大家都在问

Dify也开始CLI了，来看看有啥用途？

2026-06-15

刚刚，Dify v1.11.3发布，看看是否需要升级？

2026-01-14

Dify v1.11.2 今天又发现来3个缺陷，看看有什么影响？

2026-01-06

怎样选择Dify工作流中的OCR工具？

2025-12-21

Dify回退版本翻车，你遇到了吗？

2025-12-20

Dify如何接入本地大模型？

2025-12-17

Dify 2025年技术演进总结，有你钟意的亮点吗？

2025-11-29

重大消息，刚刚Dify 1.9.1发布了！我们聊聊带来了哪些吸引人的功能特性？

2025-09-30

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw