免费POC, 零成本试错
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


全网首发Dify Nano Banana工作流

发布日期:2025-09-17 17:59:24 浏览次数: 1529
作者:考拉的Ai树屋

微信搜一搜,关注“考拉的Ai树屋”

推荐语

全网首发!本地私有化部署Dify工作流,Nano Banana提示词助力高效AI交互。

核心内容:
1. 工作流编排全览与基础设置详解
2. HTTP请求节点与OpenRouter API对接方案
3. Python+FastAPI服务端核心代码解析

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

 

全网首发Nano Banana dify工作流

使用的是本地私有化部署的Dify

效果展示:


工作流编排

工作流编排全览

基础设置

  • • 设置开场白

开场白中编写便捷用户体验的谷歌官方Nano Banana提示词。

  • • 打开图片上传功能

1. 开始节点

接收用户的输入和上传的图片。

2. 列表操作

操作用户上传的文件,这里取用户上传的最后一张图片。

3.HTTP请求节点

使用form-data的方式向服务端发送用户选择的图片和提示词。

理论上,也可以使用Dify内置的代码节点直接向openrouter api 接口发起请求

服务端采用的是Python + FastAPI的方式,给Dify提供API接口。

核心代码如下,采用openrouter提供的Nana Banana API接口。

@app.post("/upload")
async def upload_chat(prompt: str = Form(...), image: Optional[UploadFile] = File(None)):
    """处理 form-data 方式上传的图片和 prompt,单轮对话"""
    print(f"[upload-chat] 收到请求 - prompt长度: {len(prompt)}, 是否有图片: {image is not None}")
    print(f"[upload-chat] prompt内容: {prompt[:100]}{'...' if len(prompt) > 100 else ''}")
    
    if not OPENROUTER_API_KEY:
        print("[upload-chat] 错误: OPENROUTER_API_KEY 未配置")
        raise HTTPException(status_code=500, detail="OPENROUTER_API_KEY 未配置")
    
    # 构造消息内容
    content = [{"type": "text", "text": prompt}]
    print(f"[upload-chat] 初始消息内容构造完成")
    
    # 如果有图片,处理图片数据
    if image and image.filename:
        print(f"[upload-chat] 开始处理图片 - 文件名: {image.filename}, 类型: {image.content_type}")
        try:
            # 读取图片数据
            image_data = await image.read()
            print(f"[upload-chat] 图片读取完成 - 大小: {len(image_data)} bytes")
            
            # 转换为 base64
            image_b64 = base64.b64encode(image_data).decode('utf-8')
            print(f"[upload-chat] base64转换完成 - 长度: {len(image_b64)}")
            
            # 获取文件类型
            content_type = image.content_type or "image/jpeg"
            print(f"[upload-chat] 文件类型: {content_type}")
            
            # 构造 data URL
            data_url = f"data:{content_type};base64,{image_b64}"
            
            # 添加图片到消息内容
            content.append({
                "type": "image_url",
                "image_url": {"url": data_url}
            })
            print(f"[upload-chat] 图片添加到消息内容完成")
        except Exception as e:
            print(f"[upload-chat] 图片处理错误: {str(e)}")
            raise HTTPException(status_code=400, detail=f"图片处理错误: {str(e)}")
    else:
        print("[upload-chat] 无图片上传,仅处理文本")
    
    # 构造符合 Gemini 格式的消息
    messages = [{
        "role": "user",
        "content": content
    }]
    print(f"[upload-chat] 消息格式构造完成 - 内容项数: {len(content)}")
    
    payload: dict[str, Any] = {
        "model": "google/gemini-2.5-flash-image-preview",
        "messages": messages,
        "modalities": ["image", "text"]  # 明确要求返回图片和文本
    }
    print(f"[upload-chat] API请求载荷构造完成")
    
    headers = {
        "Authorization": f"Bearer {OPENROUTER_API_KEY}",
        "Content-Type": "application/json",
    }
    
    url = "https://openrouter.ai/api/v1/chat/completions"
    print(f"[upload-chat] 开始请求API: {url}")
    
    try:
        resp = requests.post(url, headers=headers, json=payload, timeout=120)
        print(f"[upload-chat] API响应状态码: {resp.status_code}")
        
        if resp.status_code >= 400:
            print(f"[upload-chat] API错误响应: {resp.text[:200]}...")
            # 将上游错误信息透传给前端
            raise HTTPException(status_code=resp.status_code, detail=resp.text)
        
        response_data = resp.json()
        print(f"[upload-chat] API请求成功,响应数据长度: {len(str(response_data))}")
        
        # 打印响应的基本信息
        if 'choices' in response_data and len(response_data['choices']) > 0:
            choice = response_data['choices'][0]
            if 'message' in choice:
                message_content = choice['message'].get('content', '')
                print(f"[upload-chat] 响应消息长度: {len(str(message_content))}")
        
        return response_data
    except requests.RequestException as e:
        print(f"[upload-chat] 网络请求异常: {str(e)}")
        raise HTTPException(status_code=502, detail=f"上游网络错误: {str(e)}")

4.条件分支节点

判断上一个HTTP请求点,返回的status code状态码是否为200,200代表请求成功。

5.代码节点

解析Nano Banana API返回的数据,获取content(文字回复)和image_url(生成的图片,是base64字符串格式)。

6.Base64转图片节点

首先需要在插件市场安装Base64插件,将Base64格式的图片转成File类型,用于在最终的回复节点中展示。

7.最终回复节点

给用户展示Nano Banana生成的文字回复和生成的图片。


注意

由于Nano Banana返回的结果较长,超过了本地Dify的限制,所以我们需要修改Dify的.env环境配置文件,加入如下设置:

HTTP_REQUEST_NODE_MAX_BINARY_SIZE=10485760
HTTP_REQUEST_NODE_MAX_TEXT_SIZE=10485760
CODE_MAX_STRING_LENGTH=8000000

 

53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询