我要投稿

手把手教你在dify中如何将用户输入的长文本分割成多个内容

发布日期：2024-08-28 14:14:20 浏览次数： 9063

作者：提示日记

微信搜一搜，关注“提示日记”

如果你是dify开发者，或者是工作流的狂热爱好者，你难免会遇到这么一个问题：当用户输入一个超长文本内容时，你的工作流没办法一下子处理这么长的内容，或者没办法将这么长的内容按照预期处理的非常精致。

其实这个问题之前也总是困扰我，尤其是我最近在用dify玩超长文本翻译的工作流时，受大模型的限制，没办法一下子将超长文本一次性处理到位，于是我就想到一个替代方案，就是先将长文本切割成多个短文本，然后使用迭代节点，分批次处理，最后完成结果的拼接。这样我的大模型就有较大的把握处理好这个场景问题。

其实操作起来也很简单，就是在“开始节点”后面接入一个“代码执行”节点，并且这个代码执行节点只写最基础的脚本，不需要处理复杂的逻辑。如下是Python代码参考示例：


def main(input_text: str) -> str:    token_limit = 1000    overlap = 100    chunk_size = int(token_limit * 6 * (4/3))
        # Initialize variables    chunks = []    start_index = 0    text_length = len(input_text)
    # Loop until the end of the text is reached    while start_index < text_length:        # If we are not at the beginning, adjust the start_index to ensure overlap        if start_index > 0:            start_index -= overlap
        # Calculate end index for the current chunk        end_index = start_index + chunk_size        if end_index > text_length:            end_index = text_length
        # Add the current chunk to the list        chunks.append(input_text[start_index:end_index])
        # Update the start_index for the next chunk        start_index += chunk_size
    return {        "chunks": chunks,    }

请注意chunks输出变量的类型要选array[string]。

代码节点将 input_text 分成长度为 token_limit 的块。每个块相互重叠，以确保文本的一致性。

代码节点输出一个由 input_texts 分段文本组成的数组 chunks。

当我们切分长文本之后，后面就要跟上一个迭代节点，按照你的实际需要分批次加工了。

迭代逻辑处理完成后，你最终是需要将内容拼接好，并展示出来的，所以你可能会用到“模板转换”节点。当然，你使用代码执行节点，手搓代码进行拼接也是可以的，这个随你的编程能力而定。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-06-27

我用 Dify 1.15.0 搭了个全自动图文生产机，效率直接翻3倍

2026-06-26

Dify 1.15.0解读：difyctl、HITL表单和慢模型轮询，企业AI工程化继续补底座

2026-06-26

时隔一个多月，Dify v1.15.0终于发布了！

2026-06-18

Dify记忆能力实战（上）：上下文记忆与会话变量，让AI告别“金鱼脑”

2026-06-15

Dify也开始CLI了，来看看有啥用途？

2026-06-11

现在用 Dify 上生产？先搞清楚该用哪个版本 !

2026-06-03

Dify做门面，n8n当胶水，LangGraph扛大活——制造业Agent选型真相

2026-06-02

Dify 可观测性方案全解：从内置仪表盘到七大外部集成

联系获取

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Dify实战：不用写SQL，问就行

2026-04-18

Dify 和 OpenClaw 到底怎么选？不是取代，是分工

2026-04-12

从零上手Dify：让大模型拥有Skill并跑通第一单

2026-05-22

Dify做门面，n8n当胶水，LangGraph扛大活——制造业Agent选型真相

2026-06-03

现在用 Dify 上生产？先搞清楚该用哪个版本 !

2026-06-11

Dify 可观测性方案全解：从内置仪表盘到七大外部集成

2026-06-02

Dify也开始CLI了，来看看有啥用途？

2026-06-15

Dify记忆能力实战（上）：上下文记忆与会话变量，让AI告别“金鱼脑”

2026-06-18

时隔一个多月，Dify v1.15.0终于发布了！

2026-06-26

Dify 1.15.0解读：difyctl、HITL表单和慢模型轮询，企业AI工程化继续补底座

2026-06-26

大家都在问

Dify也开始CLI了，来看看有啥用途？

2026-06-15

刚刚，Dify v1.11.3发布，看看是否需要升级？

2026-01-14

Dify v1.11.2 今天又发现来3个缺陷，看看有什么影响？

2026-01-06

怎样选择Dify工作流中的OCR工具？

2025-12-21

Dify回退版本翻车，你遇到了吗？

2025-12-20

Dify如何接入本地大模型？

2025-12-17

Dify 2025年技术演进总结，有你钟意的亮点吗？

2025-11-29

重大消息，刚刚Dify 1.9.1发布了！我们聊聊带来了哪些吸引人的功能特性？

2025-09-30

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件 FDE AI+医疗 MaxKB Palantir Glean Openclaw

应聘简历请发送至： ceo@53ai.com

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部