微信扫码
添加专属顾问
我要投稿
微软开源LLMLingua,解决大模型提示词过长问题,20倍压缩比显著降低成本与延迟!核心内容: 1. LLMLingua的三层压缩框架与20倍压缩比技术原理 2. 针对长文档优化的LongLLMLingua动态压缩策略 3. LLMLingua-2突破性采用机器学习分类器实现智能压缩
什么是 LLMLingua
LLMLingua系列技术演进
使用方法及效果
pip install llmlingua
from llmlingua import PromptCompressor# Initialize the compressorllm_lingua = PromptCompressor()# Compress the promptprompt = "Sam bought a dozen boxes, each with 30 highlighter pens inside, for $10 each box..."compressed_prompt = llm_lingua.compress_prompt(prompt, instruction="", question="", target_token=200)print(compressed_prompt)
{'compressed_prompt': 'Question: Sam bought a dozen boxes each with 30 highlighter pens...','origin_tokens': 2365,'compressed_tokens': 211,'ratio': '11.2x','saving': 'Saving $0.1 in GPT-4.'}
# Use a more powerful compression modelllm_lingua = PromptCompressor("microsoft/phi-2")# Or use a quantized model for GPUs with limited memory# Requires: pip install optimum auto-gptqllm_lingua = PromptCompressor("TheBloke/Llama-2-7b-Chat-GPTQ", model_config={"revision": "main"})
小结
END
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-01-10
Cursor、CC、Codex 直接用!上下文工程 Agent Skills 来了,一周狂揽 4k Star
2026-01-09
Cursor 动态上下文发现:如何用「文件化」策略将 Token 消耗降低 47%
2026-01-08
Prompt 里的攻防战:给System Prompt穿上防弹衣的 3 道防线
2026-01-07
GenAI输出内容控制的5种设计模式
2026-01-07
Agent创业者的机会窗口来了!
2026-01-06
Noi v1.0.0 正式发布!
2026-01-05
智能体就是刚入职一家公司的新员工——智能体核心流程揭秘
2026-01-05
别再把 Prompt 写死在代码里了:如何构建动态模板库?
2025-11-20
2025-11-15
2025-11-15
2025-11-12
2025-10-27
2025-12-02
2025-10-31
2025-11-15
2025-11-03
2025-11-16
2026-01-05
2025-12-30
2025-12-26
2025-12-15
2025-12-11
2025-12-06
2025-09-02
2025-08-11