我要投稿

Function Calling(函数调用)：解锁大语言模型的潜力

发布日期：2025-06-16 08:46:43 浏览次数： 2238

作者：AI大模型观察站

微信搜一搜，关注“AI大模型观察站”

函数调用（function calling）是一种机制，允许大语言模型（LLM）通过调用外部函数或 API 执行特定的、预定义的任务。可以将其视为一种功能，让 LLM 将它无法独立完成的工作“委托”出去。

例如，假设您向 LLM 发送以下提示：“特斯拉当前的股价是多少？”

没有函数调用的基本 LLM 可能会根据其训练数据中的模式“幻觉”出一个答案，例如“可能在 200 美元左右”。经过 RLHF 优化的模型可能会更诚实地说：“我没有实时数据，所以无法告诉你。”

让我们用 Qwen2.5 0.5B Instruct 快速尝试一下：

from transformers importAutoTokenizer,AutoModelForCausalLM
model_name ="Qwen/Qwen2.5-0.5B-Instruct"
model =AutoModelForCausalLM.from_pretrained(model_name)tokenizer =AutoTokenizer.from_pretrained(model_name)
prompt ="特斯拉当前的股价是多少？"
inputs = tokenizer(prompt, return_tensors="pt")outputs = model.generate(**inputs, max_new_tokens=30, do_sample=True)print(tokenizer.decode(outputs[0]))

输出：

特斯拉当前的股价是多少？抱歉，作为一个 AI 语言模型，我无法访问实时金融数据。特斯拉的股价可能会快速变化。

正如预期，Qwen 表示它不知道，这与任何优秀的指令模型一致。

但通过函数调用，LLM 可以识别对实时股价数据的需求，触发对金融服务的 API 调用，然后生成类似“截至此刻，特斯拉的股价为 279.24 美元”的回答。

显然，函数调用是释放 LLM 全部潜力的关键功能，了解如何使用它至关重要。

现在，像 OpenAI GPT-4 这样的专有模型通过 OpenAI API 原生支持函数调用。它们使用起来更简单，因为一切都在 OpenAI 生态系统中处理。

Mistral AI 的许多模型（如 Mistral Small 或 Mistral Nemo）也是如此，这些模型是开源的，但也通过 API 提供。

让我展示一个使用最新 Mistral Small 的函数调用示例。您需要一个 Mistral API 密钥来运行此示例。

顺便说一句，Mistral 的模型被严重低估。只要用几次，你就会发现它们有多优秀。

首先，安装 Mistral AI 的 Python 客户端：

pip3 install mistralaipip3 list | grep mistralai

输出：

mistralai  1.6.0

接下来，我们需要一个 LLM 可以调用的函数。我将使用 Flask 将该函数作为 REST 端点提供，该函数仅列出本地文件系统中指定目录的所有文件。

from flask importFlask, requestfrom os import path, listdir
app =Flask(__name__)
@app.route('/files')def list_files():    directory = request.args.get('directory','.')    files =([{'name': f}for f in listdir(directory)if path.isfile(path.join(directory, f))])return files
if __name__ =='__main__':    app.run(host='0.0.0.0', port=8000)

您可以使用 curl 从命令行测试此端点，或者使用您喜欢的浏览器。

curl "http://localhost:8000/files?directory=/tmp"

输出：

[{"name":"api.py"}]

现在，我们需要告诉 LLM 这个函数存在，并且在适当的时候使用它。因为我们仍在使用 Mistral LLM（目前是 mistral-small-2503），这相当简单。您只需以 LLM 能理解的格式描述该函数。对于大多数 LLM，格式如下：

available_functions =[{"type":"function","function":{"name":"files","description":"列出目录中的文件","parameters":{"type":"object","properties":{"directory":{"type":"string","description":"目录的绝对路径"},},"required":["directory"]}}}]

当然，函数描述越详细、信息量越大，效果越好。

此时，您只需将 available_functions 数组与提示一起传递给客户端。

from mistralai importMistralapi_key ="..."model ="mistral-small-2503"
mistral =Mistral(api_key)response = mistral.chat.complete(    model = model,    messages =[{"role":"user","content":"列出 /tmp 目录中的所有文件。"}],    tools = available_functions,    tool_choice ="any")
print(response.choices[0].message.tool_calls[0])

输出：

function=FunctionCall(  name='files',  arguments='{"directory": "/tmp"}')id='12bc4' type=None index=0

如您所见，Mistral Small 成功根据给定的提示推断出需要调用 files 函数，并使用参数 /tmp。

不过，它不会自己调用函数。这是我们需要做的事情。因此，我们检查 tool_calls 数组，如果它不为空，我们就运行 Mistral 希望我们运行的函数。

在我们的例子中，因为我们有一个 REST 端点，我们可以使用 requests 库进行 GET 请求。

import jsonimport requests
if response.choices[0].message.tool_calls:    tool_call = response.choices[0].message.tool_calls[0]if tool_call.function.name =="files":        output = requests.get("http://localhost:8000/files?directory="+            json.loads(                tool_call.function.arguments)["directory"]).json()print(output)

输出：

[{'name':'qq1.html'}]

请注意，参数目前是以字符串形式到达，我们需要先将其转换为 JSON。这就是代码中包含 json.loads() 的原因。

还值得注意的是，LL彼此之间，LLM 在这里没有生成文本。输出到标准输出（stdout）应该是您的函数。

很好，现在我们知道如何使用通过 API 访问的 LLM 进行函数调用。

在本文的其余部分，我们将使用可以本地运行的开源模型。许多这些模型支持函数调用，但使用该功能需要额外步骤。您会发现，这些模型照常生成 token，作为开发者的您需要解析、解释并使用这些 token 来触发函数。

让我们看看是否可以直接将 available_functions 数组传递给 Llama 3.2–1B Instruct 以使其调用我们的函数。

我们首先加载模型：

from transformers importAutoTokenizer,AutoModelForCausalLM
model_name ="meta-llama/Llama-3.2-1B-Instruct"model =AutoModelForCausalLM.from_pretrained(model_name)tokenizer =AutoTokenizer.from_pretrained(model_name)

接下来，我们需要将提示包装在聊天模板中，而不是直接传递给模型。聊天模板应包含 available_functions 数组，以指定模型可以使用的工具。

messages =[{"
role": "system", "content": "你是一个有用的助手。"},{"role":"user","content":"/tmp 目录中有哪些文件？"},]template= tokenizer.apply_chat_template(    messages, tools=available_functions,    tokenize=False)

最后，我们对模板进行 token 化，并将其作为输入传递给模型。

inputs = tokenizer(template, return_tensors="pt")outputs = model.generate(**inputs, max_new_tokens=30, do_sample=True)print(tokenizer.decode(outputs[0]))

输出：

......<|python_tag|>{"type":"function","function":"files","parameters":{"directory":"/tmp"}}<|eom_id|>

看起来 Llama 3.2 也成功识别了函数调用。这很好！但函数调用目前只是一个（JSON 格式的）字符串，被 <|python_tag|> 和 <|eom_id|> 包裹。eom_id 只是一个特殊的消息结束 token。

提取模型输出的函数调用有很多方法。我将保持简单，使用正则表达式。

import jsonimport regenerated_text = tokenizer.decode(outputs[0])
matched = re.search(    r"<\|python_tag\|>(.*?)<\|eom_id\|>",    generated_text, re.DOTALL)function_call = json.loads(matched.group(1).strip())print(function_call)

输出：

{'type':'function','function':'files','parameters':{'directory':'/tmp'}}

现在您知道如何使用 Llama 进行函数调用。

如果从 Llama 切换到 Qwen，变化不大。但 Qwen 使用一组不同的 token 来包裹函数调用。以下是 Qwen 的输出：

<|im_start|>assistant<tool_call>{"name":"files","arguments":{"directory":"/tmp"}}</tool_call><|im_end|>

因此，您的正则表达式需要稍作调整以处理这种新格式。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费POC验证，效果达标后再合作。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2026-05-01

永别了，终端！OpenAI疯狂升级Codex，接管Mac人类全程0操作围观

2026-04-30

Karpathy 最新访谈：Vibe Coding 只是开始，真正重要的是 Agentic Engineering

2026-04-30

近4万Star！一个终端把自己变成了AI开发环境，Cursor和Claude Code都沉默了

2026-04-29

Claude Code 的 Memory 系统：让 AI 记住你的偏好

2026-04-29

深入浅出Harness Engineerring之核心模式与理念

2026-04-28

别急着All-in DeepSeek V4，先看看这10位从业者的真心话

2026-04-28

你不知道的 Agent：原理、架构与工程实践

2026-04-27

从 Prompt 到 Harness，Agent 进入企业需要流程治理吗

联系获取

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Claude Opus 4.7刚刚曝光！Claude Code一夜重构，7x24小时替你打工

2026-04-15

刚刚Qwen 3.6 Plus上线预览：1M上下文，阿里Coding/Agent翻身战打响

2026-03-31

2026年国内如何注册 Claude 账号教程

2026-03-13

豆包 2.0 模型发布，全信息整理（全网最完整，另附 79 页 Model Card）

2026-02-14

Codex 独立 App 来了，这是一个新东西

2026-02-03

谷歌重大更新：国内手动开启 Gemini AI 侧边栏与 Auto Browse 自动浏览全攻略

2026-02-03

OpenAI 发布新的 Codex 桌面版，我现在不骂 Codex 难用了

2026-02-03

独家| DeepSeek-V4终于要来了：梁文锋憋半年大招，多模态+长期记忆全面破局

2026-03-17

全网最详细的Codex入门教程，手把手教你玩转Vibe Coding。

2026-02-09

香港终于能直接用 Gemini 了，内地用户能用上吗？

2026-03-17

大家都在问

「双线实测」Qwen 3.6-Plus，Agentic Coding 已经这么能「扛活儿」了？

2026-04-26

本体化语义层，会是 AI 数据平台的新地基吗？

2026-04-22

设计行业的“棺材板”，要被Claude Design盖上了？

2026-04-18

当所有人都不写代码了，谁来看懂代码？

2026-04-13

什么场景该用 AI Native？

2026-04-12

12MB的Go二进制，让AI操控浏览器只花800 tokens，PinchTab凭什么这么省？

2026-04-07

华为AI 49元/月！贵？不贵？

2026-04-01

为什么这波 AI 产品都开始抢着做 CLI ？

2026-03-31

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS Skill 提示词技巧 AI+电商 AI面试数字员工 ChatBI AI知识库开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB Palantir Glean Openclaw