微信扫码
添加专属顾问
我要投稿
自定义Langgraph嵌入技术,实现第三方平台嵌入接口的整合。核心内容:1. Langgraph中使用第三方嵌入接口的需求分析2. 继承Embeddings类并实现自定义嵌入方法的步骤3. 封装自定义嵌入类,整合硅基流平台接口的代码实例
在Langgraph中我想使用第三方的embeding接口来实现文本的embeding。但目前langchain只提供了两个类,一个是AzureOpenAIEmbeddings,一个是:OpenAIEmbeddings。通过ChatOpenAI无法使用第三方的接口,例如:硅基流平台的接口。只能自己封装一个类,继承Embeding接口,从而实现整合第三方平台Embending API的能力。
通过继承和实现langchain_core.embeddings
的Embeddings
类,并实现文本嵌入和查询接口。
在实现嵌入类时,需要实现embed_documents和embed_query两个接口。
importrequests
importos
fromtypingimportList
fromlangchain_core.embeddingsimportEmbeddings
fromdotenvimportload_dotenv
classCustomSiliconFlowEmbeddings(Embeddings):
def__init__(
self,
api_key: str,
base_url: str="https://api.siliconflow.cn/v1/embeddings",
model: str="BAAI/bge-large-zh-v1.5"
):
self.api_key=api_key
self.base_url=base_url
self.model=model
defembed_documents(self, texts: List[str]) ->List[List[float]]:
"""Embed a list of documents."""
embeddings= []
fortextintexts:
embedding=self.embed_query(text)
embeddings.append(embedding)
returnembeddings
defembed_query(self, text: str) ->List[float]:
"""Embed a query."""
headers= {
"Authorization": f"Bearer {self.api_key}",
"Content-Type": "application/json"
}
payload= {
"model": self.model,
"input": text,
"encoding_format": "float"
}
response=requests.post(
self.base_url,
json=payload,
headers=headers
)
ifresponse.status_code==200:
returnresponse.json()["data"][0]["embedding"]
else:
raiseException(f"Error in embedding: {response.text}")
使用时,需要设置api_key的值,和模型名称,以及base_url等参数。
# Load environment variables
load_dotenv()
SL_API_KEY=os.getenv("SL_API_KEY")
# Initialize embedding model
embedding_model=CustomSiliconFlowEmbeddings(
base_url="https://api.siliconflow.cn/v1/embeddings",
api_key=SL_API_KEY,
model="BAAI/bge-large-zh-v1.5"
)
# Test the embedding
if__name__=="__main__":
test_text="您好世界!"
result=embedding_model.embed_query(test_text)
print(f"Embedding dimension: {len(result)}")
print(f"First few values: {result[:10]}")
# 获取网页中的数据,并进行分割,然后存储到FAISS中
urls= [
"https://lilianweng.github.io/posts/2023-06-23-Agent/",
"https://lilianweng.github.io/posts/2023-03-15-prompt-engineering/",
"https://lilianweng.github.io/posts/2023-10-25-adv-attack-llm/"
]
docs= [WebBaseLoader(url).load() forurlinurls]
docs_list= [itemforsublistindocsforiteminsublist]
text_splitter=RecursiveCharacterTextSplitter.from_tiktoken_encoder(chunk_size=250, chunk_overlap=0)
doc_splits=text_splitter.split_documents(docs_list)
vectorstore=FAISS.from_documents(documents=doc_splits, embedding=embedding_model)
retriever=vectorstore.as_retriever()
# 测试检索功能,查询与问题最相关的分块文档
resp=retriever.invoke("什么是prompt engineering?")
# 返回的是一个个Document对象
fordocinresp:
print(doc.id+": "+doc.page_content)
输出:
Embedding dimension: 1024
First few values: [0.021915348, 0.0048826355, -0.09566349, -0.010307786, -0.0025656442, 0.043084737, -0.045955546, 0.011641469, 0.02809776, -0.012489148]
https://docs.siliconflow.cn/cn/api-reference/embeddings/create-embeddings
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-06-07
为 AI Agent 铺路:深度解析下一代应用的核心基建 LangGraph
2025-06-05
智能体框架怎么选?LangChain、Dify、CrewAI、AutoGen五大框架横向对比
2025-06-04
吴恩达对谈LangChain创始人:企业构建Agen系统的核心认知!
2025-06-02
一文看懂RAG、LangChain、Agent三者的关系
2025-05-31
吴恩达:别再纠结Agent定义,AI Agent开发者应关注这些要点
2025-05-30
使用 LangChain 与 MCP集成
2025-05-30
AI Agent之LangChain多个案例实战
2025-05-30
基于Langchain框架的Agent智能体实现之工具集成
2024-10-10
2024-07-13
2024-06-03
2024-09-04
2024-04-08
2024-04-08
2024-08-18
2024-03-28
2024-06-24
2024-07-10
2025-05-21
2025-05-19
2025-05-08
2025-05-06
2025-04-22
2025-04-18
2025-03-22
2025-03-22