微信扫码
添加专属顾问
我要投稿
腾讯的PhotoMaker是一款开源工具,利用堆叠ID技术生成逼真的定制人物照片。它可以根据描述生成符合要求的人物形象,并混合多张人物特征,创造全新人物。PhotoMaker还能改变照片中人物的性别和年龄,生成多种风格的照片,效果自然且快速。Github和Huggingface在文章底部
现有的个性化生成方法难以同时实现高效率、身份保真度和灵活文本控制。PhotoMaker通过将多个输入ID图像编码为堆栈式ID嵌入,保留身份信息,全面封装同一ID的特征,并整合不同ID特征,提供更大灵活性。
此外,PhotoMaker提出了一种面向ID的数据构建管道来组装训练数据,展示了优于测试时微调方法的ID保真能力,同时提供显著的速度改进、高质量生成结果、强大泛化能力和广泛应用。
https://github.com/TencentARC/PhotoMakerhttps://huggingface.co/spaces/TencentARC/PhotoMaker-V2
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业
2026-06-25
谷歌开源 agents-cli:让 AI 助手帮你完成企业级 Agent 从搭建到部署全流程!
2026-06-25
官宣|我们推出了开源版Claude Tag,以及它背后记忆与工具引擎 MFS
2026-06-24
Nathan Lambert:GLM-5.2是开源Agent重大突破,连锁反应将渗透进更广泛的经济体
2026-06-23
百度开源 Unlimited OCR:让长文档解析一次完成
2026-06-23
我把自己的需求到交付 Skills 开源了:Analysis to Delivery
2026-06-23
腾讯开源WeKnora知识库部署实战(含踩坑排查)
2026-06-22
DiffusionGemma: 文本生成速度提升 4 倍
2026-06-22
刚刚,百度开源拿下全球第一!作者疑似DeepSeek出走大神
2026-03-30
2026-04-09
2026-04-03
2026-04-01
2026-03-31
2026-03-30
2026-04-18
2026-04-18
2026-03-31
2026-04-02
2026-06-16
2026-05-30
2026-05-16
2026-04-22
2026-04-21
2026-04-15
2026-04-09
2026-04-01