支持私有化部署
AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


谷歌Gemini推出AI故事书生成器:几句话就能制作10页图文书,支持中文

发布日期:2025-08-07 06:33:04 浏览次数: 1524
作者:AIbase基地

微信搜一搜,关注“AIbase基地”

推荐语

谷歌Gemini推出AI故事书生成器,几句话就能生成10页图文并茂的个性化故事书,支持中文创作和语音朗读。

核心内容:
1. 一键生成10页图文故事书,支持多种艺术风格和图片上传定制
2. 提供完整多媒体体验,包含语音朗读和打印分享功能
3. 全球多语言支持,中文用户友好度高,适合教育和个人创作

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

谷歌今日为其Gemini AI聊天机器人新增了"Storybook"功能,用户仅需简单描述故事情节,系统便可自动生成一本完整的图文并茂故事书。这项功能的推出标志着AI内容创作工具在个性化出版领域的新突破。

每本AI生成的故事书包含10个页面,每页都配有简洁的文字描述和相应的插图。Gemini不仅能够创作故事内容,还具备语音朗读功能,为用户提供完整的多媒体阅读体验。

在个性化定制方面,Storybook功能表现出色。用户可以根据个人喜好选择不同的视觉风格,包括黏土动画、动漫和漫画等多种艺术表现形式。更为贴心的是,该功能还支持图片上传功能,家长可以将孩子的画作上传至系统,让Gemini以这些创作为灵感基础编写专属故事。

222.jpg

从技术覆盖范围来看,Storybook功能已在全球范围内正式上线,支持桌面端和移动端设备,并且兼容Gemini目前支持的所有语言版本。

经过实际测试,该功能对中文用户友好度较高,能够生成流畅的简体中文内容,同时提供便捷的分享和导出打印选项,方便用户保存或制作实体书籍。

image.png

不过,这项功能在技术细节上仍有改进空间。测试过程中发现,不同页面中同一角色的外观一致性还无法完全保证,比如故事中角色在不同页面可能出现服装颜色不统一的情况。

这一技术局限表明AI在保持视觉连贯性方面仍需进一步优化。不过大多数情况下人物还是挺一致的,这个效果已经非常OK了。

image.png
image.png
image.png
image.png
image.png

尽管存在一些小瑕疵,Storybook功能的推出仍为内容创作者、教育工作者和家长提供了全新的故事创作工具,特别是在儿童教育和个性化阅读体验方面具有重要意义。

      


53AI,企业落地大模型首选服务商

产品:场景落地咨询+大模型应用平台+行业解决方案

承诺:免费POC验证,效果达标后再合作。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

添加专属顾问

回到顶部

加载中...

扫码咨询