【转载】【已开源】一个基于banana pro的一站式PPT生成应用, 告别排版美化烦恼

青年 发布于 1 天前 8 次阅读


AI智能摘要
一个基于nano banana pro的开源AI PPT生成应用“banana-slides”已上线,支持上传任意模板图片与素材,通过一句话、大纲或页面描述自动生成风格统一的PPT。应用具备口头修改指定区域、智能解析文本图片表格、一键导出等功能,致力于解决传统AI做PPT模板固定、设计感弱等问题。项目持续优化中,已在GitHub获两百多star。
— 此摘要由AI分析文章内容生成,仅供参考。

本文为转载内容,保留原帖观点与结构;如有侵权请联系我处理。

鄙人平时经常有做ppt的需求,但是又不擅长做PPT,每次做都需要花费大量时间在ppt样式调整和排版上。我也使用过传统的AI PPT app,虽然能快速产出ppt,但是还存在 1只能选预设模板、2自由度低、3设计感差和4同质化严重 的问题。上周五突发奇想,

:banana:
pro的一致性那么强,还能渲染中文了,能不能用
:banana:
仿照随便一张图,让他根据要求做一页风格相似的ppt出来?

然后我就去试了一下。结果发现,好像还不错??(左随便截图的模板,右生成结果)。

这已经完全到了可用的程度。于是我想,为什么不基于

:banana:
pro,做一个"原生的" "Vibe PPT"app呢?于是直接动手开始coding​
:rocket:

(做的过程中也在l站刷到了@默子 大佬的尝试【太强了】🍌 Nano Banana Pro 让我一个小时做完了PPT,我去 ,进一步坚定了做下去的想法,这里致敬一下

:grinning_face_with_smiling_eyes:


经过一周的dev(嗯,用vibe coding vibe一个 vibe ppt的应用),目前项目已经有能力做出下面的ppt成品(截取前9页):

目前的核心功能:

1. 能够一句话/大纲/页面描述自动生成PPT, 支持Vibe方式让大模型生成或调整大纲和页面描述内容,也可以手动编辑拖动等

(大纲就是每一页内容概要,页面描述就是通过概要展开出来的实际文字内容和风格描述等)

2. 对区域进行口头编辑:

3. 文件上传 + 自动解析里面的文本、图片、表格、公式 + 模型智能识别素材 匹配到相关PPT页面

4. 一键导出为pdf或者ppt文件:

目前还在进行应该是最困难的一步的开发,就是从纯图的图片中分割出可编辑的元素,目前想到的技术方案是用类似SAM(segment anything ) + Inpaint这样的东西来实现,或者佬们有什么好方案也可以分享

:grinning_face_with_smiling_eyes:
(当前也能对页面进行编辑,但是为直接图生图的方式,框选区域然后口头让模型调整,理论上什么都可以调,但是我们还是会有一些手动编辑的需求)

目前项目还在持续优化,欢迎佬友们的star关注

:glowing_star:
也欢迎提交issue反馈


PS: 目前版本,使用

:banana:
生成ppt的一些个人经验:

  1. 上传的模板参考图需要避免一图放下太多内容和元素,一般最多一张图含3-4子页面

  2. 不要让模型渲染太多的文字,否则容易生成乱码

已知的偶发性问题(部分情况可以通过重新生成 roll几次来解决):

  1. 中文渲染还是有一定的错误可能

  2. 原模板成分过多会对结果造成干扰


补充:

上周想着还能再把项目做完善些,因此除了在某书发了个成品效果,没做任何其他的分享。意外的是从昨天开始,好像有人发掘出了鄙人的项目并发到了网上,一路把repo的star点到了两百多(吓得我赶紧去把之前已知的几个bug给修复了

:grinning_face_with_smiling_eyes:
),如果其中有各位佬友的star,十分感谢您能认可项目的价值
:rocket:


📌 转载信息
转载时间: 2025/12/10 14:58:22