本文为转载内容,保留原帖观点与结构;如有侵权请联系我处理。
鄙人平时经常有做ppt的需求,但是又不擅长做PPT,每次做都需要花费大量时间在ppt样式调整和排版上。我也使用过传统的AI PPT app,虽然能快速产出ppt,但是还存在 1只能选预设模板、2自由度低、3设计感差和4同质化严重 的问题。上周五突发奇想,

然后我就去试了一下。结果发现,好像还不错??(左随便截图的模板,右生成结果)。
这已经完全到了可用的程度。于是我想,为什么不基于

(做的过程中也在l站刷到了@默子 大佬的尝试【太强了】🍌 Nano Banana Pro 让我一个小时做完了PPT,我去 ,进一步坚定了做下去的想法,这里致敬一下
经过一周的dev(嗯,用vibe coding vibe一个 vibe ppt的应用),目前项目已经有能力做出下面的ppt成品(截取前9页):
目前的核心功能:
1. 能够一句话/大纲/页面描述自动生成PPT, 支持Vibe方式让大模型生成或调整大纲和页面描述内容,也可以手动编辑拖动等
(大纲就是每一页内容概要,页面描述就是通过概要展开出来的实际文字内容和风格描述等)
2. 对区域进行口头编辑:
3. 文件上传 + 自动解析里面的文本、图片、表格、公式 + 模型智能识别素材 匹配到相关PPT页面
4. 一键导出为pdf或者ppt文件:
目前还在进行应该是最困难的一步的开发,就是从纯图的图片中分割出可编辑的元素,目前想到的技术方案是用类似SAM(segment anything ) + Inpaint这样的东西来实现,或者佬们有什么好方案也可以分享
目前项目还在持续优化,欢迎佬友们的star关注
PS: 目前版本,使用
-
上传的模板参考图需要避免一图放下太多内容和元素,一般最多一张图含3-4子页面
-
不要让模型渲染太多的文字,否则容易生成乱码
已知的偶发性问题(部分情况可以通过重新生成 roll几次来解决):
-
中文渲染还是有一定的错误可能
-
原模板成分过多会对结果造成干扰
补充:
上周想着还能再把项目做完善些,因此除了在某书发了个成品效果,没做任何其他的分享。意外的是从昨天开始,好像有人发掘出了鄙人的项目并发到了网上,一路把repo的star点到了两百多(吓得我赶紧去把之前已知的几个bug给修复了
),如果其中有各位佬友的star,十分感谢您能认可项目的价值






Comments NOTHING