
最近刚结束毕业答辩,在答辩组里,发现大多数同学还是用传统的方式在制作PPT。
而我的答辩PPT大部分用到了AI,比起我手工制作,美观度翻倍,效率提升了200%。
本文就来分享一下,我是如何在毕业答辩这种严肃的专业场景,用 AI 实现提效的。
纵观 AI 制作 PPT 的赛道,基本上就是三种技术路线[1]:
这三个派别都有各自优劣势,Html 派能够用到丰富的CSS样式库,但不适合给别人发送。
原生流派最为通用,但受限于 SVG 本身的表现能力,上限受到限制。
AI 生成派的理论上限无限高,不受任何框架的约束,但如果想要精确编辑里面的文字,需要再次生成,可控性有限,但并非无法解决。
下面我直接让 AI 读取我的 Latex 论文稿件,用三种流派分别来制作PPT。
使用 Html 来制作PPT,无非是用到一些先用的 PPT 制作skill,以 guizang-ppt-skill [2] 这个 skill 为例。
使用它,不需要看readme,只需要在codex里打开论文项目,输入以下提示词:
根据我的文章内容,使用op7418/guizang-ppt-skill这个skill,做一个用于答辩的PPT,最后将所有内容合成为一个.pptx 文件。
它的生成效果如下:

不难发现,这玩意只是一个自娱自乐的玩具而已,只适合把杂乱的信息组织成略显美观的可阅读内容,而不适合真正生产的严肃场景。
原生流派以 ppt-master[3] 这个项目提供的方式为例,同样只需要告诉codex:
根据我的文章内容,生成答辩ppt,使用hugohe3/ppt-master去生成
它的生成效果如下:

受限于SVG的表征能力,它的观感实在是很廉价,和那些号称辅助制作 PPT 的 AI工具效果非常近似。
AI生成流派在codex里面使用同样很简单,只需要这么说:
根据我的文章内容,生成答辩ppt,每一页都要直接用图像生成模型去生成,生成好所有图片之后,将图片按顺序合成为一个.pptx 文件。
生成效果如下:

这效果和前两个流派相比,高下立判,效果完全不在同一个层面。
但是,细看之后,这种方法还是有一些小缺陷:
但这几个问题都有解决方法。
解决这几个问题的思路很简单,核心思想就是人机协同。
AI 无法判断的,引入人的先验知识;AI 无法解决的,通过人来后期修复。
第一个问题,风格问题,通过模板法解决。
所谓模板法有两重含义:第一重含义是给AI看模板参考图,让它按照布局进行生成;第二重含义是用模板来统一样式,对生成的图片,只裁剪其主要内容,幻灯片的一致性通过固定模板来处理。

第二个问题,内容问题,通过预填充内容法来解决。
比如下面这个例子,这一页我要写损失函数,我先把内容填充好,排布成上图的样式,让AI进行优化,就变成了下图可直接使用的样式。

第三个问题,失真问题,通过覆盖法来解决。
比如下面这一页,原本生成的图,公式部分存在问题,那就再把正确的公式贴上去,覆盖到上层。同理,对于部分失真的文字,也可以通过此法解决。

第四个问题,清晰度问题,通过API法来解决。
如果直接在gpt里生成一张16:9的图像,它的尺寸可能是这样:1672 × 941,不到1080p,在2k/4k 显示屏上显示时,难免有点糊糊的。
但是,GPT-Image-2 的 API 接口是提供 4K 清晰度的生成选项的。
以 updream 平台为例,生成图片时,选择 4K 清晰度 + 超高质量,就会得到 3840 × 2160 标准 4K 分辨率的图像。

直接放到 PPT 里,文字的清晰度和手打的,基本上看不出差异了。
当我答辩结束时,同门告诉我,他一眼就看出我的 PPT 是 AI 做的。
我以为他明察秋毫,问其缘由。
他说,凭你这家伙的审美,做不出这么漂亮的 PPT 😂
[1] https://mp.weixin.qq.com/s/RqX-pzhjxQkZktvpdE64XA[2] https://github.com/op7418/guizang-ppt-skill[3] https://github.com/hugohe3/ppt-master