Sora是干啥的呢?对去年爆火的ChatGPT还有印象吧?如果说ChatGPT是文生文、文生图,那Sora就是直接升了个纬,变成了文字生视频,而且尤为厉害之处是生成的视频可达60秒,抵得上一条长广告的长度了,这是Runway、Pika这样的AI视频生成公司还难以企及的水平。
Sora生成的东京黑衣女子视频
我知道咱们摩天轮阅读的用户朋友们,很多还是中小学生,或是语文老师,都不是AI圈的人,那为什么我们要赶着写这篇文章,且强烈建议身边的老师、家长和学生朋友们都看一看呢?原因就是在研究了OpenAI放出的视频样例和他们发布的官方技术报告后,我们发现:能不能用好Sora,关键还得看阅读能力强不强。
话不多说,上例子。放在前面的东京黑衣女子视频大家都看过了,那给到Sora的提示词是什么呢?我给大家搬运一下:
还有一则跟拍老式SUV的长镜头视频也在网上传得很火,用它来例证传统广告公司要倒闭的文章尤其多:
Sora生成的SUV行驶视频
这则视频的提示词也很值得一起看一看:
两个案例放在一起,我想你已经隐隐有一些感觉了。没错,给到Sora的提示词简直就是一个分镜脚本!既有“布满温暖霓虹灯和动画城市标牌的东京街道”“周围是陡峭的丘陵和山脉,上面是清澈的蓝天和缕缕云彩”这样的环境描写,又有“走路自信又随意”“轻松地沿着曲线行驶”等动作描写,甚至还有“给整个场景投射出温暖的光芒”这样意境化的氛围渲染。这比拼的哪里是AI技术,比的明明就是文字表达力啊!而这也正是高水平驾驭Sora的命门。
试想,如果只是干巴巴地写一句“戴墨镜的女子走在东京街头”,或是“白色SUV行驶在盘山公路上”,模型还是那个模型,算力还是那个算力,Sora生出的视频质量和符合要求的程度想必大概率会大打折扣。
说到这儿,我得进一步点点题了——为什么说AI时代还是“得阅读者得天下”?
读景,给环境提示词加分
回想咱们学生时代的读书经历,多少小伙伴是看到景物描写就跳过的?(戳中的可以在评论区抠个1)但这下事情变得有点不一样了,因为如果想要让Sora造景到位,就必须给到细致的景物描写指令。
比如,“日出江花红胜火,春来江水绿如蓝“这样的绘景诗句输进去,效果就可能很不错。再如,吴承恩在写《西游记》时,也特别注意写景。除了对花果山、天堂上界等关键故事场景描画到位外,在每一难的开头还都会先上一段景物描写,带你入戏。
“腊月寒天,朔风凛凛,滑冻凌凌”“大蟒喷愁雾,长蛇吐怪风。道旁荆棘牵漫,岭上松楠秀丽”……每段环境“提示词”都特色鲜明、AI友好。更令人倒吸一口凉气的是,把《西游记》一百回放在一起看,十四个寒暑交替都交待得清清楚楚,没有一丝差漏。这就作为人的创造力终究高于AI的一处注脚罢。
读人,给画面主体加分
人物常常是视频的主角,Sora对人物形象的把握也非常依赖所得指令的精细度和准确度。很明显,高手和小白对外貌、神态、动作、语言、心理活动的刻画水平是有天壤之别的,让我们恭请出曹雪芹老师给大家做个示范。《红楼梦》第三回,王熙凤第一次出场时,伴随着后院传来的一句“我来迟了,不曾迎接远客!”还有这样一段描写——
“这个人打扮与众姑娘不同:彩绣辉煌,恍若神妃仙子。头上戴着金丝八宝攒珠髻,绾着朝阳五凤挂珠钗;项上带着赤金盘螭璎珞圈;裙边系着豆绿宫绦双衡比目玫瑰珮;身上穿着缕金百蝶穿花大红洋缎窄裉袄,外罩五彩刻丝石青银鼠褂;下着翡翠撒花洋绉裙。一双丹凤三角眼,两弯柳叶吊梢眉,身量苗条,体格风骚。粉面含春威不露,丹唇未启笑先闻。”
这样的描摹颗粒度,Sora怕是想不传神都难吧?
读历史,给视频真实度加分
是一眼入魂,还是一秒出戏,经常都缘于一处布景、服饰或道具。
说起对历史图景的还原,纪实文学《红星照耀中国》就很有说服力。在写到周恩来在安塞的司令部时,斯诺的文字是这样的——
“屋子里很干净,陈设非常简单。土炕上的一顶蚊帐,是唯一的奢侈品。炕边摆着两只铁制的文件箱,一张木制的小方台当作办公的桌子。”
三句“提示词”,就把一个红军司令的办公环境生动地白描出来了,让读者(和Sora)仿佛也和斯诺一样,就站在司令部的门口往里张望。
斯诺与周恩来会见画面
我们说的“阅读”完全可以是广义的,它不限于书本、文章,还包括电影、电视剧、纪录片等动态影像,就连“建筑可阅读”这样的通感之义也未尝不可。寒假热播的纪录片《何以中国》,就因为考古级的严谨而备受好评。
纪录片《何以中国》精彩画面
纪录片还原了200多处场景,特制的道具、布景超1.2万件,服装超过8000件/套,每一件、每一处都尽可能按考古细节一一还原。大胆想象一下,等Sora开放试用后,我们是不是可以把参照文物真实还原的图片和文字输入给Sora来试试生成效果?没准今后历史地理学得好、文献读得多的朋友,自己一个人就可以是一支纪录片队伍呢。
大师能写活一个时代,也能点亮N个视频。也许,在你今后的好词好句摘抄本里,可以新增一个标签,就叫“Sora好用”。
再往前想一步,是否还存在这样一种可能:孩子们会不会因为可以把自己的阅读理解和想象通过AI轻松还原成视频,得到鲜活和直观的反馈,从而反向加持他们对知识的渴望、对文学的热爱、对世界的想象呢?身为家长和老师的我们,是不是能和少年们一起拥抱这个机会,引导他们在AI浪潮中成为更好的阅读者和创作者?
这样一想,是不是不焦虑了,还有点儿暗喜起来?
OpenAI自己公布的技术报告中,给Sora的定位是“作为世界模拟器的视频生成模型”。对于大多数非天才体质的普通人来说,只有先进行大量、经典、多元的阅读输入,才有可能在面对Sora的对话中做到得心应手的输出,让适切的表达成为你模拟世界、创造世界的魔法。
古人所谓“读书破万卷,下笔如有神”,放到今天的AI语境下竟然毫不过时,甚至还能升级成“读书破万卷,创世如有神”。岂不妙哉?
评论前必须登录!
立即登录 注册