换个角度看Sora:为什么说AI时代还是“得阅读者得天下”?


由OpenAI发布的视频大模型Sora上线72小时以来,网上已经涌现了数以万计的评论文章(其中不少文章和短视频本身也是AI生成的),相信多少你也都读到过一些,还是以“颠覆论”居多。更有笑梗说,感谢奥尔特曼憋到初七才发布,让我们得以“苟”过这个年。


Sora是干啥的呢?对去年爆火的ChatGPT还有印象吧?如果说ChatGPT是文生文、文生图,那Sora就是直接升了个纬,变成了文字生视频,而且尤为厉害之处是生成的视频可达60秒,抵得上一条长广告的长度了,这是Runway、Pika这样的AI视频生成公司还难以企及的水平。


Sora生成的东京黑衣女子视频


我知道咱们摩天轮阅读的用户朋友们,很多还是中小学生,或是语文老师,都不是AI圈的人,那为什么我们要赶着写这篇文章,且强烈建议身边的老师、家长和学生朋友们都看一看呢?原因就是在研究了OpenAI放出的视频样例和他们发布的官方技术报告后,我们发现:能不能用好Sora,关键还得看阅读能力强不强。


话不多说,上例子。放在前面的东京黑衣女子视频大家都看过了,那给到Sora的提示词是什么呢?我给大家搬运一下:

“Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.”
“提示词译文:一位时尚女性走在布满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。”

还有一则跟拍老式SUV的长镜头视频也在网上传得很火,用它来例证传统广告公司要倒闭的文章尤其多:

Sora生成的SUV行驶视频


这则视频的提示词也很值得一起看一看:

“Prompt: The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from it’s tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.”
“提示词译文:镜头跟随一辆带有黑色车顶行李架的白色老式SUV,它在一条被松树环绕的陡峭土路上加速行驶,轮胎扬起灰尘,阳光照射在SUV上,给整个场景投射出温暖的光芒。土路蜿蜒延伸至远方,看不到其他车辆。道路两旁都是红杉树,零星散落着一片片绿意。从后面看,这辆车轻松地沿着曲线行驶,看起来就像是在崎岖的地形上行驶。土路周围是陡峭的丘陵和山脉,上面是清澈的蓝天和缕缕云彩。”


两个案例放在一起,我想你已经隐隐有一些感觉了。没错,给到Sora的提示词简直就是一个分镜脚本!既有“布满温暖霓虹灯和动画城市标牌的东京街道”“周围是陡峭的丘陵和山脉,上面是清澈的蓝天和缕缕云彩”这样的环境描写,又有“走路自信又随意”“轻松地沿着曲线行驶”等动作描写,甚至还有“给整个场景投射出温暖的光芒”这样意境化的氛围渲染。这比拼的哪里是AI技术,比的明明就是文字表达力啊!而这也正是高水平驾驭Sora的命门。


试想,如果只是干巴巴地写一句“戴墨镜的女子走在东京街头”,或是“白色SUV行驶在盘山公路上”,模型还是那个模型,算力还是那个算力,Sora生出的视频质量和符合要求的程度想必大概率会大打折扣。


说到这儿,我得进一步点点题了——为什么说AI时代还是“得阅读者得天下”



读景,给环境提示词加分


回想咱们学生时代的读书经历,多少小伙伴是看到景物描写就跳过的?(戳中的可以在评论区抠个1)但这下事情变得有点不一样了,因为如果想要让Sora造景到位,就必须给到细致的景物描写指令。


比如,“日出江花红胜火,春来江水绿如蓝“这样的绘景诗句输进去,效果就可能很不错。再如,吴承恩在写《西游记》时,也特别注意写景。除了对花果山、天堂上界等关键故事场景描画到位外,在每一难的开头还都会先上一段景物描写,带你入戏。



“腊月寒天,朔风凛凛,滑冻凌凌”“大蟒喷愁雾,长蛇吐怪风。道旁荆棘牵漫,岭上松楠秀丽”……每段环境“提示词”都特色鲜明、AI友好。更令人倒吸一口凉气的是,把《西游记》一百回放在一起看,十四个寒暑交替都交待得清清楚楚,没有一丝差漏。这就作为人的创造力终究高于AI的一处注脚罢。

 

读人,给画面主体加分


人物常常是视频的主角,Sora对人物形象的把握也非常依赖所得指令的精细度和准确度。很明显,高手和小白对外貌、神态、动作、语言、心理活动的刻画水平是有天壤之别的,让我们恭请出曹雪芹老师给大家做个示范。《红楼梦》第三回,王熙凤第一次出场时,伴随着后院传来的一句“我来迟了,不曾迎接远客!”还有这样一段描写——


“这个人打扮与众姑娘不同:彩绣辉煌,恍若神妃仙子。头上戴着金丝八宝攒珠髻,绾着朝阳五凤挂珠钗;项上带着赤金盘螭璎珞圈;裙边系着豆绿宫绦双衡比目玫瑰珮;身上穿着缕金百蝶穿花大红洋缎窄裉袄,外罩五彩刻丝石青银鼠褂;下着翡翠撒花洋绉裙。一双丹凤三角眼,两弯柳叶吊梢眉,身量苗条,体格风骚。粉面含春威不露,丹唇未启笑先闻。”


这样的描摹颗粒度,Sora怕是想不传神都难吧?




读历史,给视频真实度加分

 

是一眼入魂,还是一秒出戏,经常都缘于一处布景、服饰或道具。


说起对历史图景的还原,纪实文学《红星照耀中国》就很有说服力。在写到周恩来在安塞的司令部时,斯诺的文字是这样的——


“屋子里很干净,陈设非常简单。土炕上的一顶蚊帐,是唯一的奢侈品。炕边摆着两只铁制的文件箱,一张木制的小方台当作办公的桌子。”


三句“提示词”,就把一个红军司令的办公环境生动地白描出来了,让读者(和Sora)仿佛也和斯诺一样,就站在司令部的门口往里张望。


斯诺与周恩来会见画面


我们说的“阅读”完全可以是广义的,它不限于书本、文章,还包括电影、电视剧、纪录片等动态影像,就连“建筑可阅读”这样的通感之义也未尝不可。寒假热播的纪录片《何以中国》,就因为考古级的严谨而备受好评。


纪录片《何以中国》精彩画面


纪录片还原了200多处场景,特制的道具、布景超1.2万件,服装超过8000件/套,每一件、每一处都尽可能按考古细节一一还原。大胆想象一下,等Sora开放试用后,我们是不是可以把参照文物真实还原的图片和文字输入给Sora来试试生成效果?没准今后历史地理学得好、文献读得多的朋友,自己一个人就可以是一支纪录片队伍呢。


大师能写活一个时代,也能点亮N个视频。也许,在你今后的好词好句摘抄本里,可以新增一个标签,就叫“Sora好用”。


再往前想一步,是否还存在这样一种可能:孩子们会不会因为可以把自己的阅读理解和想象通过AI轻松还原成视频,得到鲜活和直观的反馈从而反向加持他们对知识的渴望、对文学的热爱、对世界的想象呢?身为家长和老师的我们,是不是能和少年们一起拥抱这个机会,引导他们在AI浪潮中成为更好的阅读者和创作者?


这样一想,是不是不焦虑了,还有点儿暗喜起来?


OpenAI自己公布的技术报告中,给Sora的定位是“作为世界模拟器的视频生成模型”。对于大多数非天才体质的普通人来说,只有先进行大量、经典、多元的阅读输入,才有可能在面对Sora的对话中做到得心应手的输出,让适切的表达成为你模拟世界、创造世界的魔法。


古人所谓“读书破万卷,下笔如有神”,放到今天的AI语境下竟然毫不过时,甚至还能升级成“读书破万卷,创世如有神”。岂不妙哉?




「 在看 」
和大家一起

未经允许不得转载:ai论文润色 » 换个角度看Sora:为什么说AI时代还是“得阅读者得天下”?

评论 抢沙发

评论前必须登录!

立即登录   注册