2022年,OpenAI聊天机器人ChatGPT的面世无疑成为了引领人工智能浪潮的标志性事件,宣告了新一轮科技革命的到来。无论是聊天娱乐、教育学习,还是工作生产、医疗健康等领域,人工智能正以前所未有的速度渗透到我们生活的方方面面。
而就在2月16日,OpenAI宣布推出全新的人工智能模型“Sora”。据了解,通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。
这是继文本、图像之后,OpenAI将其先进的AI技术拓展到了视频领域。Sora无疑是人工智能领域的一次重大突破,该技术不仅展示了AI在理解和创造复杂视觉内容方面的先进能力,而且对内容创作、娱乐和影视制作行业带来了前所未有的挑战和机遇。
一次性看完Sora发布的所有精彩视频,01
对Sora问世的本源思考
我们知道,人类通过获取和识别自然界和社会的各种信息来辨别物体,从而认知并改变世界。信息广泛指人类社会传播的各种内容,包括音讯、消息以及通讯系统传输和处理的对象。这些信息以多种载体形式存在,如文字、符号、表格、声音、图形图像、视频和动画等。
然而,现在,Sora的出现意味着对现实世界的理解、模拟和生成不再局限于人类。它涵盖了文字、图形图片、语音和视频等形式,而过去这些只有人类才能完成。正因如此,Sora的问世预示着这个世界正在发生难以想象的变革。
02
大模型的核心技术:机器学习
大模型的核心技术是自然语言处理(NLP)和深度学习。具体而言,它基于Transformer架构,使用了大规模无监督学习方法,例如自回归语言建模和掩码语言建模,来训练一个庞大的神经网络模型。
机器学习听起来很高大上,其本身也确实很复杂。为了将简单问题复杂化,机器学习是模拟或实现人类的学习行为,如果我们从人类的学习行为来理解机器学习,也许就比较容易。
人在认识世界和学习的过程中,通常会先学习抽象的概念入手来了解某个事物或原理,这个概念其实就是对应机器学习的特征工程。比如我们在学习几何指示的三角形,首先会从符号来认识,然后是了解三角形的定义、性质和计算公式。三角形的定义、性质和计算公式,对应机器学习的特征工程。
通常老师在讲完课程后,会留一些课后作业和家庭作业,用以加深和巩固学生对三角形的概念、定义、性质和计算公司的理解。那么学生做作业的过程,就是机器学习的训练样本。训练数据是用来帮助机器学习知识、建立起蕴含知识的模型的数据。
为了更好地提升学习效果和学习成绩,学生还会参加课外补习班,然后做各种刷题和模拟练习,这个过程就是让机器学习的有更多的和更有效的训练样本。在每个学期中,学校通常都会安排周考、月考、期中考、期末考,用以检验学生的学习效果并作为考核的依据,最终的结果就是考上好的高中和好的大学。
学生参加各种考试就是对应机器学习的测试样本。测试样本是机器学习里模型服务的对象,对测试数据作出正确的预测和反馈,是机器学习一系列活动的最终目的。
我们看到,计算机世界所有的技术和手段,包括机器学习,都来源于我们现实日常生活和实践,并且我们普通大众都是能很好地理解。
很多时候父辈和祖辈们,可能他们没读过书,甚至不识字,但中华民族一些古老的知识和智慧(如成语、谚语)他们都能懂,甚至自然而然地去遵从。这些知识和智慧其实就是我们的基因,这些基因会一代代传递下来,并且不受文字和语言的限制。
这种基因的遗传,其实也可以想象成一段“代码”,假设这段代码是更高维世界设计出来,那么人类也算是高维世界的“人工智能”。然后人类现又在自身的基因和日常实践基础上,设计出了第N+1代人工智能,并另类延续了人类的基因。
03
Sora会带来哪些变局和颠覆性影响?
Sora模式的提出,必将对未来的视频制作模式产生巨大的影响,并为各行各业带来新的机遇。但Sora带来的影响,无论从宽度和深度来说,都将远超这些。
1、对行业、职业的冲击和颠覆
根据OpenAI官方文章介绍以及分享的演示视频来看,Sora称得上是“王炸级”的AI工具。就像OpenAI将图像生成模型DALL-E集成到ChatGPT产品中那样,如果OpenAI将视频生成模型Sora也集成到ChatGPT供所有用户使用,那么应该能够对视频相关的行业逐渐带来改变,比如影视制作、短视频创作、在线教育、广告传媒、游戏开发、直播,等等。
2、虚拟现实融合带来的影响
Sora模式可以按照用户的喜好和动作,在短时间内产生各种场景、情节,增强了用户的互动体验。sora的问世,当人沉浸在虚拟的元宇宙的时候,比如有AR、VR,当体验做到极致的时候,可能会分不清哪个是现实、哪个是虚拟。或者知道却不愿意区分,就像人做了美梦不愿意醒来一样,因为虚拟世界过的可能会比现实世界更好。
3、数实融合驱动精神境界提升
随着数字技术发展,人类社会活动的一切过程都有可能被记录下来,形成数据。sora的出现,未来可以依据价值体(如组织、企业、个人、群体的标签画像、行为为记录,可以方便地生成和还原完整现实世界的一切原始模型和轨迹。
也就是说,可能不需要查看摄像头视频,或需要画像专家依据目击者的描述来勾勒嫌犯的画像,就可能直接生成相关的视频(不只是静态画面)。因此,未来,你拥有多少财富、物资和房产,在平台里都是透明的,你所花的任何一笔钱,其实也是透明的.,这个可能导致的结果,随便一笔花费别人都知道。如果是来路不正的钱,可能都不会有机会花费,违法犯罪行为也更都无法隐藏。所以,数字技术的发展,会驱使人们提升精神和道德的修养,使得人们可能会更多地从物质层面的追求,转向精神层面的追求和探索。
Sora只是小试牛刀,它展现的不仅仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会对整个人类社会全方位带来新的突破和变革。
04
结语
中国人常说:“六六大顺、逢七必变”这句话。对于数字“七”包含着许多奥妙,例如7日来复,一周有7天,7年之痒,公司7年一个坎,个人职业往往7年会有起落等等。
二十一世纪有三个7,,一个“七”已经让人头痛,两个“七”更加复杂,3个代表“多”,很多事情都可能要变,二十一世纪会是非常快速的一个时期。因此,如果再拿二十世纪的思维,有可能是行不通。比如在数字化时代,我们可以弯道超车和选择新的路径,而简单地照搬西方的思想和管理模式可能行不通。当然,这并不意味着我们之前学习和西方学习没有必要,相反,之前的学习是非常有必要的。
Sora的出现是人类AI技术新的里程碑,我们在AI上暂时落后于美国,但任何事情有好有坏,AI对人类的冲击和颠覆的后果还未最终验证。有一种观点,认为所有的创造发明其实都是发现,即让人们在合适的时间“发现”,在我们发现这些规律和科学奥秘之前,它们本就一直存在和起作用。
道德经:“天网恢恢,疏而不失(漏)”,如果“天网”看成是一个看不见、摸不着的高维“数字系统”,天网和现实世界的对接和映射,并将现实世界的万事万物进行了记录和存档。Sora的问世让现实世界和数字世界连接和孪生趋向无缝连接和融合,那么天网系统、现实世界和数字世界三者的相互作用,又将会进一步给我们的未来带来更多的变化。