现在AI生产视频到什么程度了,可灵这种大模型意义主要体现在哪里?

MarkDown

里屋有个朋友在问现在“AI生产视频到什么程度了?”

对此,作为折腾了快两年AI应用的我来说,还是有一些对业内这东西在实用化方面的小心得的。

从今天(2024年7月)的情况来看,AI生成视频的入门的技术门槛似乎降下来了,多家做模型的公司发现卷GPT大模型卷不动 了,纷纷进军这种视频生成的细分领域。

而且吧,生成视频看起来就比生成文字更酷,对于外行来说,主观上感觉会比ChatGPT那样生成文字内容更高级。

现在很多开放测试或者邀请测试的视频AI,基本上都可以做到通过一张静态的图片作为起始帧,生成一个数秒到数十秒的视频。或者通过一段简单的文字描述生成一段视频。

很多看起来都还听令人惊艳的。

……

问题就是,也就止步于惊艳了。

比如这个生数科技的演示:
https://www.bilibili.com/video/BV1HT42167ea/

随便照一张图片去给他,他能让这个照片动起来:

看起来还不错吧?

AI视频技术给了人们很多想象空间,但是,问题就是,现在还只能想象。因为这玩意目前能做到的就是生成这么很短的意义不明的视频。

诸如什么AI自动拍电影什么的,目前来说,乐观的说就是不是不能想象了,但是客观的说就是现在还是只能想象。

去年一年很多团队做出了各种视频Demo,还有用各种声音克隆技术做出一些有趣的演示。大家尝试把这些炫酷的东西包装成产品去给客户展示,但是没有人解决一个问题:演示过后呢? 你这个产品能直接解决用户的需求吗?用户的需求是什么呢?

……

人工智能(AI,全称Artificial Intelligence)是一种计算机科学及工程技术,通过模拟人类智能及解决问题的能力,使机器能够执行通常需要人类智慧的任务。AI的关键还是智商。算法公司把资金和算力直接投入到噱头一般的视听应用上,在我看来其实还是一段弯路。

当然,这也和目前GPT技术对算力的超级需求,让中小团队不免新生绝望,不得不另辟赛道也有关系。毕竟AI的智商的提高,我们能够指望的就是OpenAI、Claude、Google、Meta等巨头团队的研究和训练。

当然,AI技术还在飞速的进步中。今天的AI生成视频确实就只是一个演示。

但我们也不知道这些技术进步的速度能有多快。

但是就当下,此时此刻来说,这类技术确实比较吸引眼球,比较容易获得投资人的投资,这也是了不起的意义。

因为这会带进行业里面很多钱进来,也会帮助整个AI行业创造很多工作岗位,培养很多人才……

长远来说,这都是对AI产业发展非常有价值的助力。