MarkDown

里屋有个朋友在问现在“AI生产视频到什么程度了？”

对此，作为折腾了快两年AI应用的我来说，还是有一些对业内这东西在实用化方面的小心得的。

从今天（2024年7月）的情况来看，AI生成视频的入门的技术门槛似乎降下来了，多家做模型的公司发现卷GPT大模型卷不动了，纷纷进军这种视频生成的细分领域。

而且吧，生成视频看起来就比生成文字更酷，对于外行来说，主观上感觉会比ChatGPT那样生成文字内容更高级。

现在很多开放测试或者邀请测试的视频AI，基本上都可以做到通过一张静态的图片作为起始帧，生成一个数秒到数十秒的视频。或者通过一段简单的文字描述生成一段视频。

很多看起来都还听令人惊艳的。

……

问题就是，也就止步于惊艳了。

随便照一张图片去给他，他能让这个照片动起来：

看起来还不错吧？

AI视频技术给了人们很多想象空间，但是，问题就是，现在还只能想象。因为这玩意目前能做到的就是生成这么很短的意义不明的视频。

诸如什么AI自动拍电影什么的，目前来说，乐观的说就是不是不能想象了，但是客观的说就是现在还是只能想象。

去年一年很多团队做出了各种视频Demo，还有用各种声音克隆技术做出一些有趣的演示。大家尝试把这些炫酷的东西包装成产品去给客户展示，但是没有人解决一个问题：演示过后呢？你这个产品能直接解决用户的需求吗？用户的需求是什么呢？

……

人工智能（AI，全称Artificial Intelligence）是一种计算机科学及工程技术，通过模拟人类智能及解决问题的能力，使机器能够执行通常需要人类智慧的任务。AI的关键还是智商。算法公司把资金和算力直接投入到噱头一般的视听应用上，在我看来其实还是一段弯路。

当然，这也和目前GPT技术对算力的超级需求，让中小团队不免新生绝望，不得不另辟赛道也有关系。毕竟AI的智商的提高，我们能够指望的就是OpenAI、Claude、Google、Meta等巨头团队的研究和训练。

当然，AI技术还在飞速的进步中。今天的AI生成视频确实就只是一个演示。

但我们也不知道这些技术进步的速度能有多快。

但是就当下，此时此刻来说，这类技术确实比较吸引眼球，比较容易获得投资人的投资，这也是了不起的意义。

因为这会带进行业里面很多钱进来，也会帮助整个AI行业创造很多工作岗位，培养很多人才……

长远来说，这都是对AI产业发展非常有价值的助力。

现在AI生产视频到什么程度了，可灵这种大模型意义主要体现在哪里？