很多人说,大模型时代创业很容易死。其实这也分怎么做,非要去跟openAI卷,那确实是容易死。
AI时代你只要搞明白,输入端和输出端,至于里面的黑盒技术怎么变化,无关紧要。
这就意味着,如果你是从底层往上做,盒子随便换,表现层也可以随便换,但本质从没发生过改变
我举个例子,比如invideo AI,他做的事情是:
1、输入一段想法
2、他将想法拆解成了分镜头脚本
3、依靠脚本去视频素材库找素材,然后返回回来
4、拼装在一起,让用户可以进行微调和替换
5、输出视频
好了,他这个框架其实很简单,看一眼就知道是通过RAG做的:把一个prompt理解成一个question,然后对这个question做了sub-question,最终通过sub-question的query去检索回片段。
那soraAI来了能干死他么?
显然不能,因为他的优势在于工程化,而不是AI。
他只需要把API从RAG替换到Sora,就能瞬间起飞。
因为当其他人还在一个输入框生成一个视频片段的时候,它已经可以定制化生产优质视频了。
这个例子就充分说明,Sora是给他赋能的,而非卷死它。
那卷死的是谁?或许是Pika和Runway。
但Pika怕死吗?它本身就是个资本产物,股票都套现完了,最终收场不了的是持有股票的韭菜,至于Pika,死不死的又能怎样?
可这和普通人有什么关系?独立开发者创业,能搞个SVD套壳都已经是大牛了。
回归正题,如果你正在做SVD套壳,你要怎么避免灾祸?也简单,把工程化做好。生产流程是符合用户需要的,这就够了,至于说AI能力,谁牛接谁。
从深度上讲,抓住底层就是抓住工程化,抓住对用户使用体验的理解。
在一个场景不断去深化用户的使用路径和使用体验,而不是优化AI本身,AI交给时间,对用户在意的功能理解把握住就好。
从广度上,也可以抓住底层。
比如你是做图像生成的。不论你是做什么类型的图像,是头像也好,是证件照也罢,甚至肖像,写真,宠物照片。到头来不也是一个input进一个黑盒,最终给照片吗?
那黑盒是谁也不重要。所以你应该想办法封装隔离好生成能力,把工程问题和生成问题拆解开。
从这个维度上讲,你应该多做场景,而不是深挖生成能力。因为生成能力永远在不断迭代,但场景依旧还是那样。
比如你接了midjourney API,你可以用他做可爱婚纱照,你也可以用他做宠物头像,这些都可以卖钱。那为什么不做广度而是不断去深度优化一个API的提示词呢?
从这个意义上讲,底层意味着一套快速搭建业务场景的能力。如果你能快速搭建各类型的生图场景,你就赢在工程上了,哪怕突然有一天,dalle也超越了mj和sd,你依旧可以活的潇洒。