年末的 Google 应该是吃药了,天天放大招!从量子芯片、到 Gemini 2,然后今天的 Veo 2,目测这是现在品质最好的视频生成模型,包括3d 理解和物理规则在内 。Veo 2 能更好地理解真实世界的物理现象以及人类动作和表情的细微差别,有助于提升视频的细节和逼真度。
你还能用电影摄影的独特语言来简单描述场景:例如要求它提供一种类型、指定一个镜头、建议电影特效,Veo 2 就能实现 - 分辨率高达 4K,长度可延长至几分钟。
记得前两天 Jeff Dean 在 NeurIPS 的一个场外活动接受采访时就表示,Google Gemini 在多模态上深根已久,模型能够更好的理解真实世界,这会大大改进生成的品质,而且会优先用来强化自己的产品,例如 Youtube!未来的媒体必定是生成的 。。。