谷歌DeepMind最新发布的Genie 3模型,专注于通过文本或图像提示实时生成高保真3D虚拟环境。该模型在连续场景生成技术上实现突破,能够生成持续数分钟的互动场景,为机器人训练、元宇宙构建及游戏设计提供虚拟环境支持。其核心能力在于动态场景模拟,与传统的语言类模型形成显著差异。
同期发布的GPT5作为多模态语言模型,强化了推理代码生成和复杂场景处理能力。例如,在诊疗场景中辅助医疗决策,或通过代码生成优化市场调研任务执行效率。其核心优势在于结合多模态输入进行逻辑推理与任务适配。
未来人工智能大模型的发展方向呈现多元化趋势:Genie 3代表的3D虚拟环境生成技术将推动元宇宙场景构建和机器人仿真训练,而GPT5等模型则聚焦多模态模型推理能力的深化与应用场景扩展。两类技术分别从环境模拟与逻辑推理维度推动人工智能技术的垂直应用与生态拓展。