以 Reddit 討論最集中的幾個預測為例:
▸ 原生多模態與空間理解
Gemini 4 被推測將結合 3D 與空間推理,這背後是「世界模型(World Models)」概念。
差異不在於看不看得懂圖片,而在於是否理解物理規則,例如材質、光線、距離與動態變化。
這使過去成效有限的虛擬試穿、AR 擺設,可能從「貼圖」升級為「物理模擬」。
▸ 極長上下文的實際意義
一千萬 token 的重點不在數字,而在「一次性理解整體」。
對企業而言,代表 AI 能同時分析:
對個人而言,則是第一次出現「能理解個人長期行為脈絡」的數位系統。
▸ 主動代理與權限分級
Project Astra 與 Project Mariner 的討論,揭示 AI 角色的轉變:
從等待指令 → 預測需求 → 執行任務。
但 Reddit 多數共識也指出,分級授權與人為確認將是信任能否成立的關鍵設計,而非附加選項。