来自威斯康星大学麦迪逊分校、佐治亚大学和南加州大学的研究团队发现,OpenAI 的多模态大模型 ChatGPT o3 能通过照片中的微小线索精确定位用户的住址,误差仅在 1 英里范围内。
研究揭示了多模态模型在处理模糊线索时的强大推理能力,展示了其通过视觉解析、地理围栏和外部工具调用等手段实现精准定位的全过程,强调了隐私泄露的隐蔽性和普适性。
技术拆解显示,ChatGPT o3 的定位能力源于其多层视觉特征提取和外部工具的协同作用,这种“摄像头+卫星”的双重视角使 AI 获得超越人类的空间推理能力。