上海交大张拳石:思维链只是表象,DeepSeek凭什么更强 | 智者访谈

张拳石教授在《智者访谈》中探讨了大模型的可解释性问题,指出思维链虽然能展示模型的「思考过程」,但未必代表其内在推理机制。他提出了「等效与或交互」解释性理论,通过符号化方式证明神经网络的内在表征逻辑,为理解泛化性、鲁棒性和过拟合提供了新视角。

张教授强调理论创新的重要性,认为相比优化复杂系统,更需等待值得投入的问题。他的新理论为解释大模型的内在机制提供了严谨的方法,有助于提升AI在医疗、自动驾驶等领域的应用安全性。

[原文链接]

上一篇:

下一篇:

微信