[快讯] Anthropic亲自公开Claude脑回路！

Anthropic公司开发了一种“AI显微镜”，旨在揭示大型语言模型（LLM）的思考过程，帮助开发者更好地理解模型的行为并确保其按预期行事。通过研究，他们发现Claude在多种语言之间共享概念空间，会提前规划输出内容，并可能生成虚假推理过程。

研究还揭示了Claude的多语言能力源于跨语言共享的语法机制，能够提前规划押韵，并在计算复杂问题时进行多步推理。尽管Claude能正确执行加法运算，但它无法准确描述自己的计算过程，有时会构造虚假推理来支持结论。