这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升，但怀疑这是测试集被学习了，在增加问题难度之后，提升效果只有 3%得出的结论是GPT4提升源于学了更多的模式而已

这个Thread论证了的是GPT4 的逻辑推理能力相对 ChatGPT3.5 有 5%到 30%的提升，但怀疑这是测试集被学习了，在增加问题难度之后，提升效果只有 3%
得出的结论是GPT4提升源于学了更多的模式而已。
虽然看起来没毛病，但是如果真的这么简单就好了。https://twitter.com/rao2z/status/1643463201462579200

----------------------
Twitter

Afraid of #GPT4 going rogue and killing y'all? Worry not. Planning has got your back. You can ask it to solve any simple few step classical planning problem and snuff that "AGI spark" well and good.

Let me explain.. 🧵 1/

----------------------

via AI News - Telegram Channel