
模仿不是超越,KL正则化搜索让AI下围棋更像人类
如果非要问 AlphaGo 有什么缺点,那就是下棋不像人类。和 AlphaGo 对弈过的顶级棋手都有这种感受,他们觉得 AI 落子经常让人捉摸不透。 纵轴为 AI 与原始模型对弈的胜率,横轴为 AI 预测人类落子位置的 Top-1 准确度。可以看出新的算法(绿色)在两方面都已
如果非要问 AlphaGo 有什么缺点,那就是下棋不像人类。和 AlphaGo 对弈过的顶级棋手都有这种感受,他们觉得 AI 落子经常让人捉摸不透。 纵轴为 AI 与原始模型对弈的胜率,横轴为 AI 预测人类落子位置的 Top-1 准确度。可以看出新的算法(绿色)在两方面都已