据《科技日报》报道,数学在计算机编程中经常出现,通常作为描述和操纵现实世界现象表示的一种手段。例如,它用于表示计算机屏幕上的像素、天气状况或人工网络中的节点。在这种情况下,使用数学的主要方式之一,就是对矩阵进行计算。
在对游戏进行编程时,矩阵描述了可能的运动选项。为了实现这样的运动,矩阵经常被相乘和/或相加。这需要海量的工作,随着矩阵变得越来越大尤其如此,这就是为什么计算机科学家花费大量时间和精力来开发越来越有效算法来完成工作的原因。1969年,数学家沃尔克·斯特拉森想出了一种方法,只使用7个乘法运算而不是标准的8个乘法运算将两个2×2矩阵相乘。
但在新成果中,“深度思维”研究人员从游戏系统中寻找灵感,这些游戏大多数都是基于强化学习的。在构建了一些初步系统之后,研究小组将重点转向了树搜索,这也用于游戏编程,是系统在特定情况下查看各种方案的一种手段。当应用于乘法矩阵时,研究人员发现,将AI系统转换为游戏可搜索最有效的方法来获得所需的结果——数学结果。
研究人员通过允许它搜索、评估来测试他们的系统,然后使用现有算法,并以奖励来激励选出最有效的算法。系统学会了影响矩阵乘法效率的因素。接下来,研究人员将允许系统创建自己的算法,寻求进一步提高效率。他们发现,在许多情况下,系统选择的算法比人类前辈创建的算法更好。
“深度思维”团队希望,未来AI能更多地用来帮助攻克数学和科学领域的一些最重要的难题。