尽管机器学习(ML)在过去几十年取得了明显的进步,但许多机器学习技术仍然存在一些基本问题,如过拟合和缺乏可解释性。这些问题要求数学的严谨性,以确保从观测数据中稳健地学习。

拓扑不变量

在这种情况下,数据流形中的拓扑不变量为底层动态系统提供了丰富的表示,可以用于开发数学上严格的ML工具来表征底层过程的动态行为和操作阶段。本文旨在研究用于检测数据流形拓扑特征变化的符号系统的谱不变量。提出了一种新的ML方法,该方法在自同态序列上使用换向子范数,用遍历测度对概率空间上的动力系统进行符号化描述。这里的目标是检测可用于信号处理、模式识别和异常检测的数据流形的拓扑不变量。在选定的混沌动力系统模型上验证了该方法的有效性,实现了对相变的快速检测。