或者不知道这些冗长的描述信息是否是画蛇添

2018-06-02 09:58| 发布者: | 查看: |

  秒速赛车开奖传统的复杂网络研究大部分都是基于矩阵的分析。而随着机器学习在众多领域取得的卓越成果,将网络表示成适合机器学习算法处理的数据形式迫在眉睫,而这一类工作被称为网络嵌入。最近基于卷积的网络嵌入技术(GCN)和注意力的嵌入技术(GAT)的效果都优于传统的技术(如Node2Vec),但是这些技术都只能表征网络静态拓扑结构,无法表征网络上的动力学过程。而此文介绍的方法,便是处理这一问题的有力尝试。

  复杂系统由大量可动态交互的个体组成,不管是在空间还是时间尺度上,经常表现出丰富的特性和行为。作为耦合动力学的实体(coupled dynamical entities),复杂系统的动力学轨迹可以反映底层的图拓扑结构如何约束和塑造系统的局部动力学。

  有些网络并没有内在定义的动力学,比如由关系型数据生成的复杂网络,但是可以把我们感兴趣的网络功能看作是其上的某种动力学过程,比如扩散过程。因此,理解网络连通性如何影响动力学特性,对于很多涉及复杂系统研究的学科来说,都是一项重要任务。

  但是,想要全面描述系统的动力学和网络结构,相当的不现实。很多时候,你都不知道怎么去详尽的描述这些系统,或者不知道这些冗长的描述信息是否是画蛇添足。因此,很多研究都以降低系统复杂度为宗旨,只对系统进行低维的粗粒化描述。虽然感觉比较粗糙,但都能解释清楚网络上有趣的现象。

  经典的降维方法要求系统具有对称性或者有均匀连接的团簇,而在实际系统中,这些条件几乎不可能满足。虽然有人用统计学理论为这些方法辩护,将实际系统的不规则性解释为理想模型的随机波动,但是这些理论又建立在了更加严格的局部假设基础上。实际上系统的很多全局特征,例如循环结构(cyclic structures)和高阶耦合动力学,并不能在经典的结构范式下解决。

  最近,网络嵌入技术的发展可谓是风生水起。这种技术将网络和其上的节点映射到向量空间(通常是低维),让数据分析领域那些牛哄哄的算法也能直接用到网络分析中。迄今为止,大多的嵌入技术都只表征了网络的拓扑信息,比如由扩散得到的拓扑结构,但是实际网络的动力学远比扩散过程复杂,而且遇着包含带符号的边和有向边的网络时,要定义一个扩散过程也很难。

  为了解决上面提到的实际系统的非对称性和复杂动力学特性,MIT 的 Michael 等人最近提出了一种复杂网络的多尺度动态嵌入技术。

  如上图所示左半部分所示,该嵌入技术用低维信号空间中的点,来表示各节点在特定时刻t对于脉冲的响应。一段时间以后,还可以得到每一个点在信号空间的随着时间的移动轨迹。这样在每个时刻t,所有的点都映射到了相同的(信号)向量空间,在定义了相似性和距离之后,又可以用经典的分析方法来处理。但是此时的向量空间不仅是基于网络的拓扑结构,还直接基于其上的动力学过程。

  为了直观起见,将复杂网络的动力学表示成多元微分方程,网络的节点和方程的变量一一对应:

  X矩阵表示当前各节点的状态,u表示对各节点的脉冲刺激,而y表示我们实际观察到的各节点的转态。

  A 和 B 矩阵的设计须由具体的系统动力学来确定,没有脱离具体系统的设计方法,这一点会在后文关于大学排名的应用中体现出来。

  前面我们已经定义了节点在不同时间的嵌入,那么怎么衡量两个节点i和j在时间t的状态是否相似呢?因为我们已经把节点映射成了向量,所以有很多方法可以用来做这件事。因为简单且通用,我们直接选择标准双线性内积的相似性度量方法,得到各节点的相似性矩阵:

  值得注意的是,相似性矩阵和距离矩阵都是时间相关的。从另外一个角度看,节点嵌入、相似性矩阵和距离矩阵可以看做是对网络按照时间t的动态抽样,我们可以参照图4来理解这句线:网络连边的权重分布以及相似矩阵在时刻t=1、8、16时的取值

  我们现在来看图4中 B 所示的网络,这是一个有向加权网络,而且权值不对称。我们考虑网络上的一个随机游走过程,相当于在其上定义个一个时间离散的动力学方程,也即一个微分方程:M 是网络上无偏随机游走的转移矩阵。

  观察图4的 C 图中,各节点的相似度矩阵随着时间不断的变化,这说明我们的嵌入方法能够用来发现动态的团簇模块,不同时间尺度表征的系统信息也不一样。换一个角度来看,T=1 时等效于只考虑一阶邻居的网络结构分析,而 t>

  1 时,类似于多步转移的网络结构分析。

  到这里我们已经构建好了一套网络动态嵌入的方。

<
>
相关文章
 
QQ在线咨询
售前咨询热线
400-800-8888
售后服务热线
400-800-8888
返回顶部