伴随着科研数据的积累和网络数据分析手段的不断深化,建立在科研大数据基础上的“科学学”研究已经成为近年来的热点领域[1-7]。其中,由于科研合作网络是科研活动组织、科学信息传播等方面的结构基础,深刻影响到科学家的科研工作,因此它一直是该领域研究的重要议题之一[8-13]。当前对科研合作网络的研究主要集中在如下3个方面:1)科研合作网络的各类宏观结构特性挖掘[14-17],如团簇性、社团结构等及这些结构特性的生成与演化过程[18-19];2)科研合作关系的结构特性对科研产出和科研影响力的影响和预测[20-24],如阶数中心性效应、强弱关系影响等;3)微观层面上对团队结构特性及影响的挖掘[19, 25-27],如对科研团队化的趋势挖掘和团队规模及协作性的演变等。这些研究已经大大深化了对科研合作关系的认知。
1) 计算每一对节点(科学家)之间的节点距离。计算中,定义相邻节点的距离为其连边权重的倒数,记为d。任意一对节点的距离被定义为,从此节点出发,沿网络的边到达另一节点所经过的路径中,所经各边的d值之和最小的路径。
2) 对每个节点(如节点D),在该领域的网络中寻找到所有的影响力(用该科学家在该领域的总被引用次数表示)高于该节点的节点,从这些较高影响力节点中找到3个距离该节点最近的,并根据总引用次数由高到低将其排序(如节点A、B、C)。这样,这3个距该节点最近的高影响力节点,根据同该节点的距离关系,构建出一个空间四面体(如果A、B、C、D四点之间的距离关系不能构成空间四面体结构,则忽略节点D)。四面体ABCD的空间坐标确定方法如下:首先根据步骤1)中节点间距离关系得到节点AB、AC、BC、DA、DB、DC的距离分别记作dAB、dAC、dBC、dDA、dDB、dDC。以节点A为空间直角坐标系原点,固定节点A、B的空间坐标分别为(0, 0, 0)、(dAB, 0, 0),节点C空间坐标可由下式得出:
$$\left\{ \begin{array}{l} x_{\rm{C}}^2 + y_{\rm{C}}^2 - d_{{\rm{AB}}}^2 = 0 \\ {{\rm{(}}{x_{\rm{C}}} - {d_{{\rm{AB}}}}{\rm{)}}^2} + y_{\rm{C}}^2 - d_{{\rm{BC}}}^2 = 0 \\ {z_{\rm{C}}} = 0 \\ \end{array} \right.$$ (1) 节点D的空间坐标计算如下:
$$\left\{ \begin{array}{l} x_{\rm{D}}^2 + y_{\rm{D}}^2 + z_{\rm{D}}^2 = d_{{\rm{DA}}}^2 \\ {{\rm{(}}x_{\rm{D}}^{} - x_{\rm{B}}^{}{\rm{)}}^2} + y_{\rm{D}}^2 + z_{\rm{D}}^2 = d_{{\rm{DB}}}^2 \\ {{\rm{(}}x_{\rm{D}}^{} - x_{\rm{C}}^{}{\rm{)}}^2} + {{\rm{(}}y_{\rm{D}}^{} - y_{\rm{C}}^{}{\rm{)}}^2} + z_{\rm{D}}^2 = d_{{\rm{DC}}}^2 \\ \end{array} \right.$$ (2) 如图 1a所示。
3) 在该空间四面体中,确定出节点D在节点A、B、C所确定的平面内的投影D',如图 1b。
4) 把以节点A、B、C为顶点的三角形变换为正三角形,并确定出在正三角形中D'的相应位置。这一变换算法为,将A、B、C三点的位置,依次投影到一个边长为1的正三角形的3个顶点(0, $\sqrt 3 /3$)、(–1/2, $\sqrt 3 /6$)、(1/2, $\sqrt 3 /6$)上。此时,节点A、B、C的位置坐标Si(i=A, B, C)和它们在该正三角形中的映射位置坐标S'i满足映射关系:
$$ \boldsymbol{S}_{i} \boldsymbol{M}=\boldsymbol{S}_{i}^{\prime} $$ (3) 式中,M为仿射变换矩阵,可由这3个节点的变换前后的坐标计算得出。进一步,根据所得仿射变换矩阵M,可计算出节点D在正三角形中的映射位置:D"=D'M,其中D'为节点D在平面ABC上的投影D'的位置。这里之所以映射到正三角形,是因为三角形变换所需的邻边信息最少,而且可以保证图形一定是凸多边形,可避免方位重叠带来的影响力区分困难,如图 1c所示。
假设节点A、B、C、D之间的距离关系分别为:dAB =2.30、dAC =2.72、dBC =2.50、dDA =2.06、dDB =1.21、dDC =1.66。以节点A做为空间直角坐标系原点,B点位于x轴上,C点位于平面z=0上,则B点的坐标为B(2.30, 0, 0)。根据式(1)和(2),得到C、D两点的空间坐标为C(1.40, -2.33, 0)、D(1.75, -0.85, 0.68)。然后根据步骤3),计算D在平面ABC上的投影D'的坐标为(1.75, -0.85),如图 1b所示。
根据步骤4),如图 1c所示,为了将ABC映射为正三角形,记A(0, 0, 1)、B(2.30, 0, 1)、C(1.40, -2.33, 1)、D'(1.75, -0.85, 1)。仿射变换矩阵M形式为$\left( {\begin{array}{*{20}{c}} a&d&0 \\ b&e&0 \\ c&f&1 \end{array}} \right)$,其中元素a, b, …, f为未知数。根据A、B、C映射前后的坐标,由式(3)计算可得矩阵M为$\left( {\begin{array}{*{20}{c}} { - 0.217}&{ - 0.376}&0 \\ { - 0.344}&{0.145}&0 \\ 0&{0.577}&1 \end{array}} \right)$。再根据D'的坐标,可由式(3)得到D"在正三角形的投影坐标为(-0.09,-0.20),如图 1c所示。
经过上述三角形映射后,各个节点在各领域的映射三角形内的相对位置如图 2所示。可以发现,节点在正三角的中心区域与三边中垂线附近分布最为密集。本文通过分布在三角形中心区域内(即如图 2所示的深色三角形区域,其3个顶点分别为正三角形的三边中点)的节点,占三角形内总节点数的比例q,来描述科学家在正三角形中心附近的分布集中程度,如表 1所示。可以看出,三角形内大部分节点分布在中心区域中。
表 1 各领域科学家的映射三角形分析
领域 中心区域点数 映射三角形内总点数 q值 < q0 > P(q0 > q) 复杂网络 5 444 8 126 0.67 0.44 0.001 深度学习 5 647 7 954 0.71 0.56 0.006 社交网络 12 427 16 794 0.74 0.52 0.001 大众传媒 5 258 6 742 0.78 0.61 0.004 为了检验这一集中趋势的显著性,本文构建了零模型[30]与之比较。零模型的构建方法是,将网络中各节点的总被引次数进行随机互换,然后对互换后的网络重新根据上述方法构建最近邻映射三角形,并计算每个点在新构的映射三角形上的映射位置,统计节点在新构映射三角形中心区域的比例(用q0表示),并计算重复性随机构建零模型时出现q0 > q的概率P(q0 > q)。P(q0 > q)表示的是随机零模型中出现中心集中趋势比实际统计更强的极端情况的概率,其含义等价于统计显著性P值,越低越表示中心集中趋势的显著。为了计算这一概率,本文对每个领域重复随机构建零模型103次,观察出现q0 > q的次数,计算结果如表 1所示,其P(q0 > q)均小于0.01,说明该中心集中趋势是显著的,暗示出科学家合作关系常常较为均匀地散布在多个较高影响力合作对象上,呈现出较强的均衡性特征。
The Equilibrium Property in Scientific Collaborations
摘要: 本文采用正三角形映射的方法对科学家之间的合作关系模式进行了实证分析。这一方法基于科研合作网络数据,把每个科学家同其近邻的3个满足给定条件的高影响力科学家,根据合作关系疏密,映射到一个标准正三角形上。根据他们在映射三角形中的映射位置分布,来测定其合作关系模式。研究发现,科学家在映射三角形上的分布呈现出中心集聚趋势,说明科学家的合作关系常常较为均匀地散布在多个高影响力合作对象之间,其关系模式呈现出较强的均衡性特征。本文所分析的4个研究领域均在全参数空间内呈现这一特征,而科学家的学术年龄、被引次数差异等因素均不影响该特征的表达。进一步分析发现这种均衡性特征对科学家的科研影响力的影响以负面为主。这一研究为分析科学家之间的合作关系模式以及各类复杂网络的节点关系提供了新的视角。Abstract: This paper uses the method of regular-triangle mapping to empirically analyze the collaboration between scientists. Based on the data of scientific collaboration networks, each scientist is mapped to a standard regular triangle based on the collaboration relationship with three nearest higher-influence scientists who satisfy a type of given condition. The modes of their relationship can be shown by the pattern of their mapping position in the regular triangle. We find that the distribution of scientists on the mapping triangle shows obvious center-gathering tendency, indicating the strong equilibrium property that the collaboration of scientists is often evenly distributed among multiple collaboration partners with higher-influence. This property can be observed in the full parameter space of all of the four research topics discussed in this paper, and the academic age, the difference in total citations and some other factors do not efficiently impact the expression of the equilibrium property. Furthermore, we find that the impact of the equilibrium property on the scientific influence of scientists mainly is negative. This research provides a new perspective for analyzing the pattern of collaboration relationships between scientists and the node relationships of various complex networks.
