本文为课程《社会科学中的计算思维方法》的课程笔记,这门课在Mooc上似乎也有,不过是SPOC的来着。本来打算等期末的时候再一股脑地整理成一篇Blog,不过我发现内容是实在有些多,只好份部分放出,本篇是这门课的前两章内容。
第一章 网络与图论
1.1 无处不在的网络
ICT:信息与沟通技术
1.2 网络与图
图的两个基本元素:节点 + 边
图 = 事物 + 联系
同构:画法不同,但结构相同
1.3 路径与连通
路径/通路:怎么走可以到达,可以有很多
最短路径 体现 距离
连通:若图中有两节点没有路径,则说这个图:
连通分量:每个连通的最大的部分
1.4 二部图与广度优先搜索
一个图所表达的关系可能正好将节点分为两类,所有边跨在两组之间,这样的图被称为二部图。
很多看起来不是的,也可以是二部图。
判断方法:
一个图是二部图 充要于 它没有长度为奇数的圈。
图上的广度优先搜索:从一个任意节点开始,沿着边列举节点的算法。
若出现层内边,则说明出现长度为奇数的圈,不是二部图
1.5 三元闭包与聚集系数
不仅要考虑瞬时快照,也要考虑随时间的变化
三元闭包(结构性机制):如果两个互不认识的人有了一个共同的朋友,则他们将来成为朋友的可能性提高。
某个节点的重要性:
结构洞:若拿掉该节点会分开网络,说明这个节点很重要
聚集系数:定量测量:体现了凝聚力的大小
A的聚集系数 = 与A相邻的任意两个朋友也是朋友的概率
= 与A相邻的朋友对的个数/总可能的对数
1.6 三元闭包原理的大数据验证
两个问题:
- 定量化
- 合适的社会网络数据/提炼指标数据
说法定量:共同朋友越多,未来成为朋友的可能性越大
使用数据:电子邮件网络 约等于 社会网络
可能性用发生的频率来代表
1.7 强关系与弱关系
边的一种属性类型:表达新老关系的不一样:强 - 弱
被动参与:三元闭包暗示了随时间推移,有的人会被动参与某些网络
嵌入性:边的属性 = 一条边两端共有的邻里数
嵌入性越强,信任越多,社会资本越强(需要说明分析框架)
结构洞:移除后,网络被分开,则该点为结构洞。
冗余越小的结构洞,其社会资本就越多。
对相邻节点具有「权力」
1.8 弱关系与捷径
弱关系具有特定优势
捷径:将两个相距较远的节点直接联系在一起的边。(没有它时距离至少为3)
强三元闭包原理:若AB,AC间都为强关系,则BC应该形成边。
若A符合强三元闭包,且至少有两个强关系邻居,那么与A相连的任何捷径必定为弱关系。(反证法易证)
强三元闭包原理精神:没有共同朋友 - 捷径 - 弱关系
定量化:共同朋友越多,关系强度越高
小结
嵌入性,强三元闭包原理,结构洞,二部图,聚集系数,广度优先搜索
第二章 同质性与社交关系
1.1 同质性与社交关系
同质性:身份同质性与价值同质性(社会性机制与个人性机制)
同质性 ≠ 同构性
同质性受到的影响:
- 生态过程:场所的影响
- 关系过程:交叉关系的影响
- 网络过程:随时间变化的动态
社会交往:
每个人的特质:分为固有特质和可变特质
同质性是社会网络结构形成的基本外部原因
「选择在先,还是影响在先?」
1.2 社交网络中同质性的测量
设节点数为n,边数为e,不同颜色节点占比p,两端节点相同的边数s。
s越大(占比越高),同质性越明显。
So同质性用$\frac{s}{e}$和$p^2 + (1-p)^2$来衡量同质性,若前者大于后者(平均情况),则说明同质性有所体现。
1.3 物以类聚,人以群分
身份/价值同质性:人们通过属性来选择交流对象
为什么会影响社会网络同质性的动态:
- 个体具有「加入」的主动性和自主性
- 也有「退出」的主动性
同质性是一个「动态过程」
从属网络:人们通过社会选择建立关系(都是主动的过程)
「形成网络同质性的机制之一,是个体节点的主动选择」
1.4 近朱者赤,近墨者黑
由场所带来的影响,是同质性形成的另一个重要机制
同质性是「选择」和「影响」共同作用的后果
社会归属网:三类闭包:三元,会员,社团闭包
- 社团闭包:共同参与的事情越多,建立联系的可能性越大
- 会员闭包:参与某事的朋友越多,被影响而参与的可能性就越大
「形成网络同质性的机制之一,是个体之间的相互影响」
1.5 朋友与相似(大数据实验)
数据支持:人们相似性随社会活动的增加而增加,且在某一点后进一步增加(认识后)
Wiki百科数据样本:相似性用两人共同编辑文章数量/两人共编辑的文章总数
问题 - 模型 - 数据 - 映射的过程
1.6 谢林模型及其意义
谢林:隔离的动态模型:隔离不是个人刻意选择的后果
模型:每一个居住者都要与一定数量的同居者为邻,否则会搬家。
「以居住隔离为例,谢林模型模拟了同质性的动态变化」
小结
人的特质,同质性的测量,同质性诞生机制,谢林模型