社会科学中的计算思维方法笔记Part_1

目录
  1. 第一章 网络与图论
    1. 1.1 无处不在的网络
    2. 1.2 网络与图
    3. 1.3 路径与连通
    4. 1.4 二部图与广度优先搜索
    5. 1.5 三元闭包与聚集系数
    6. 1.6 三元闭包原理的大数据验证
    7. 1.7 强关系与弱关系
    8. 1.8 弱关系与捷径
    9. 小结
  • 第二章 同质性与社交关系
    1. 1.1 同质性与社交关系
    2. 1.2 社交网络中同质性的测量
    3. 1.3 物以类聚,人以群分
    4. 1.4 近朱者赤,近墨者黑
    5. 1.5 朋友与相似(大数据实验)
    6. 1.6 谢林模型及其意义
    7. 小结
  • TOC

    本文为课程《社会科学中的计算思维方法》的课程笔记,这门课在Mooc上似乎也有,不过是SPOC的来着。本来打算等期末的时候再一股脑地整理成一篇Blog,不过我发现内容是实在有些多,只好份部分放出,本篇是这门课的前两章内容。


    第一章 网络与图论

    1.1 无处不在的网络

    ICT:信息与沟通技术

    1.2 网络与图

    图的两个基本元素:节点 + 边

    图 = 事物 + 联系

    同构:画法不同,但结构相同

    1.3 路径与连通

    路径/通路:怎么走可以到达,可以有很多

    最短路径 体现 距离

    连通:若图中有两节点没有路径,则说这个图:

    连通分量:每个连通的最大的部分

    1.4 二部图与广度优先搜索

    一个图所表达的关系可能正好将节点分为两类,所有边跨在两组之间,这样的图被称为二部图。

    很多看起来不是的,也可以是二部图。

    判断方法:

    一个图是二部图 充要于 它没有长度为奇数的圈。

    图上的广度优先搜索:从一个任意节点开始,沿着边列举节点的算法。

    若出现层内边,则说明出现长度为奇数的圈,不是二部图

    1.5 三元闭包与聚集系数

    不仅要考虑瞬时快照,也要考虑随时间的变化

    三元闭包(结构性机制):如果两个互不认识的人有了一个共同的朋友,则他们将来成为朋友的可能性提高。

    某个节点的重要性:

    结构洞:若拿掉该节点会分开网络,说明这个节点很重要

    聚集系数:定量测量:体现了凝聚力的大小

    A的聚集系数 = 与A相邻的任意两个朋友也是朋友的概率

    = 与A相邻的朋友对的个数/总可能的对数

    1.6 三元闭包原理的大数据验证

    两个问题:

    • 定量化
    • 合适的社会网络数据/提炼指标数据

    说法定量:共同朋友越多,未来成为朋友的可能性越大

    使用数据:电子邮件网络 约等于 社会网络

    可能性用发生的频率来代表

    1.7 强关系与弱关系

    边的一种属性类型:表达新老关系的不一样:强 - 弱

    被动参与:三元闭包暗示了随时间推移,有的人会被动参与某些网络

    嵌入性:边的属性 = 一条边两端共有的邻里数

    嵌入性越强,信任越多,社会资本越强(需要说明分析框架)

    结构洞:移除后,网络被分开,则该点为结构洞。

    冗余越小的结构洞,其社会资本就越多。

    对相邻节点具有「权力」

    1.8 弱关系与捷径

    弱关系具有特定优势

    捷径:将两个相距较远的节点直接联系在一起的边。(没有它时距离至少为3)

    强三元闭包原理:若AB,AC间都为强关系,则BC应该形成边。

    若A符合强三元闭包,且至少有两个强关系邻居,那么与A相连的任何捷径必定为弱关系。(反证法易证)

    强三元闭包原理精神:没有共同朋友 - 捷径 - 弱关系

    定量化:共同朋友越多,关系强度越高

    小结

    嵌入性,强三元闭包原理,结构洞,二部图,聚集系数,广度优先搜索


    第二章 同质性与社交关系

    1.1 同质性与社交关系

    同质性:身份同质性与价值同质性(社会性机制与个人性机制)

    同质性 ≠ 同构性

    同质性受到的影响:

    • 生态过程:场所的影响
    • 关系过程:交叉关系的影响
    • 网络过程:随时间变化的动态

    社会交往:

    每个人的特质:分为固有特质和可变特质

    同质性是社会网络结构形成的基本外部原因

    「选择在先,还是影响在先?」

    1.2 社交网络中同质性的测量

    设节点数为n,边数为e,不同颜色节点占比p,两端节点相同的边数s。

    s越大(占比越高),同质性越明显。

    So同质性用$\frac{s}{e}$和$p^2 + (1-p)^2$来衡量同质性,若前者大于后者(平均情况),则说明同质性有所体现。

    1.3 物以类聚,人以群分

    身份/价值同质性:人们通过属性来选择交流对象

    为什么会影响社会网络同质性的动态:

    • 个体具有「加入」的主动性和自主性
    • 也有「退出」的主动性

    同质性是一个「动态过程」

    从属网络:人们通过社会选择建立关系(都是主动的过程)

    「形成网络同质性的机制之一,是个体节点的主动选择」

    1.4 近朱者赤,近墨者黑

    由场所带来的影响,是同质性形成的另一个重要机制

    同质性是「选择」和「影响」共同作用的后果

    社会归属网:三类闭包:三元,会员,社团闭包

    • 社团闭包:共同参与的事情越多,建立联系的可能性越大
    • 会员闭包:参与某事的朋友越多,被影响而参与的可能性就越大

    「形成网络同质性的机制之一,是个体之间的相互影响」

    1.5 朋友与相似(大数据实验)

    数据支持:人们相似性随社会活动的增加而增加,且在某一点后进一步增加(认识后)

    Wiki百科数据样本:相似性用两人共同编辑文章数量/两人共编辑的文章总数

    问题 - 模型 - 数据 - 映射的过程

    1.6 谢林模型及其意义

    谢林:隔离的动态模型:隔离不是个人刻意选择的后果

    模型:每一个居住者都要与一定数量的同居者为邻,否则会搬家。

    「以居住隔离为例,谢林模型模拟了同质性的动态变化」

    小结

    人的特质,同质性的测量,同质性诞生机制,谢林模型

    DAR
    SON