李雨浛:在数据、网络与民意之间——用计算社会科学方法探讨数字媒体与可持续未来 | 提升之路系列(八)

2023-05-04 14:20:33   来源:商业新知网

导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

作为一名文科生,我在学习统计和编程语言的路上一直以来都磕磕绊绊,十分艰难。我以文科生的身份考入武汉大学新闻与传播学院,大二时的“媒介调查与统计”一门课的分数只有82分;直到本科毕业时,我仍然对基本的统计方法一无所知,更不要说在我看来是天方夜谭的R与Python语言编程,所以在作本科毕业论文时,虽然我想实施一些更有意思的选题,却因方法受限而不得不作罢,最后只选取最为基础的手工编码方法完成了一个不同媒体之间叙事比较的案例研究。2020年考入清华大学新闻与传播学院读硕士研究生后,我只知道自己朦朦胧胧对社交媒体和环境议题感兴趣:在社交媒体和气候变化问题都十分重要的当下,人们的环境认知和实践无疑受到社交媒体上的信息和周边社会网络的影响。具体而言,缺少传播资源与能力的非政府组织如何利用社交媒体的特性达成自己的环境倡导目标、触及更大范围的受众并使公众态度和行为向环境友好方向转变?在社交媒体越来越重要的今天,是谁在这一平台上占据主导、影响人们对气候变化的感知和理解?媒体或者结构化的社会网络如何影响人们的环境认知?


(资料图片仅供参考)

这些问题激发着我想要从事社会科学研究的兴趣。因此,我在硕士的第一学期完成了一项关于环保非政府组织在社交媒体上如何进行环境倡导的研究。当时,我使用深度访谈的方法采访了大概十位环境公益组织的负责人。研究做得很辛苦,整理录音和访谈资料花费的时间也很长,但在访谈过程中了解到的各种细节、接触到不同组织负责人却让我非常兴奋。但当我最后把文章拿给我的导师审阅时,她给了很多批评和建议,告诉我质化研究有时候甚至比量化研究更难做,并且委婉地让我多上一些研究方法类课程,争取做出一个扎实规范的研究。对于想走上学术道路的初学者而言,最好的方法是学习并复制一个可操作性强的量化论文,使用规范的量表和现成的统计工具。但我研究和自学了很久,始终觉得自己对心理模型和量表难以提起兴趣。此外,我并不想放弃质化研究中那些有趣的、丰富和翔实的细节,同时又对如何提升自己的归纳和推断能力非常困惑:如果既想要使用量化方法来做出规范的好上手的研究,又想要保留研究的诸多细节,怎么做才是最好的做法?如果想要做出严谨的、具有信度和效度的归纳和推断,我们应该采用什么样的统计学手段去说服自己、说服审稿人、说服读者?

偶然之间,我从身边同学的推荐之下了解到大数据能力提升项目,在某种程度上,大数据能力提升项目让我看到了在量化和质化研究中找到中间道路的可能性——或者说,计算方法是一种另类的量化手段。其实,在进入研究生学习的第一年,我就通过读文献了解到“计算社会科学”这一领域的存在。当时,我内心虽然觉得那些采用大数据和计算方法的社交媒体研究非常吸引人,却觉得如果自己想要上手计算方法,几乎是不可能完成的事情。而大数据能力提升项目恰好给了我这个尝试的机会,我也真正是在项目的一系列课程中,逐渐感受到计算方法的魅力,以及找到嫁接自身领域和计算方法的可能性。在孟天广老师开设的政务大数据应用与分析课程上,我初步接触了因果推论、实验方法、机器学习等前沿研究方法。因为这门课还配套有相应的工作坊指导,我几乎每节工作坊都没有缺席,在课后按照助教分享的代码和范例一步步复制。课余时间,我还报名参加了Coursera上提供的一系列Python编程入门、社会网络分析和机器学习等入门课程。这些都为我后来将这些方法逐步应用到自己的研究之中打下了坚实的基础。

对于孟天广老师在课程上介绍过的两个观点,我一直记忆犹新,这也间接塑造了我对计算社会科学方法的认识和学习方法:第一,大数据方法可能会成为量化和质化研究的桥梁。这是因为大数据方法采用的文本和图片数据,在过去几十年的研究中可能更多被归类于定性素材,而机器学习实质上是采用计算机辅助的定量化分析,研究者在解读结果的过程中,可以采取定性或定量的多元路径。另外,传统的定量研究由于采取问卷的形式,所得到的研究数据通常是结构化的,抛弃了大量文本和图片等非结构化数据中的丰富内容,而计算方法恰好能够帮我们分析出大数据中隐藏的特征和模式。虽然大数据存在改变数据驱动、缺少问题和理论导向的缺陷,也需要在信度、效度和因果推断上给出进一步的解释和改进,但总体而言,大数据方法仍然极大地拓宽了传统量化研究的选题宽度,给包括传播学在内的许多学科都注入了新的实践和理论活力。

第二,学习计算工具的方法无他,最重要的是“learning by doing”(做中学)。如果一个人能够清晰地把自己所学的内容和知识传授给其他人,那这个人一定就深入掌握了这一方法。

受这两个观点的启发,我开始在自己主导的一项社交媒体与气候变化讨论的研究中采取语义网络和情绪分析的计算方法,探讨气候变化相关视频的内容框架和用户气候变化感知之间的关联。最后,论文获得了由国际传播学会(International Communication Association)环境传播分会颁发的最佳学生论文奖。这些经历真正让我感受到采用大数据方法从事社会科学研究的潜力,也坚定了我想要成为环境传播和计算社会科学这一交叉领域的出色学者的决心。

2022年国际传播学会环境传播分会最佳学生论文奖奖状

在2022年春季学期,受学院学生会的邀请,我在学院的“量化学习小组”里分享了使用有监督机器学习和社会网络分析做研究的经验和代码。在有监督机器学习的讲座里,我介绍了机器学习分类算法,逻辑斯蒂回归模型、朴素贝叶斯模型原理,并带领大家完成数据处理、模型训练与应用等任务;在社会网络分析的讲座里,介绍社会网络分析的基础概念、方法应用、相关理论,并带领大家完成处理数据、建立网络、分析网络等任务,前后一共有五十余位同学到场参加讲座。在这两次的分享中,我也逐步加深了对计算方法的原理及应用的认识。

2022年暑假,不满足于已经学完的大数据能力提升项目课程和Coursera上能够获取到的免费资源,我想要进一步提升自己的大数据编程能力。于是,我报名参加了由密歇根大学每年定期举办的“校际政治学和社会学研究联盟”暑校(Inter-university Consortium for Political and Social Research Summer Program, 简称ICPSR)。我一共参加了“网络分析:前沿话题”、“社会科学中的因果推断”和“面板数据和序列分析”等三门为期四周的方法论课程,并获得了由EITM研究所颁发的成绩证书。

EITM(Empirical Implications of Theoretical Methods)研究所颁发的证书

我很感谢大数据能力提升项目,也十分感谢在这个项目中遇到的孟天广老师,他在我学做研究的路上、以及后续申请密歇根大学ICPSR暑校和申请国外博士项目的过程中都给予了我非常大的启发和帮助;我也想感谢我在上课过程中结识到的合作者和朋友,与优秀之人同行,使我有了更多进步的动力。可以说,是大数据能力提升项目让我的研究能力不断成长,使我的职业目标和学术方向更加清晰,而我也立志于在未来成为一名优秀的计算社会科学研究者,在未来的博士研究期间做出更多结合理论与实证的优秀作品,为计算方法的推广和应用贡献自己的力量。

关键词:

精彩阅读

【热闻】FTTR如何成为巴西运营商Oi新增长点?

热点

Oi作为巴西最大的电信运营商之一,拥有超过400,000公里的光纤,为2,300多个城市提供光纤接入网络。

李雨浛:在数据、网络与民意之间——用计算社会科学方法探讨数字媒体与可持续未来 | 提升之路系列(八)

热点

作为一名文科生,我在学习统计和编程语言的路上一直以来都磕磕绊绊,十分艰难。

马云被东京大学聘为客座教授 ;“五一”最热十大景区出炉...

热点

当地时间5月2日,苹果宣布和谷歌联合提交了一份拟议的行业规范,以帮助打击滥用蓝牙位置跟踪。

当CRM遇见ChatGPT,AI如何帮销售打造“最强大脑”

热点

ChatGPT诞生至今不过100多天,但它已经对很多行业产生了巨大影响。

微软关玮雅:每个应用程序都可以由 AI 来驱动 | 中国AIGC产业峰会

热点

作为当前全球最受瞩目的AIGC玩家之一,微软相继发布两款在搜索引擎、生产力工具上面的颠覆级应用。

本周值得读的 AI 论文(4.24-4.30)

热点

本设计也存在一些局限性,例如缺乏统一的机制模型之间的通信。

GPT-4 API免费用??OpenAI:律师函警告,快删了

热点

最近什么GitHub项目最火?GPT4FREE绝对是其中之一。

用AI把哪些行业重做一遍,能比大公司更超前?|圆桌论坛@中国AIGC产业峰会_全球独家

热点

AIGC对内容市场总价值的贡献至少为10%,这个百分比未来可能会显著增加。

AI专属社交平台爆火,全体人类被禁言只能围观 当前简讯

热点

成千上万的用户连夜涌入,每日积极发帖,活跃度堪比ChatGPT。

组建超级人工智能公司的5大关键要素

热点

最近看到这样一个颇为传奇的AI创业案例,说伟大的公司只需要十一人。

财富

第一共和银行收购后的大赢家:摩根大通 焦点热讯

资讯

第一共和银行收购后的大赢家:摩根大通,摩根大通入手了一家非常干净的银行,而且是以最干净的方式。

中式面馆的“麦肯梦”,还有戏吗?|环球今日报

资讯

中式面馆的“麦肯梦”,还有戏吗?,中式面馆的“麦肯梦”,还有戏吗?

全球快看:六年开万店,让年轻人爱上在家吃饭的锅圈食汇冲上市

资讯

六年开万店,让年轻人爱上在家吃饭的锅圈食汇冲上市,为港股开锅

出海厂商“战场收缩”,2023年的三消市场还有机会吗?|全球视点

资讯

出海厂商“战场收缩”,2023年的三消市场还有机会吗?,《RoyalMatch》的“横空出世”改变了三消赛道的竞争格局

特斯拉「象征性」涨价,销售催「等等党」赶紧下单 | 次世代车研所

资讯

特斯拉「象征性」涨价,销售催「等等党」赶紧下单|次世代车研所,在车企们纷纷跟进价格战之下,特斯拉却突然

全球热讯:天涯“沦落”,web 3.0的世界不懂BBS

资讯

天涯“沦落”,web3 0的世界不懂BBS,天涯路远,后会无期。

DIY投资者最容易犯下的错误|焦点热讯

资讯

DIY投资者最容易犯下的错误,不要“搬石头砸自己脚”。

这个五一,我带娃办婚礼

资讯

这个五一,我带娃办婚礼,线下办婚礼,遭遇“价格刺客”。

开关电源漏电怎么回事?空调专用漏电保护开关?

资讯

开关电源漏电怎么回事?用功率 电压就等于电流。比如用电器总功率4KW,那么4000 220=18A。要求漏电开关额定电流要大于负载电流。一般情况下

热水器装软管还是硬管?燃气热水器几根管?

资讯

热水器装软管还是硬管?不能PPR管应用于建筑内冷热水管,是不能用做油管的,油管要专用油管,可以用无缝管或镀锌管,很多的油是具有一定的腐蚀性

李雨浛:在数据、网络与民意之间——用计算社会科学方法探讨数字媒体与可持续未来 | 提升之路系列(八)

作为一名文科生,我在学习统计和编程语言的路上一直以来都磕磕绊绊,十分艰难。

马云被东京大学聘为客座教授 ;“五一”最热十大景区出炉...

当地时间5月2日,苹果宣布和谷歌联合提交了一份拟议的行业规范,以帮助打击滥用蓝牙位置跟踪。

当CRM遇见ChatGPT,AI如何帮销售打造“最强大脑”

ChatGPT诞生至今不过100多天,但它已经对很多行业产生了巨大影响。

微软关玮雅:每个应用程序都可以由 AI 来驱动 | 中国AIGC产业峰会

作为当前全球最受瞩目的AIGC玩家之一,微软相继发布两款在搜索引擎、生产力工具上面的颠覆级应用。

本周值得读的 AI 论文(4.24-4.30)

本设计也存在一些局限性,例如缺乏统一的机制模型之间的通信。

苹果举行主题为超前瞻秋季新品发布会 AirPodsPro2正式登场

北京时间9月8日凌晨,苹果举行主题为超前瞻的秋季新品发布会,在此次发布会上,备受关注的iPhone 14系列新机、新款Apple Watch Ultra以

微软正为Windows12开发新驱动框架 提升新老显卡性能

Windows 12系统可能会在2024年到来,按照正常的节奏,其开发工作应该早已秘密进行。日前,有开发者从Windows 11最新预览版Build 25188中

华盛顿地铁站首次亮相为视障人士扩展旅行路线

5月25日消息,一款旨在帮助视障人士或盲人行人使用公共交通工具的应用程序在华盛顿地铁站首次亮相。该应用程序名为Waymap,旨在为盲人和视

2022年情况又要变了!华硕高管:今年PC恐怕要供过于求

这两年来,由于疫情导致的居家办公及远程教育需求爆发,一直在下跌的PC市场枯木逢春,2021年更是创下了2012年以来的最快增长,然而2022年情

垃圾佬的心头好!西数新款固态盘SN740曝光

对于DIY垃圾佬来说,散片、拆机件、工包……这些名词怕是并不陌生。本周,西数推出了主要供应OEM厂商的新款固态盘SN740。SN740升级到了第五

虚假宣传、误导消费者 倍至冲牙器关联公司被处罚

后来者要想在激烈的市场竞争中立足,如果可以背靠巨头享受大树底下好乘凉的红利,那自然是皆大欢喜,没有这个福气,也大可凭借自己一步一个