作者:塔娜(中国人民大学新闻与社会发展研究中心研究员,中国人民大学新闻学院副教授);赵倩誉(中国人民大学新闻学院硕士研究生)
来源:《青年记者》2022年第20期
得益于日益增长的多模态人类传播活动数据及算法与算力的突破,传播学领域内,数据与计算驱动的研究——计算传播研究近年来蓬勃发展。然而,此类研究也面临种种质疑。例如,基于大数据的计算传播研究仅仅是数据量级的拓展,不存在本质的创新;计算传播可以解决“是什么”的问题,但是无法解决“为什么”的问题,等等。针对这些疑问,本文尝试讨论以下问题并给出探索性思考:计算传播学能否作为一个学科或新范式,实现领域的理论创新?计算传播研究如何与主流传播学、经典传播理论对话,用新方法传承传播学研究?计算传播研究如何进行创新,避免“新瓶旧酒”的问题?
方法还是范式?计算传播学之辩
长期以来,由于“计算”本身带有明显的方法属性,计算传播学带上了浓厚的工具特征,使得学者们更愿意将其视为方法升级而非范式转型。祝建华等认为,计算传播学(computational communication research)不是新的学科或新的理论,而是一种新的研究取向(research approach)或一套新的研究方法,仍然沿用原来的5W框架,从传播者、受众、内容、渠道、效果五个角度展开具体研究。沈浩等强调应对“范式变革”等观点保持警惕,认为仍然需要理论与学说为计算传播学注入问题意识,使数据服务于问题。
尽管计算传播学的产生发展之初似乎只是为了“弥补传播学研究过去在量化方法上所存在的缺陷”,但诸多学者也看到了其潜力,认为它作为一种范式为传播学注入了重构的力量。随着人类社会的数字化转型,人类行为自身也呈现出数字化倾向,因此,需要从更为广泛的视野来审视计算传播学。早在2009年,Lazer等就指出,大数据环境下社会科学领域面临着向计算社会科学转型的整体趋势。王成军强调计算传播学依托的是“计算性”,并尝试回溯拉图尔的“计算中心”概念,对于计算传播学的整体逻辑进行重新思考,强调将“计算”作为一种无处不在的基本特征重新认识社会事实,以及推动学科范式重构。计算传播学并不排斥传统方法,但是更强调“计算”本身的核心地位。
对于计算传播学能否作为一个独立范式存身,学界争议犹在。但值得明确的是,将计算传播学当作简单的工具和方法已经难以概括当下这一领域的全部实践。2019年,国际传播学学会(ICA)创立首个计算传播学专门期刊,主张从学科范式革新的角度重新认识这一新兴方向,将其定义为一个使用计算算法收集和分析大数据集,来探索和检验理论的新兴传播学子领域。传播学界开始承认并利用计算传播学对于理论革新的巨大学科潜力。在网络化与智能化时代,计算设备、软件与应用程序爆发式革新,越来越多的人类行为映射到线上而被数字化记录,形成大量在线“数字踪迹”(Digital Traces)。人类传播活动的方方面面,从信息获取、人际沟通、亲密关系维持、群体与组织传播,乃至基于人工智能的人机交互,均可形成相应的“数字化身”。“人的物质实体被逐渐映射为虚拟实体”。“计算”是否会在未来成为探索人类行为规律的基础逻辑?这个问题值得探讨。此时,大规模人类传播数据的存在既可以佐证或推翻旧有理论,也可以催生新理论,计算传播学还拥有着诸多可能性。
计算传播研究的新契机
数字踪迹囊括了丰富的人类行为多模态数据,为实证检验、阐释与理解传播行为提供了前所未有的机会,传播学学者恰是这个富矿的受益者。从数字踪迹出发,计算传播学带来了新材料与新工具、新问题与新理论,成为探索人类传播活动的新视角。
(一)新材料与新工具
首先,数字踪迹是自然发生的,而非研究者主动介入与影响而产生的。计算传播学者更倾向于以非介入式的方式收集数据,这就与传统的问卷方法、实验方法得出的数据形成了鲜明对比,一定程度上避免了研究的目的与过程对于参与者的影响。
其次,数据的规模、时空维度乃至典型性都有了质的飞跃。存储能力与高速的网络带宽的提升支持了海量数字踪迹的保存与传输,使得数据集时间跨度往往以年乃至十年计,延展了研究材料的时间与空间。例如,时间序列数据为舆论研究突破传统的截面式研究提供了新契机。随着数据集的增长,小数据集下隐含的长尾趋势也随之显露。此外,传统方法不易甚至不可获得的数据也逐渐进入学者视野。例如基于位置服务获取人类迁移、活动的流向趋势,可以进一步拓展传播研究的维度。
再次,随着算力与算法的发展,研究者可采纳的新工具越来越多元与高能。研究者可以突破传统方法,基于计算中心的强大算力,采用深度学习、神经网络、并行计算进行数据挖掘与大模型训练。同时,随着智能技术迭代,基于智能技术的人机交互也提供了认识人类传播过程的新视角。而且,研究者可以从系统层面进行实验设计并观察全样本用户数据。例如,针对随机用户分组使用不同的内容推荐算法,理解用户与算法的互动。
(二)新问题与新理论
分析数字踪迹,最终的目标是阐释其背后的传播学模式,带来理论突破。计算科学中的算法突破往往来自交叉学科领域,而计算传播学作为学科知识交汇之处,正能够博采众长,打破路径依赖,为传播学注入新的灵感。例如,使用卷积神经网络对政治人物和政治事件的视觉呈现进行自动化分析,发现其中的党派和性别差异,可以更直观地提供政治传播领域的实证证据。
从科学史的角度来看,理论与方法的发展往往互为因果,相互促进。例如,传统相关分析只能证明关联却无法验证因果,近年来蓬勃发展的因果分析方法使用因果链条,进一步帮助我们探索事物的内在规律,所得出的结论可以用于更稳定地支持或推进理论的发展。反过来,理论的推进也不断呼吁着与之配套的、可以验证理论假设的方法。例如,大数据背景下的样本量往往很大,使得无论如何进行假设验证都易得到“显著”的结论,而实际情况是否如此则值得讨论。针对大数据集进行假设验证与推理归纳,需要方法层面的新思考与新设计。另外,要确保大规律中异质性的小趋势能够被发现与识别,同样需要着力。
计算传播研究的新挑战
当前计算传播学研究在数据、研究方法与理论建构三个层面面临挑战。
(一)数据层面的挑战
从数据的所有权与可得性来看,大型社交媒体等公司拥有海量数据,但研究者可获取的数据只是一个微小的子集。研究者除非与这些公司建立合作并遵守严格的约束条件,否则往往无法获取研究所需的全部数据。同时,如何开放数据、开放哪些数据对于作为外部访问者的研究者来说,仍然是个黑箱。这就进一步威胁到了研究的可重复性与结论的可推广性。基于不同的数据子集,研究结论的一致性与普适性始终存疑。另外,线上数字踪迹只是社会中部分成员的数字产品与痕迹,其是否能够代表社会整体仍然值得商榷。
针对其不够真、不够全、不够整齐、缺乏代表性的问题,学界对大数据的社会科学价值仍存在担忧。因此,需要综合考虑计算传播学研究所用数据的可得性并搭建统一的基准数据集,综合使用数据互补、样本修正与交叉验证等的多种应对策略。
(二)研究方法应用的挑战
计算方法的采用面临规范化与标准化的问题。“计算”搭建着现象和数据到理论之间的通路,采用不同视角与算法,即使针对同样的数据集也可能得出不同的结果。目前,许多新的计算方法缺乏规范标准,使得计算传播学研究面临结论可信度低与说服力弱的质疑。针对计算范式,需要搭建可以与经典的社会科学研究方法对话的方法论体系。
从使用的角度,计算传播研究需要独特的技能,例如编程、数据分析与可视化等。一方面,算法的进展与突破直接影响计算结论的形成;另一方面,研究者能够掌握与采纳的计算方法同样影响研究结论的深度和广度。这就需要计算传播研究学者随时跟进算法进展,知悉算法的能力边界,并有效地开展各取所长的跨学科合作。在具体研究中需要避免方法优先与路径依赖的陷阱,从现象和问题出发,寻找相应的计算方法。
(三)理论体系建设的挑战
计算传播研究需要同时完成计算与传播两条进路的理论建设。在计算一侧,对算法不应局限于实用主义,而应思考在传播学的理论框架中以计算为研究范式的理论体系构建。针对计算科学的爆发式发展,计算传播研究所能采纳的算法是其中怎样的子集,不同算法之间如何互构以搭建计算传播的计算之基,计算传播学科是否存在以及如何搭建自有的计算模型体系,均需要学界采用开放的跨学科视角展开严肃的思考。
在传播一侧,为避免计算传播被简单地工具化,需要考虑什么是计算传播的理论问题,哪些是计算传播的研究领域,与传播学其他分支相呼应的计算传播理论体系应该如何搭建。应避免限于方法而忽视理论创新与理论体系建设,使得计算传播学形成一个自洽的学科方向。
理论联动方法,探索“新瓶新酒”
作为一个新兴研究方向,计算传播学前路尚广,但是想要做到开辟新路,结束“范式”与“方法”之争,不仅需要学者们从学理角度“正本清源”,更需要扎实的学科实践“自证其身”。
(一)兼顾理论与数据,回应问题创新知识
计算传播学是“术”与“道”的结合,好的计算传播学研究应为理论与数据双向驱动的。对于单一理论驱动或者单一数据驱动的计算传播研究而言,前者仅仅将“计算传播”视为一种利用大规模数据进行假设验证的方法,而后者则无疑陷入了“拿着锤子找钉子”的困局,无法与经典传播学研究进行有效对话。既从社会科学的理论脉络中广泛汲取灵感,又重视数据的代表性,寻找数据与理论的结合点,致力于回应现实问题与创造新知,才是计算传播学出发的初心所在。
(二)理性使用方法,打造可沟通的计算传播学
对于计算传播学者而言,不但应该在数据获取与方法选择上慎之又慎,也应该承担着讲好数据故事的责任。数据分析的结果如何具体而微地通向社会现实,需要计算传播学研究者在“可沟通性”上下功夫。如果研究者对于计算结果进行流于表面的呈现而缺乏具体阐释,或者是存在炫技心态只追求方法的复杂却不注重研究故事的讲述,最终都只造就了过高的学科门槛,阻隔了计算传播学为更多研究者理解。只有“讲好计算故事”,让“其他多元取向的学者能够理解、相互欣赏”,计算传播学才能更好地找到自己的立身之处。
(三)加强协作共享,推动形成学术共同体
不少学者在呼吁知识社区与协作机制的建立。计算科学学者与社会科学学者之间可以联手共同努力,致力于学科壁垒的打破。Lazer等人指出,直接将计算培训纳入社会科学或将社会科学纳入计算学科往往效率都不尽如人意。如何建立有效的合作机制,推动不同领域内的学者联手,是一个值得深入探索的问题。同时,计算传播学内部学术共同体的建立亦至关重要。不同学者之间进行理论与方法的碰撞,推进数据的共享与方法的学习,建立有共识的操作流程,对于规范化这一领域意义重大。
(四)重视透明与可重复性,筑稳计算传播学的根基
近年来,开放社会科学运动越来越重视透明和可复刻的研究。Klein等人强调,数据和代码的可用性促进了分析结果的可重复性与鲁棒性。推动数据资源共享和代码开源,一方面可以便于他人验证研究,使得可重复的计算传播研究成为可能;另一方面也做到了研究的公开和透明,使得具体操作化的合理性可以收到更多的检验和监督,有利于创建互联互通、积极交流的学术环境。
【本文为中国人民大学马克思主义新闻观研究中心项目“基于中国实践的计算传播学研究”(编号:19MXG11)成果】
本文引用格式参考:
塔娜,赵倩誉.计算传播学:数据与计算驱动的传播学研究[J].青年记者,2022(20):15-17.
| 留言与评论(共有 0 条评论) “” |