随着人工智能技术的飞速发展,大语言模型正在为各个领域带来变革性影响。在质性研究领域,大语言模型有望极大提升编码分析的效率和洞察力,开启质性分析的新时代。
传统质性分析面临发展困境
质性研究作为社会科学的重要方法,在深入理解人类行为和社会现象方面有着不可替代的作用。然而,传统的质性分析方式(尤其是需要编码的)正面临越来越多的挑战。首先,编码工作耗时费力,效率低下。巴斯特(Basit)的研究发现,仅仅对8个45分钟的访谈录音进行转录和编码,就需要研究者投入超过50个小时。对于动辄数十、上百个访谈的研究项目,手工编码的工作量之巨大,常常超出研究者的想象。然而,目前常用的计算机辅助质性分析软件(如NVivo、ATLAS.ti等),主要用于编码的可视化管理与检索,在语义理解和知识抽取方面的作用非常有限。随着数字化时代的到来,非结构化文本数据呈现爆炸式增长,给质性研究者带来前所未有的挑战。
低效率的编码方式、有限的计算机辅助能力以及海量非结构化数据带来的冲击,已成为制约当前质性分析发展的重要“痛点”。面对不断攀升的人力成本和时间压力,以“小规模、手工化、碎片化”为特征的传统质性分析范式正面临严峻挑战。研究者迫切需要借助人工智能等新兴技术来突破瓶颈,实现质性研究的创新和变革。其中,以大语言模型为代表的自然语言处理技术,有望在提升编码效率、拓展分析广度、支撑理论创新等方面发挥关键作用。
大语言模型的优势与潜力
近年来,以GPT、Claude等为代表的大语言模型在自然语言理解和生成任务上展现出卓越的能力,引发了学术界和产业界的广泛关注。在质性分析领域,大语言模型有望为编码工作带来变革性影响。
其一,大语言模型具有出色的语义理解和知识抽取能力。通过学习词语的上下文分布,模型可以深入理解词义以及词与词之间的关系。例如,当模型遇到“奋斗”一词时,它不仅知道这是一个动词,还能理解其隐含的情感(如正面、励志)以及可能的上下文(如学业、事业、梦想等)。这种深度的语义理解为质性分析提供了更精准的编码基础。
其二,新一代大语言模型支持长文本输入,能够更好地把握语料的整体语义。最新的大语言模型支持数万字乃至数十万字的长文本输入,这意味着模型可以“整篇阅读”访谈记录,全面把握受访者表达的来龙去脉。在宏观语义的牵引下,局部片段的编码也能获得更准确、更连贯的解读,从而提升整体分析的深度和连贯性。
其三,大语言模型具备强大的常识推理能力,有助于发现文本中隐含的因果逻辑和理论线索。例如,当受访者提到“我被迫辞职了,因为照顾孩子实在太累”时,尽管她没有明说,但我们可以合理推断她曾经面临工作和育儿的冲突,最终选择了辞职来照看孩子。这种看似简单的推理,对于传统的计算机程序而言却很难实现。通过海量语料的学习,大语言模型掌握了丰富的现实世界知识,具备了接近人类的常识推理能力,能够补充访谈者言语中的省略、跳跃和暗示,揭示人物行为背后的动因脉络,为研究者提供更丰富的解释视角和理论线索。
大语言模型强大的信息提炼和归纳能力,有望开启“从整体到局部”的新型编码范式。当前,质性分析普遍采用“自下而上”的编码逻辑,即从最细微的概念标签开始,逐步归纳抽象出更高层次的范畴,再探索范畴间的联系。引入大语言模型后,我们可以先从“鸟瞰”的视角对访谈全文进行理解和概括,提炼出核心概念、关键事件和情感基调,再聚焦到具体片段进行细化编码。尤其是随着计算能力的不断提升,未来的模型有望实现更长文本、更深层次、更广领域的语义理解,从而为研究者提供更加智能化、全面化的编码辅助。
人工智能辅助编码的实践探索
为充分发挥大语言模型的语义理解优势,我们需要对传统的编码方式进行一定程度的结构化改造。大语言模型为我们提供了“从整体到局部”的新型编码范式,即“先见森林,再见树木”。在初步编码阶段,模型可以针对长文本内容一次性提炼出相对独立的“事件片段”,然后尝试以“事件”为基本单元对编码过程进行结构化。在每个事件单元内部,我们进一步定义了一套结构化的编码维度,如“事件标签”“事件定义”“事件属性”“前置条件”“应对策略”“事件结果”等。通过这种方式,我们可以更好地将质性编码的要求转化为大语言模型易于理解和执行的任务。同时,事件单元之间可以建立一定的逻辑联系,从而避免编码过程过于割裂。
为了检验大语言模型辅助编码的可行性和有效性,我们以扎根理论为例,选取了若干访谈文本,分别使用GPT-4、Claude、Kimi这三款主流模型进行测试。结果显示,这些模型都能较好地识别访谈中的关键事件,并提炼出事件要素。然而,不同模型生成的编码在侧重点上略有差异。GPT-4的编码更加细致入微,对事件细节的刻画更丰富;Claude更擅长把握事件的宏观逻辑,善于分析前因后果;Kimi则更贴近中文表达习惯,编码用语更加本土化。
总的来看,不同模型在编码任务上各有所长,可以相互补充。实践中,研究者可以根据项目需求,灵活选用不同模型。未来,还可以探索多模型协同编码的可能性,通过整合多种模型的优势,进一步提升编码的准确性和全面性。例如,可以考虑对不同模型的编码结果进行交叉验证,或者让模型之间协同工作,互相补充和优化,形成更加全面和深入的分析结果。
进一步的实践探索还可以包括开发专门针对质性研究的模型和工具,使其更好地适应具体研究领域的需求。例如,针对社会科学、教育、医疗等不同领域,定制相应的编码维度和分析框架,以提高模型的专业性和适用性。同时,通过不断积累和分析实际研究中的编码案例,持续优化模型的性能和精度,使其在复杂和多变的质性研究环境中表现得更加出色。
大语言模型重塑质性研究范式
大语言模型在质性编码中的应用不仅是一种技术层面的工具创新,更有望从根本上重塑质性研究的范式体系。
首先,基于大语言模型的辅助编码,有望大幅提升编码效率和一致性,为开展大规模的质性研究创造条件。通过统一的任务提示,不同研究者更容易实现编码标准的统一,从而为汇聚和比较不同来源的质性材料打开了方便之门。可以预见,在不远的将来,跨区域、跨文化的大样本质性研究将不再遥不可及,我们对人类行为和社会现象的理解将获得前所未有的广度和深度。
其次,“从整体到局部”的编码逻辑有助于实现宏观语境与微观细节的贯通融合。我们可以先快速提炼出访谈的核心概念和关键事件,在纵观全局的基础上,再聚焦细节进行深入解读。这种“自上而下”与“自下而上”的双向编码过程,犹如“钩”与“织”的有机结合,使得对质性材料的理解既有宏大理论的高度,又有鲜活经验的深度。正如科菲(Coffey)所指出的,优秀的质性研究须在“特殊性”与“普适性”之间找到平衡。大语言模型为这种平衡的实现提供了新的路径。
最后,大语言模型强大的常识推理能力为揭示访谈文本中隐含的因果逻辑提供了新的可能,有望极大拓展质性分析的理论想象力。日常口语表达往往充斥着大量的省略、跳跃和指代,许多关键性线索隐藏在字里行间,需要研究者发挥“悟性”去补充和联想。但人的洞察力毕竟有限,难免受到知识背景和经验视野的制约。换言之,大语言模型是洞见生成的“助推器”,有望最大限度地激发质性研究者的理论敏感性和创新能力。
纵观技术发展的历史,每一次重大突破都会引发方法论的革新,进而重构学科版图。大语言模型之于质性研究也不例外。当下,这项变革性技术已在我们面前铺陈开来,开启了一个无限可能的新时代。研究者们应以开放的心态拥抱这种范式重构,在传承经典的同时,以智能的力量拓展质性分析的广度、深度与力度。可以预见,大语言模型与质性研究的融合,将为社会科学的发展开辟无限广阔的新疆域。
(作者系温州医科大学精神医学学院副教授)
来源:《中国社会科学报》2024年7月4日第2926期
作者:颜文靖