Generative Psychometrics

本报告将生成式心理测量学（Generative Psychometrics）的研究划分为五大维度：一是方法论层面的合成受试者构建与效度验证；二是基于文本分析的认知与特质自动计算；三是临床落地中的心理监测与干预；四是针对模型本身的心理安全性与价值观偏见审计；五是跨领域综合方法论框架。该结构系统性地勾勒了从实验室仿真到现实临床应用的完整研究版图。

共 54 篇文献，5 个研究方向

LLM作为合成心理被试的方法论研究

聚焦于如何将LLM作为人类被试的数字孪生或合成参与者，探究其人格仿真、心理测量的结构效度、测量不变性及在心理学研究中的替代潜力。相关文献: Afshin Khadangi et. al, 2025 等 15 篇文献

心理学文本挖掘与认知特征计算推断

利用LLM处理和分析人类生成的非结构化文本（如社交媒体、临床记录），通过自动化的方式提取心理构造、认知结构，并推断心理特质。相关文献: Steve Rathje et. al, 2024 等 10 篇文献

临床心理健康监测与交互式干预

关注LLM在临床心理学中的实际应用，包括心理评估的数字化、抑郁检测、咨询中的治疗关系维护以及危机干预支持。相关文献: Ben Weidmann et. al, 2024 等 8 篇文献

LLM的心理安全性、社会偏见与价值观测评

将心理测量框架应用于模型审计，评估LLM的内在偏差、政治倾向、社会合规性以及在对抗性攻击场景下的安全性表现。相关文献: Dusan Bosnjakovic et. al, 2026 等 10 篇文献

生成式心理测量学应用范式与综合综述

涵盖构建标准化的生成式测评系统、跨文化研究范式以及对该领域理论基础与未来发展趋势的宏观综述。相关文献: Suifang Zhou et. al, 2024 等 11 篇文献

总计54篇相关文献

生成式大语言模型赋能心理测量学：优势、挑战与应用

journal.psych.ac.cn-田雪涛, 周文杰, 骆方等, 2026-心理科学进展CSCD核心北大核心CSSCI

生成式大语言模型(Generative Large Language Models, Generative LLMs, 通常简称LLMs)是一种在大规模语料库上预训练的人工智能模型, 为心理测量学领域带来前所未有的机遇和挑战。本文通过整合人工智能与心理学交叉研究发展脉络, 总结LLMs赋能心理测量学的显著优势, 定位LLMs在心理学应用中的重要挑战, 并提出基于LLMs的心理测量研究发展方向。具体地, LLMs能够基于上下文生成连贯的自然语言文本, 具有改变传统测验交互方式的潜力; LLMs突破对超长文本和多模态数据的处理能力, 其强大的内容理解能力能够全面获取和分析被试的心理信息; LLMs有助于实现实时分析和个性化反馈, 促进从结果评价向过程评价的转变。尽管LLMs的实际应用面临着稳定性、创造性和拓展性等挑战, 但在情境判断测验生成、合作式问题解决能力评估、心理健康智慧诊疗和试题质量分析等领域展现出广阔的应用前景和研究价值。