Single-cell RNA sequencing of B cells reveals molecular typing in Sjögren syndrome

  • Wenhao LIN ,
  • Yang XIE ,
  • Fangqing WANG ,
  • Shuying WANG ,
  • Xiangjun LIU ,
  • Fanlei HU , * ,
  • Yuan JIA , *
Expand
  • Department of Rheumatology and Immunology, Peking University People ' s Hospital, Beijing 100044, China
HU Fanlei, e-mail,
JIA Yuan, e-mail,

Received date: 2025-08-18

  Online published: 2025-10-23

Supported by

the National Key Research and Development Program of China(2022YFC3602000)

the National Natural Science Foundation of China(81871281)

the National Natural Science Foundation of China(32441099)

the National Natural Science Foundation of China(82371807)

Copyright

All rights reserved. Unauthorized reproduction is prohibited.

Abstract

Objective: To establish a molecular classification framework for Sjögren syndrome (SS) by stratifying patients into distinct subtypes through unsupervised clustering of B cell single-cell RNA sequencing (scRNA-seq). This study characterizes subtype-specific gene signatures to construct protein-protein interaction (PPI) networks, thereby elucidating core regulatory mechanisms and potential therapeutic targets. Concurrently, it defines the clinical heterogeneity of SS by profiling autoantibodies and B-cell subset distributions across subtypes. Methods: The scRNA-seq data from 24 SS patients and 4 healthy controls were obtained from the Gene Expression Omnibus (GEO) database. We constructed a B cell atlas and identified differential gene expression profiles between SS and healthy controls B cells. Unsupervised clustering was applied to stratify SS patients into different molecular subtypes. Functional enrichment analysis of subtype-specific gene signatures was performed to infer associated biological processes/pathways. PPI networks were constructed using the STRING database and Cytoscape software to identify core functions and potential therapeutic targets for subtype-specific genes. The prevalence of autoantibodies and proportions of B cell subsets were statistically analyzed across subtypes. Results: The B cells were classified into eight subsets: transitional B cell, naïve B cell, memory B cell, double negative 1 (DN1) B cell, double negative 2 (DN2) B cell, VAV3+IRF1+ B cell, GP9+ B cell, and plasma cell. The FindAllMarkers function identified 792 differentially expressed genes (DEGs) between the SS patients and healthy controls. Unsupervised clustering stratified patients into three subtypes: (1) Inter-feron-dominant subtype characterized by enrichment in type Ⅰ/Ⅱ interferon and non-canonical nuclear factor kappa-B (NF-κB) signaling pathways. This subtype showed the highest proportions of naïve B cells and transitional B cells, along with the highest anti-Sjögren syndrome antigen A (SSA)/Sjögren syndrome antigen B (SSB) positivity. (2) B cell activation subtype characterized by enrichment in Fc receptor and B cell receptor signaling pathways. This subtype exhibited the highest proportions of memory B cells and DN1 B cells. (3) Endoplasmic reticulum stress subtype characterized by enrichment in protein folding and endoplasmic reticulum-associated degradation pathways. This subtype was marked by the highest proportion of VAV3+IRF1+ B cells. PPI networks identified subtype-specific hub genes regulating these core functions. Conclusion: Stratification of SS patients through clustering of B cell DEGs successfully defined three molecular subtypes (interferon-dominant, B cell activation, and endoplasmic reticulum stress subtypes). Each subtype exhibits distinct autoantibody profiles and B cell subset distributions. This molecular typing framework advances our understanding of SS heterogeneity and provides actionable insights for targeted therapy development.

Cite this article

Wenhao LIN , Yang XIE , Fangqing WANG , Shuying WANG , Xiangjun LIU , Fanlei HU , Yuan JIA . Single-cell RNA sequencing of B cells reveals molecular typing in Sjögren syndrome[J]. Journal of Peking University(Health Sciences), 2025 , 57(6) : 1032 -1041 . DOI: 10.19723/j.issn.1671-167X.2025.06.004

干燥综合征(Sjögren syndrome,SS)是一种慢性自身免疫性疾病,以淋巴细胞浸润外分泌腺体(尤其是唾液腺和泪腺)为核心病理特征,导致腺体功能进行性下降,引发局部干燥症状及全身多系统损害。我国SS患者的比例约为0.29%~0.77%[1]。SS的临床异质性极强,不同患者间的遗传背景、临床症状、病理机制、治疗反应及预后均有显著差异。当前尚无良好的方法能够区分不同类型的SS患者,因此,有必要通过分析不同患者的基因及免疫细胞特征来对患者进行更精准的“分类”。
B细胞在SS的发病过程中发挥关键的致病作用。SS患者的B细胞活化后,不仅能够作为高效的抗原提呈细胞,将自身抗原呈递给T细胞驱动自身免疫反应,还能持续产生大量自身抗体,如抗干燥综合征抗原A (Sjögren syndrome antigen A, SSA/Ro)抗体、抗干燥综合征抗原B (Sjögren syndrome antigen B, SSB/La)抗体等,并分泌过量免疫球蛋白[2]。B细胞还能够通过分泌多种促炎及抑炎细胞因子[如γ干扰素(interferon γ, IFN-γ)、白细胞介素(interleukin, IL)-6、IL-10等]调节免疫功能,从而影响疾病的发生、发展[3]。不同SS患者间B细胞及其亚群也存在明显异质性[4],且与系统损害程度及淋巴瘤风险相关。分析不同患者B细胞的基因表达特征,有助于对患者进行更好的分层和分类。
分子分型作为解析疾病异质性的重要手段,通过整合基因组、转录组、蛋白质组等多维度分子特征,结合聚类分析等算法,实现了对复杂疾病的精准分类。Hubbard等[5]的研究显示,基于基因集变异分析(gene set variation analysis,GSVA)及K-means聚类分析将系统性红斑狼疮(systemic lupus erythematosus,SLE)划分为8个内型(endotype),揭示干扰素相关基因高表达的患者存在更显著的炎症活动。Zhao等[6]的研究通过一致性聚类识别出类风湿关节炎(rheumatoid arthritis, RA)的不同分子亚型,结合加权基因共表达网络分析(weighted gene co-expression network analysis,WGCNA)和药物数据库,挖掘潜在的靶向治疗方案。上述这些组学驱动的分型策略不仅有助于阐明疾病的发生机制,更能指导个体化治疗选择,预测药物应答及预后分层。随着单细胞测序和空间组学技术的发展,基因层面的分子分型正推动疾病诊疗从传统表型分类向精准分子医学转变,为复杂疾病的精准防控奠定了科学基础。
单细胞转录组测序(single-cell RNA sequencing,scRNA-seq)是一种在单个细胞水平上对全转录组进行高通量测序的技术,旨在测量每个细胞中的基因表达水平,从而识别未知细胞亚群,揭示细胞群体内的异质性,并解析细胞分化轨迹及功能状态。scRNA-seq为探索疾病的细胞亚群及基因层面特征开辟了新路径,也有助于对疾病进行分子分型[7]
基于以上研究背景,本研究拟通过SS患者和健康对照的B细胞scRNA-seq数据,筛选出SS患者与健康对照的差异表达基因(differentially expressed genes,DEGs),利用筛选出的差异基因的表达谱数据,对SS患者进行无监督聚类分析,将SS患者区分为不同分子亚型,进而对各亚型特征基因集分别进行功能富集分析和蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络构建,以揭示驱动不同亚型的核心生物学通路和枢纽基因,同时,探索不同亚型患者的自身抗体和B细胞亚群特征。本研究期望为开发基于B细胞靶向干预的个体化治疗策略提供理论依据,推动自身免疫性疾病的诊疗模式向分子驱动型转变。

1 资料与方法

1.1 scRNA-seq数据集的获取

为了分析SS患者B细胞的基因表达特征,我们获取了基因表达综合数据库(Gene Expression Omnibus, GEO)中的公共scRNA-seq数据集(登录号:GSE214974),该数据集包含24例SS患者及4例健康对照的外周血分选B细胞单细胞数据。此外,我们从公共数据平台获取了上述患者的抗SSA抗体和抗SSB抗体检测数据,其中,抗SSA抗体阴性的患者6例,抗SSA抗体阳性的患者18例,抗SSB抗体阳性的患者10例[4]

1.2 单细胞测序数据的质量控制及预处理

本研究参考了原研究公布在GitHub平台(https://github.com/Molmed/pSS_scRNAseq)上的代码进行质量控制及预处理,具体为合并所有个体的scRNA-seq数据后获得255 462个细胞,排除每个个体中RNA分子总数或基因数排名前2%的异常细胞,随后保留基因数≥200、线粒体基因比例≤20%、血红蛋白基因比例≤1%、核糖体比例≥5%的细胞,同时移除Y、线粒体及其他染色体上的基因,保留编码蛋白、免疫球蛋白及T细胞受体基因,然后对高变基因进行标准化,并进行主成分分析(principal component analysis, PCA)降维(100个主成分),使用Harmony整合不同样本来源的数据,消除样本间技术偏差[8],使用均匀流形逼近与投影(uniform manifold approximation and projection,UMAP)对Harmony结果降维(50个主成分)[9-10]

1.3 B细胞亚群注释

通过FindNeighbors函数构建细胞相似性网络,并使用FindClusters函数识别不同细胞簇,分辨率设置为0.4,利用常用标记剔除非B细胞及几乎无B细胞个体(SS24、抗SSA抗体、抗SSB抗体阳性个体)。最终保留233 034个B细胞进行后续分析。重新降维并整合后,分辨率设置为2.7,细胞被识别为27个亚群,利用FindAllMarkers功能找到每个细胞亚群的特征基因,并基于常用标记注释B细胞。

1.4 差异基因聚类分析

利用FindAllMarkers功能鉴定SS与健康对照间的差异基因,阈值为:至少10%的B细胞表达、P < 0.05、差异倍数至少1.5倍。通过Aggregate-Expression功能将筛选出的差异基因数据压缩为样本级平均表达量矩阵,计算每个差异基因占该个体差异基因总mRNA数量的百分比,并在样本间取Z-score。利用R包pheatmap(v1.0.12)自带的无监督层次聚类,采用ward.D2聚类方法,利用差异基因的表达谱数据,将SS患者分类成不同分子亚型,每个亚型对应一组特征基因集。

1.5 富集分析

为了探索不同亚型SS患者特征基因集的功能特点,使用R包gprofier2(v0.2.3)进行基因本体论(Gene Ontology,GO)和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析[8]。利用GO和KEGG对差异基因进行功能注释,错误发现率(false discovery rate,FDR)矫正的P值阈值为0.05。

1.6 PPI网络构建

为了探索不同亚型的SS患者特征基因集的核心调控机制,本研究利用相互作用基因/蛋白质检索工具(Search Tool for the Retrieval of Interacting Genes/Proteins,STRING)数据库构建PPI网络[11],采用Cytoscape软件(v3.7.0)对PPI进行可视化分析[12],进一步采用MCODE(v1.6.1)插件,以MCODE score >5为阈值提取紧密互作模块,揭示各亚型核心的生物学通路及其在SS发病中的潜在作用[13]

1.7 统计学分析

使用R(v4.3.0)软件对数据进行统计学分析,其中,针对分类变量,使用Fisher确切概率法(Fisher’ s exact test)分析组间分布差异;对于不满足正态性或方差齐性的连续变量,采用Wilcoxon秩和检验分析组间细胞亚群的差异,P < 0.05为差异有统计学意义。

2 结果

2.1 SS患者和健康对照外周血B细胞图谱构建

scRNA-seq数据经过质量控制和预处理,保留了SS患者及健康对照外周血中CD19+B细胞及浆细胞进行后续分析。将所有个体(SS和健康对照)的B细胞根据mRNA表达特征注释成8个亚群,B细胞亚群特征基因点图和B细胞UMAP图谱如图 1所示。其中,过渡B细胞13 749个,初始B细胞(naïve)127 106个,记忆B细胞53 605个,双阴性B细胞1型(double negative 1,DN1)6 735个,双阴性B细胞2型(double negative 2,DN2)13 435个,VAV3+IRF1+B细胞17 024个,GP9+B细胞1 290个,浆细胞90个(图 1A)。比较后发现,SS患者有着更低的记忆B细胞比例[(33.4±6.03)% vs. (21.3±11.3)%,P=0.027]和相对较高的DN2比例[(3.01±0.90)% vs. (6.11±3.85)%,P=0.069]。GP9为血小板典型标记,但因浆细胞数量过少,GP9+B细胞与浆细胞未纳入统计分析(图 1C)。
图1 SS患者和健康对照的B细胞亚群的分子鉴定及可视化分析

Figure 1 Identification and molecular characterization of B cell subsets of SS patients and HC

A, UMAP plots of B cell subsets; B, dot plot showing marker gene expression across B cell subsets; C, comparative analysis of B cell subsets between SS patients and HC. *P≤0.05; ns, no significant, P>0.05. SS, Sjögren syndrome; HC, healthy control; UMAP, uniform manifold approximation and projection; DN1, double negative 1 B cell; DN2, double negative 2 B cell; Memory, memory B cell; Naive, naïve B cell; Transitional, transitional B cell.

2.2 基于无监督层次聚类的SS患者分子分型构建及富集分析

利用FindAllMarkers功能,我们对比SS患者与健康对照的scRNA-seq数据,筛选出两者B细胞的差异基因。筛选标准为:基因在≥10%的SS患者细胞中表达、P < 0.05且差异表达倍数≥1.5。最终共鉴定出792个满足上述条件的基因。通过无监督聚类分析,基于差异基因表达谱将SS患者分为3个分子亚型(图 2A)。三维t分布随机近邻嵌入(t-distributed stochastic neighbor embedding,t-SNE)降维分析显示,不同亚型的患者在t-SNE图中呈现高度分离的聚类分布(图 2B)。对不同亚型的SS患者特征基因集进行富集分析,结果提示亚型1富集于Ⅰ/Ⅱ型干扰素介导的信号通路、非典型核因子κB(nuclear factor kappa-B,NF-κB)信号转导、C型凝集素受体信号通路及Toll样受体信号通路等;亚型2富集于Fc受体介导的信号通路、B细胞受体信号通路、抗原处理和提呈通路等;亚型3富集于蛋白质的折叠、定位和内质网中蛋白质加工及降解信号通路等(图 2C)。根据基因富集的情况,将亚型1命名为干扰素主导亚型,亚型2命名为B细胞活化亚型,亚型3命名为内质网应激亚型。
图2 基于B细胞基因表达谱的患者分型及其功能富集分析

Figure 2 Molecular subtyping and enrichment analysis of patients based on differentially expressed genes

A, integrated visualization from unsupervised consensus clustering on DEGs: molecular subtypes and anti-SSA/anti-SSB antibody status in SS patients; B, 3D t-SNE visualization of transcriptional stratification in SS subtypes; C, enrichment analysis across SS molecular subtypes via GO analysis (including biological processes and molecular functions) and KEGG pathway analysis. SS, Sjögren syndrome; SSA, Sjögren syndrome antigen A; SSB, Sjögren syndrome antigen B; DEGs, differentially expressed genes; t-SNE, t-distributed stochastic neighbor embedding; GO, Gene Ontology; BP, Biological Processes; MF, Molecular Functions; KEGG, Kyoto Encyclopedia of Genes and Genomes; GROUP1, interferon-dominant subtype; GROUP2, B cell activation subtype; GROUP3, endoplasmic reticulum stress subtype; Counts, the number of DEGs enriched in each GO or KEGG term.

2.3 各亚型特征基因集的PPI网络构建及富集分析

为深入探索SS患者3个分子分型的特征基因集的生物学特征,本研究对各亚型特征基因集分别构建了PPI网络,并利用Cytoscape的MCODE插件提取了密集互作的子网络(图 3)。二次富集分析揭示了各亚型核心通路及其在SS发病中的潜在作用。
图3 MCODE识别的核心功能模块互作网络

Figure 3 Interaction network of MCODE-identified core functional modules

A, interferon-dominant subtype; B, B cell activation subtype; C, endoplasmic reticulum stress subtype. MCODE, Molecular Complex Detection.

干扰素主导亚型的PPI子网络包含21个核心蛋白(PARP9、EPSTI1、OAS2、SAMD9、STAT2、EIF2AK2、ISG15、IFITM1、IFI44L、MX2、IRF9、XAF1、MX1、OAS1、IFI6、IRF7、IFI35、PARP14、STAT1、TRIM22、SAMD9L)和188条互作边(图 3A),这些蛋白对应的基因富集于Ⅰ/Ⅱ型干扰素信号通路和JAK-STAT通路,该亚型通过PPI网络的高度协同性,增强了干扰素下游效应基因间的功能耦合。
B细胞活化亚型子网络A的PPI子网络包含21个核心蛋白(CPSF6、NONO、SUPT5H、HNRNPK、CTR9、EEF2、SRRT、NELFCD、SSRP1、EIF4H、PTBP1、PAF1、CCNK、RBMX、EIF2S3、SRSF4、DDX5、EWSR1、EIF4A2、EIF4B、EIF3L)和69条互作边;子网络B包含8个核心蛋白(FERMT3、ARHGAP30、PTPRC、NCKAP1L、SASH3、IL10RA、ARHGAP25、VAV1)和20条互作边(图 3B)。子网络分别富集于RNA的加工剪切与B细胞的增殖与激活,提示B细胞的活化、克隆增殖可能在该亚型起到核心作用。
内质网应激亚型包含20个核心蛋白(HNRNPL、G3BP1、CCT8、CCT3、HDAC2、PPP2CA、RBBP7、RBBP4、HNRNPA2B1、HNRNPF、DAXX、HNRNPH2、RNF4、SRSF8、HNRNPM、CCT4、HSPA8、PSMD2、HDAC3、FBXL5)和57条互作边(图 3C)。子网络富集于多个蛋白质折叠相关通路,提示蛋白质折叠、降解与应激信号传导协同调控异常在该亚型起到核心作用。

2.4 不同亚型SS患者自身抗体及B细胞亚群特征

为了探索3个亚型SS患者的临床特征,我们从GEO数据库中获取可及的临床数据,包括患者的抗SSA抗体、抗SSB抗体。Fisher确切概率法分析显示,不同亚型患者间抗SSB抗体阳性率的差异有统计学意义( P < 0.001),进一步两两比较发现,干扰素主导亚型与B细胞活化亚型患者间的阳性率差异有统计学意义( P < 0.001),而干扰素主导亚型与内质网应激亚型间存在差异趋势(P=0.061)。各亚型间抗SSA抗体阳性率的分布差异无统计学意义(P=0.322,图 4A表 1)。此外,无监督聚类热图显示,9例抗SSB抗体阳性患者中的8例被聚类到相邻的位置(干扰素主导亚型与内质网应激亚型),提示抗SSB抗体阳性的患者具有相对同质的基因特征(图 2A)。
图4 SS不同分子亚型患者血清学自身抗体及外周血B细胞亚群特征比较

Figure 4 Comparison of serological autoantibodies and peripheral blood B cell subset characteristics among different subtypes of SS patients

A, subtype-specific positivity rates of anti-SSA and anti-SSB antibodies; B, proportions of peripheral blood B cell subsets within total B cells in SS subtypes. *P≤0.05; * *P≤0.01; * * *P≤0.001; ns, no significant, P>0.05. GROUP1, interferon-dominant subtype; GROUP2, B cell activation subtype; GROUP3, endoplasmic reticulum stress subtype; DN1, double negative 1 B cell; DN2, double negative 2 B cell; Memory, memory B cell; Naive, naïve B cell; Transitional, transitional B cell; SS, Sjögren syndrome; SSA, Sjögren syndrome antigen A; SSB, Sjögren syndrome antigen B; HC, healthy control.

表1 三组患者抗SSA抗体与抗SSB抗体阳性率比较

Table 1 Comparison of positive rates of anti-SSA and anti-SSB antibodies in three groups of patients

Items Anti-SSA antibodies positive rate (positive/total) Anti-SSB antibodies positive rate (positive/total)
GROUP1 100.00% (6/6) 100.00% (6/6)
GROUP2 66.67% (8/12) 8.33% (1/12)
GROUP3 60.00% (3/5) 40.00% (2/5)
P value 0.322 < 0.001

GROUP1, interferon-dominant subtype; GROUP2, B cell activation subtype; GROUP3, endoplasmic reticulum stress subtype; SSA, Sjögren syndrome antigen A; SSB, Sjögren syndrome antigen B.

不同亚型患者B细胞亚群分布差异也有统计学意义,干扰素主导亚型患者有着最高的初始B细胞和过渡B细胞比例;B细胞活化亚型患者有着较高的记忆B细胞与DN1比例。另外,与B细胞活化亚型相比,内质网应激亚型患者有着更高的过渡B细胞比例;内质网应激亚型患者则有着较高的VAV3+IRF1+B细胞比例;各组间DN2的比例差异无统计学意义(图 4B表 2)。以上结果说明,不同基因亚型SS患者在自身抗体特征和B细胞组成上存在显著差异。
表2 不同亚型SS患者B细胞亚群分布特征

Table 2 Distribution characteristics of B cell subsets in different subtypes of SS patients

B cell subset GROUP1 GROUP2 GROUP3 GROUP1 vs. GROUP2 GROUP1 vs. GROUP3 GROUP2 vs. GROUP3
DN1/%, $\bar x \pm s$ 1.01±0.38 3.66±3.63 1.33±0.49 < 0.001 0.329 0.004
DN2/%, $\bar x \pm s$ 4.85±2.39 6.51±3.74 6.65±5.72 0.553 0.792 0.879
Memory/%, $\bar x \pm s$ 11.6±3.51 28.01±11.75 16.75±7.80 < 0.001 0.247 0.104
Naive/%, $\bar x \pm s$ 65.03±12.20 51.80±13.53 55.61±13.01 0.041 0.177 0.574
VAV3+IRF1+B cell/%, $\bar x \pm s$ 9.46±7.67 5.29±1.38 12.62±5.16 0.124 0.329 < 0.001
Transitional/%, $\bar x \pm s$ 8.10±2.53 4.72±1.64 7.04±0.83 < 0.001 0.329 < 0.001

GROUP1, interferon-dominant subtype; GROUP2, B cell activation subtype; GROUP3, endoplasmic reticulum stress subtype; SS, Sjögren syndrome; DN1, double negative 1 B cell; DN2, double negative 2 B cell; Memory, memory B cell; Naive, naïve B cell; Transitional, transitional B cell.

3 讨论

SS是一种高度异质性的自身免疫性疾病,其分型体系经历了从传统临床表型分类向分子分层方向的演进。临床分型方面,Tarn等[14]基于五大核心症状(疼痛、疲劳、口干、焦虑、抑郁)建立了分层体系,将原发性SS划分为四类亚型:低症状负担、高症状负担、干燥主导伴疲劳、疼痛主导伴疲劳。然而,该体系依赖患者的主观症状评估,且不同亚型间缺乏显著的生物学差异标记,对治疗反应的预测能力有限。
随着组学技术的发展,分子分型逐渐成为可能。Soret等[15]的研究构建了原发性SS的分子分型框架,结合转录组、基因组、蛋白质组等多组学,通过机器学习的方式将患者分为C1~C4共四个分子亚型,C1型有着强Ⅰ/Ⅱ型干扰素信号,高遗传风险[人类白细胞抗原(human leukocyte antigen, HLA)基因关联];C2型类似于健康对照,无显著基因差异;C3型以B细胞活化主导,伴随中强度干扰素信号;C4型由炎症单核/中性粒细胞驱动,其表观遗传发生异常。但是,以上研究均没有特异性针对B细胞对患者进行分析,而B细胞在SS发病机制中具有重要作用。B细胞过度活化导致抗SSA/Ro抗体、抗SSB/La抗体等自身抗体产生,形成免疫复合物沉积于腺体组织,激活补体系统,引发炎症反应[16];同时,B细胞还可分泌过量的免疫球蛋白,引起高丙种球蛋白血症,进一步放大组织损伤。因此,分析不同患者B细胞基因表达特征,有助于对患者进行更好地分层和分类。为了探究不同SS患者的基因表达特征并将患者更好地分类,本研究利用外周血scRNA-seq数据,克服传统转录组技术中因非B细胞基因表达掩盖导致的分子特征偏倚,为SS患者建立了基于B细胞转录特异性的新型分子分型体系。结合单细胞测序技术的细胞亚群量化优势,我们同步分析了患者外周血B细胞亚群的分布特征与自身抗体谱(抗SSA抗体/抗SSB抗体),构建与B细胞亚群、抗体谱、基因调控网络的临床分型框架,有助于实现更精准的分层诊断,指导个体化治疗方案的选择。通过PPI网络挖掘驱动各亚型的核心分子模块,为精准治疗提供潜在的新型干预靶点,推动SS治疗策略向靶向干预转变。
本研究利用scRNA-seq数据,鉴定出792个SS患者与健康对照的B细胞差异基因。利用筛选出的差异基因的表达谱数据进行无监督聚类分析,将SS患者区分为不同分子亚型,其分型结果在三维t-SNE图中呈现清晰分离,表明不同SS患者B细胞在基因水平存在显著的异质性。富集分析提示,3个亚群的特征基因存在明显的功能差异,其中,干扰素主导亚型主要聚焦于Ⅰ/Ⅱ型干扰素信号通路。既往研究显示,SS患者外周血和唾液腺中干扰素刺激基因(如IFI44LISG15等)显著上调[17]。本研究结果显示,B细胞活化亚型主要聚焦于B细胞受体信号通路、Fc受体刺激介导的信号通路等。既往研究显示,B细胞抗原受体(B-cell receptor, BCR)信号异常激活是SS的核心特征,驱动自身抗体产生和淋巴瘤转化[18]。巨噬细胞/中性粒细胞表面的Fc γ受体(Fc gamma receptors, FcγR) Ⅰ(CD64)可以结合IgG,通过免疫受体酪氨酸激活基序(immunoreceptor tyrosine-based activation motif, ITAM)传递信号,促进吞噬和炎症因子释放,FcγR IIB(CD32)是控制自身反应性B细胞活化的关键元素之一,其对维持外周耐受很重要。生发中心B细胞FcγR IIB的下调程度被证明与IgG抗体应答的上调呈负相关[19]。内质网应激亚型则主要富集于蛋白质的折叠、定位,内质网中蛋白质加工和内质网相关蛋白质降解(endoplasmic reticulum-associated degradation, ERAD)基因等,有研究报道,SS唾液腺上皮细胞受到内质网应激影响且与ERAD有关[20]。内质网应激激活未折叠蛋白反应(unfolded protein response,UPR)通路,通过ERN1剪接XBP1 mRNA生成XBP1s蛋白。XBP1s作为关键转录因子,能够驱动浆细胞分化和免疫球蛋白大量合成[21],而分泌过量的异常免疫球蛋白是SS的特征,这类患者可能有着更高比例或功能更加活跃的浆细胞及其前体。三个特征基因体现了不同SS患者基因层面的相对特点,但三者并非完全互斥,B细胞活化亚型与内质网应激亚型对应的患者中,干扰素相关基因相较于正常患者也在一定程度上有所上调。
本研究进一步识别了每个亚型特征基因集在PPI网络中连接数最高的枢纽蛋白,这些枢纽蛋白可能是对应亚型患者的致病关键,在临床上有望开发为新的治疗靶点:(1)干扰素主导亚型的核心基因包括大量干扰素刺激基因(MX1MX2IFITM1EIF2AK2OAS1OAS2ISG15IFI6IFI44LXAF1IFI35)、干扰素调节因子(IRF7IRF9)、STAT家族(STAT1STAT2)、RARP家族(RARP9RARP14)、SAMD家族(SAMD9SAMD9L)等。有研究通过SS患者唾液腺转录组数据发现,RARP9SAMD9SAMD9LEPSTI1等升高,这些基因与干扰素主导亚型患者的B细胞特征基因相对应[17, 22],同时,这些基因再次富集于干扰素相关信号通路。此外,KEGG富集提示,其与JAK-STAT通路相关,SS患者受干扰素刺激后,干扰素刺激基因、干扰素调节因子及STAT家族蛋白的表达均上调。大量干扰素下游基因的表达提示,该亚型患者可能受益于干扰素通路或JAK-STAT通路的靶向抑制疗法,如干扰素抑制剂或JAK抑制剂。RARP、SAMD家族基因的表达提示其可能是潜在的治疗靶点。(2)B细胞活化亚型的子网络2富集于免疫细胞活化,其中PTPRC(CD45)是免疫细胞活化的关键分子;IL10RA是抗炎因子IL-10的受体,IL10RA表达升高可能反映其代偿性抗炎机制受到激活,但不足以抑制持续的炎症。VAV1在既往的研究中已有报道,VAV1作为鸟嘌呤核苷酸交换因子,是T/B细胞抗原受体信号传导的关键调控因子,调控Rho GTP酶活性,影响B细胞骨架重组和免疫突触形成,此外,VAV1在NOD小鼠干燥综合征相关干眼症发病后表达水平升高。BTK抑制剂和SYK抑制剂可能适用于B细胞活化型的患者,VAV1可能是其潜在的靶点[23-24]。(3)内质网应激亚型中的基因富集于多个蛋白质折叠相关通路。雷帕霉素通过抑制哺乳动物雷帕霉素靶蛋白复合物1(mammalian target of rapamycin complex 1,mTORC1)激活细胞自噬过程。自噬可包裹内质网中积累的错误折叠蛋白和受损细胞器,形成自噬体并与溶酶体融合降解,维持蛋白质稳态[25]。抑制mTOR还可间接增强ERAD,促进错误折叠蛋白的逆向转运和降解,因此,推测雷帕霉素可能适用于这类患者。
抗SSA抗体和抗SSB抗体目前是SS最具诊断价值的临床血清学标志物,本研究同时分析了不同亚型患者的抗SSA抗体和抗SSB抗体情况,干扰素主导亚型的患者抗SSB抗体均为阳性,提示抗SSB抗体阳性患者可能有着更高的干扰素水平;而B细胞活化亚型、内质网应激亚型的患者抗SSB抗体阳性率分别为8.33%(1/12)和40%(2/5),且在聚类热图上看,9例抗SSB抗体阳性患者中的8例通过聚类汇集到相邻的位置(干扰素主导亚型与内质网应激亚型),提示抗SSB抗体阳性患者间的B细胞在基因层面上有一定的相似性。杜晶晶等[26]的研究发现,与抗SSB抗体阴性患者相比,抗SSB抗体阳性患者的红细胞计数与白细胞计数明显下降,而红细胞沉降率、IgG、类风湿因子(rheumatoid factor, RF)水平明显升高。本研究结果显示,干扰素主导亚型的高SSB阳性率提示该亚型可能有着更严重的血液系统损伤及更高的炎症水平。目前,分子分型与临床症状难以完全对应上,如抗SSB抗体阳性的患者因其与干扰素主导亚型的患者高度重叠,可在一定程度上提示患者可能的分型,从而指导患者未来的精准治疗。尽管目前分子分型与临床症状尚未完全吻合,但我们发现抗SSB抗体阳性可作为干扰素主导亚型的强预测因子,这一血清学特征为快速识别潜在靶向治疗获益人群(如JAK抑制剂适用者)提供了实用路径。未来仍需开发多维度整合模型以提升分型-表型对应精度。
本研究还分析了不同亚型患者B细胞亚群的频率。Feng等[27]的研究通过流式细胞检测发现,与健康对照相比,SS患者naïve B细胞(CD19+IgD+CD27- B cell)、转换记忆B细胞(CD19+IgD-CD27+ B cell)与非转换记忆B细胞(CD19+IgD+CD27+ B cell)的水平明显增加。基于此背景,我们利用scRNA-seq数据进一步对不同亚型患者的B细胞亚群进行了分析,发现干扰素主导亚型的患者有着最高的过渡B细胞及初始B细胞频率,这表明该亚型患者的B细胞成熟及活化程度较低,其病理过程可能主要由干扰素信号通路紊乱所驱动,这种紊乱可能抑制了B细胞的正常分化成熟。B细胞活化亚型的患者表现出最高的记忆B细胞及DN1细胞频率,较多的记忆B细胞提示存在持续的抗原刺激或免疫激活状态,DN1细胞是双阴性B细胞中具有滤泡归巢倾向(CXCR5+)的亚群,在SLE中其表现为频率降低、CD19表达减弱,且与疾病活动度呈负相关,目前,DN1细胞在原发性SS中的作用尚未明确,需进一步结合实验评估其临床意义[28]。内质网应激亚型的患者则表现出最高的VAV3+IRF1+ B细胞水平,这些细胞的基因表达特征并不显著,可能是一群应激的细胞。在BCR-ABL+ B细胞白血病中,致癌融合蛋白BCR-ABL诱导VAV3高表达。VAV3蛋白对B细胞的发育、形成适应性免疫系统及BCR介导的Ca内流是必需的,其与B细胞的功能密切相关[29],这群B细胞可能有着更活跃的功能。以上结果提示,不同亚型患者的B细胞亚群构成存在明显不同,这为SS的精准分型提供了细胞层面的生物学依据。
综上所述,本研究利用scRNA-seq数据对SS患者与健康对照的差异基因进行聚类,将SS患者分为3个亚型,揭示了SS患者群体的基因异质性,并深入挖掘了不同亚型的分子机制。同时,我们还从自身抗体水平及细胞水平阐明该分子分型的生物学意义,为理解该疾病的发生发展机制、探索个性化诊疗策略及寻找潜在的治疗靶点提供了新的见解。
后续,我们的研究团队将扩大样本,探讨基于不同分型患者外周血B细胞核心基因特征,验证其可重复性并探索其临床应用,并针对不同亚型的核心分子特征研究靶向干预策略,探索新型治疗靶点。

利益冲突  所有作者均声明不存在利益冲突。

作者贡献声明  作者贡献声明林文灏:提出研究思路,设计研究方案,收集、分析、整理数据,撰写论文;谢阳、王芳晴:收集、整理数据;王淑盈、刘香君:分析数据;胡凡磊、贾园:提出研究思路,设计研究方案,总体把关和审定论文。所有作者均参与论文修改,并对最终文稿进行审读和确认。

本研究工作得到北京大学高性能计算校级公共平台支持,特此感谢。

1
中华医学会风湿病学分会. 干燥综合征诊断及治疗指南[J]. 中华风湿病学杂志, 2010, 14(11): 766- 768.

2
Nocturne G , Mariette X . B cells in the pathogenesis of primary Sjögren syndrome[J]. Nat Rev Rheumatol, 2018, 14(3): 133- 145.

DOI

3
Blair PA , Noreña LY , Flores-Borja F , et al. CD19(+)CD24(hi)CD38(hi) B cells exhibit regulatory capacity in healthy individuals but are functionally impaired in systemic lupus erythematosus patients[J]. Immunity, 2010, 32(1): 129- 140.

DOI

4
Arvidsson G , Czarnewski P , Johansson A , et al. Multimodal single-cell sequencing of B cells in primary Sjögren ' s syndrome[J]. Arthritis Rheumatol, 2024, 76(2): 255- 267.

DOI

5
Hubbard EL , Bachali P , Kingsmore KM , et al. Analysis of transcriptomic features reveals molecular endotypes of SLE with clinical implications[J]. Genome Med, 2023, 15(1): 84.

DOI

6
Zhao J , Wei K , Shi Y , et al. Identification of immunological characterization and anoikis-related molecular clusters in rheumatoid arthritis[J]. Front Mol Biosci, 2023, 10, 1202371.

DOI

7
Zeng D , Yu Y , Qiu W , et al. Immunotyping the tumor microenvironment reveals molecular heterogeneity for personalized immunotherapy in cancer[J]. Adv Sci, 2025, 12(25): 2417593.

DOI

8
Korsunsky I , Millard N , Fan J , et al. Fast, sensitive and accurate integration of single-cell data with Harmony[J]. Nat Methods, 2019, 16(12): 1289- 1296.

DOI

9
Slovin S , Carissimo A , Panariello F , et al. Single-cell RNA sequencing analysis: A step-by-step overview[J]. Methods Mol Biol, 2021, 2284, 343- 365.

10
Butler A , Hoffman P , Smibert P , et al. Integrating single-cell transcriptomic data across different conditions, technologies, and species[J]. Nat Biotechnol, 2018, 36(5): 411- 420.

DOI

11
Szklarczyk D , Kirsch R , Koutrouli M , et al. The STRING database in 2023: Protein-protein association networks and functional enrichment analyses for any sequenced genome of interest[J]. Nucleic Acids Res, 2023, 51(D1): D638- D646.

DOI

12
Shannon P , Markiel A , Ozier O , et al. Cytoscape: A software environment for integrated models of biomolecular interaction networks[J]. Genome Res, 2003, 13(11): 2498- 2504.

DOI

13
Bader GD , Hogue CWV . An automated method for finding mole-cular complexes in large protein interaction networks[J]. BMC Bioinformatics, 2003, 4, 2.

DOI

14
Tarn JR , Howard-Tripp N , Lendrem DW , et al. Symptom-based stratification of patients with primary Sjögren ' s syndrome: Multi-dimensional characterisation of international observational cohorts and reanalyses of randomised clinical trials[J]. Lancet Rheumatol, 2019, 1(2): e85- e94.

DOI

15
Soret P , Le Dantec C , Desvaux E , et al. A new molecular classification to drive precision treatment strategies in primary Sjögren ' s syndrome[J]. Nat Commun, 2021, 12(1): 3523.

DOI

16
Broeren MGA , Wang JJ , Balzaretti G , et al. Proteogenomic analysis of the autoreactive B cell repertoire in blood and tissues of patients with Sjögren ' s syndrome[J]. Ann Rheum Dis, 2022, 81(5): 644- 652.

DOI

17
Yang Y , Zhang Y , Liu K , et al. IFI27, a potential candidate molecular marker for primary Sjogren ' s syndrome[J]. Clin Rheumatol, 2025, 44(5): 1949- 1960.

DOI

18
Mohammadnezhad L , Shekarkar Azgomi M , La Manna MP , et al. B-cell receptor signaling is thought to be a bridge between primary Sjogren syndrome and diffuse large B-cell lymphoma[J]. Int J Mol Sci, 2023, 24(9): 8385.

DOI

19
Takai T . Roles of Fc receptors in autoimmunity[J]. Nat Rev Immunol, 2002, 2(8): 580- 592.

DOI

20
Cavalcanti GV , de Oliveira FR , Bannitz RF , et al. Endoplasmic reticulum stress in the salivary glands of patients with primary Sjögren ' s syndrome, associated Sjögren ' s syndrome, and non-Sjögren ' s sicca syndrome: A comparative analysis and the influence of chloroquine[J]. Adv Rheumatol, 2025, 65(1): 2.

DOI

21
Yin Y , Wang Y , Yu X , et al. Overactivation of XBP1 in plasma cells implies worse survival through innate immunity in esophageal squamous cell carcinoma[J]. Cancer Lett, 2024, 597, 217045.

DOI

22
Zhou D , Yu X , Yu K , et al. Integrated analysis identifies upregulated SAMD9L as a potential biomarker correlating with the severity of primary Sjögren ' s syndrome[J]. J Inflamm Res, 2023, 16, 3725- 3738.

DOI

23
Zhang R , Alt FW , Davidson L , et al. Defective signalling through the T- and B-cell antigen receptors in lymphoid cells lacking the vav proto-oncogene[J]. Nature, 1995, 374(6521): 470- 473.

DOI

24
Sun M , Wei Y , Zhang C , et al. Integrated DNA methylation and transcriptomics analyses of lacrimal glands identify the potential genes implicated in the development of Sjögren ' s syndrome-related dry eye[J]. J Inflamm Res, 2023, 16, 5697- 5714.

DOI

25
Zhang X , Chen W , Gao Q , et al. Rapamycin directly activates lysosomal mucolipin TRP channels independent of mTOR[J]. PLoS Biol, 2019, 17(5): e3000252.

DOI

26
杜晶晶, 董兴红, 高洁, 等. 原发性干燥综合征患者抗SSB与其他实验室参数相关性研究[J]. 检验医学与临床, 2023, 20(16): 2395- 2399.

27
Feng R , Zhao J , Sun F , et al. Comparison of the deep immune profiling of B cell subsets between healthy adults and Sjögren ' s syndrome[J]. Ann Med, 2022, 54(1): 472- 483.

DOI

28
Chizzolini C , Guery JC , Noulet F , et al. Extrafollicular CD19(low)CXCR5 (-) CD11c (-) double negative 3 (DN3) B cells are significantly associated with disease activity in females with systemic lupus erythematosus[J]. J Transl Autoimmun, 2024, 9, 100252.

DOI

29
Nayak RC , Chang KH , Singh AK , et al. Nuclear Vav3 is required for polycomb repression complex-1 activity in B-cell lymphoblastic leukemogenesis[J]. Nat Commun, 2022, 13(1): 3056.

DOI

Outlines

/