【协和医学杂志】儿童生长发育相关疾病颜面表型与临床资料数据库的构建流程及质量控制要点

B站影视 内地电影 2025-06-06 11:33 1

摘要:作者:强佳祺1,2,王映晶1,2,3,吴丹宁4551253生长发育不仅关乎青少年儿童的身心健康,更是其未来发展的基石。其中,颜面发育受遗传和多种环境因素的共同影响,逐渐成为临床监测儿童生长发育的重要组成部分,多种内分泌代谢疾病、遗传综合征等均可出现颜面表型(表

专家论坛

作者:强佳祺1,2,王映晶1,2,3,吴丹宁4551253

生长发育不仅关乎青少年儿童的身心健康,更是其未来发展的基石。其中,颜面发育受遗传和多种环境因素的共同影响,逐渐成为临床监测儿童生长发育的重要组成部分,多种内分泌代谢疾病、遗传综合征等均可出现颜面表型(表1)。

表1 具有颜面表型的儿童生长发育相关疾病

近年来,随着数字化技术的发展,颜面表型在儿童生长发育相关疾病的监测和管理中的应用不断深入,并展现出独特优势。人脸识别和三维重建等技术有望精准量化儿童颜面表型变化,并为相关疾病的诊断和治疗提供智能化支持。例如,基于深度学习的颜面识别技术已应用于多种疾病的辅助诊断,在唐氏综合征、特纳综合征、德朗热综合征、天使综合征等多种具有颜面表型、导致生长发育障碍的疾病中证实具有良好的诊断性能。

高质量的颜面表型和临床资料数据库可为儿童生长发育相关疾病的精准诊疗和全流程管理提供支持,然而目前多数研究仅基于研发团队自行建立的数据集,存在覆盖疾病种类少、规模小、研究对象代表性不足、质量控制不完善等局限性。因此,有必要建立高质量的儿童生长发育相关疾病数据库。

在数据库建立时,除常规信息化建设外,笔者认为还应将下述方面纳入考量:

1

不仅包含儿童身高、体重等生长发育常规诊疗数据,还应涵盖颜面形态和颌面发育等颜面表现数据[15]。此种整合临床诊疗资料和颜面表型信息的数据库,对于深入探索颜面表型与生长发育相关疾病的关联具有重要意义;

2

建立数据构建流程,确保数据来源与采集内容的科学性,以及数据库的有效、常态化运行与管理,为儿童的疾病诊疗和健康管理提供有效保障;

3

由于颜面图像等资料属于个人生物识别信息,具有高度敏感性,需建立严格的质量控制体系,对法律法规和伦理规范予以界定,在技术层面针对儿童群体加强数据隐私保护。

基于上述背景,本文提出融合颜面表型与临床诊疗信息的儿童生长发育相关疾病数据库的建立方法,全方位阐述了数据库构建流程及质量控制要点。此种融合多维度资料的数据库,更便于深入挖掘传统体征蕴含的诊疗信息,有助于早期发现并干预儿童生长发育过程中可能出现的问题,为多种生长发育相关疾病的早期筛查与诊断提供支持,推动智能技术在儿童生长发育相关疾病诊断与治疗中的应用研究。

此外,由于此种数据库创新性地整合了直接与间接来源数据,本文还提出了临床医师、数据工程师和研究人员在数据库建立和运行过程中的协作流程,并制定完善的质控体系,以期在扩大数据库样本的同时实现对数据进行高效管理,从而更好地揭示儿童生长发育的内在规律,为儿童健康管理提供科学依据和数据支持,并为其他类型数据库的建立提供参考。

1

构建流程

1.1

数据来源

1.1.1 直接来源数据

直接来源数据也称内部数据,为研究者所在中心招募、收集的入组人员颜面图像及相关临床数据。直接来源的图像集均源于真实世界,需覆盖多种具有颜面表型的儿童生长发育相关疾病。图像采集时,建议于患者就诊当日或次日按标准化流程完成面部照片拍摄,并规范收集患者基本信息、病史、体格检查、辅助检查、住院诊治过程等临床资料。数据库应纳入疾病组和健康对照人群。疾病组为经金标准确诊为某种儿童生长发育相关疾病的患者,所患疾病具有特定的颜面表型。对照组应纳入无明显生长发育异常或颜面表型异常的表观正常人群。

1.1.2 间接来源数据

间接来源数据亦称外部数据,其来源于公开资料,包括公开数据库或公开发表文献、书籍中的儿童颜面图像。间接来源数据亦来自真实世界。公开资料中的生长发育相关疾病种类丰富,同时包含健康人群的颜面图像。应尽可能收集患者及健康对照人群的颜面图片及可获得的真实临床信息。

1.2

数据采集内容

1.2.1 直接来源数据

1

颜面图像及影像

对于疾病组和对照组,图像采集内容均应包括正面及侧位的多角度照片。若有条件,建议同时采集三维立体面容照片、面部动态影像等。拍摄时应尽可能避免图片分辨率低、光照不均、拍摄姿势不当、面部遮挡及表情变化等因素的影响,颜面图像的获取应满足以下要求:

①设备要求:应使用高分辨率的相机或移动电子设备。

②环境要求:理想的数码照片拍摄应在照相室中进行,具有恒定的光源和背景。

③拍摄要求:拍摄时入组人员应保持直立坐位,必要时请监护人在旁辅助以保持固定姿势;暴露整个面部和耳朵,避免碎发遮挡;移除入组人员所佩戴的饰品、眼镜等;入组人员应平视前方,双唇闭合,面部呈中性表情。

④保存要求:所有图像均以全分辨率保存,避免有损压缩、篡改图像等操作;图像质量较差的颜面照片在采集时也应纳入在内,在后续预处理及质量控制时再进行筛选。

2

临床信息

疾病组需采集条目包括人群的基本信息(性别、年龄、地区)、疾病诊断、临床病史(生长发育史、合并症、母亲孕产史、父母身高及青春发育时间)、体格检查(生命体征、身高、体重、特殊外貌体征、性发育分期、心肺腹情况)、检验数据、遗传数据、影像学检查、治疗及预后情况等[16-17]。对照组应采集性别、年龄、所属地区等信息,在可得的情况下尽可能采集其他类别的数据。

1.2.2 间接来源数据

1

颜面图像及影像


对于疾病组与对照组,两组均在网络、文献、书籍等公开资料中对颜面图像进行筛选和采集。对同一个体的多张颜面图像或部分不清晰图像应全部纳入,在后续处理及质量控制时进一步筛选。

2

临床信息


疾病组采集条目参照直接来源数据(间接来源的部分数据可能存在缺失,应尽可能采集可得的相关信息)。对照组在可及范围内尽可能采集性别、年龄、所属地区等信息。

1.3

数据库的运行与管理

1.3.1 常态化运行

数据库应确保对数据收集、处理、保存和应用的长期支持。临床医生主导数据筛选、入组和收集。数据工程师定期对数据库的信息系统安全性进行检测和维护。研究人员可根据临床、教学或研究需求,检索或调用匿名后的数据,但仅本研究组成员对入组人员信息有访问权限,未经许可严禁他人查阅。数据存储、传输与使用过程均需由授权的指定人员进行操作并记录,形成系统化文件。

1.3.2 协作化管理

建立“医-工-研”协作化管理流程,以加强数据库运行过程中临床医师、数据工程师及研究人员的紧密协作,减少跨团队沟通的成本:临床医生主导数据元定义、明确临床需求,工程师负责数据库底层框架建立及逻辑校验,研究人员负责分析数据和临床需求转化。在数据库运行过程中,建立跨团队定期线上沟通平台,及时反馈各方临床实践中所遇到的问题与实际需求,以便动态调整,从而确保可高效采集高质量数据。

1.3.3 动态更新

根据真实世界研究结果及临床实际需求,数据库将动态更新以确保数据时效性和准确性。构建实时监控机制,紧密跟踪数据源变化,系统监测到数据变化后即刻触发更新流程。采用增量更新策略,精准识别并仅更新变化部分,而非对整个数据库进行频繁的全量更新。运用事务管理机制,将一系列相关更新操作组成执行单元,防止数据处于不一致状态。

2

质量控制要点

2.1

质控节点设立

为确保数据集的高质量与可靠性,数据库建设过程中将设立多个质控节点,在各节点实施严格的质量评价与控制措施,从而为后续数据库的科学管理与规范使用提供客观依据。

2.1.1 人员资质

参与数据库建库的临床医生、数据工程师、研究人员等多方人员均需通过先期培训并通过考核,方可承担相应工作,参与人员需具备相关专业工作背景。经培训后,所有人员应掌握数据库相关法律法规与伦理规范。对于临床医生,应重点掌握数据筛选标准,具备数据采集和标注等技能。对于数据工程师,应重点掌握数据的规范化运行,具备数据库信息技术和安全性维护等技能。对于研究人员,应重点掌握数据传输和匿名调取,具备数据处理和分析等技能。

2.1.2 数据来源

数据来源需在疾病筛选和入组人员筛选两方面严格把关。疾病筛选方面,应重点纳入具有代表性的儿童生长发育障碍相关疾病。入组人员来源方面,直接来源数据(内部数据)由临床专业人员直接采集,确保数据真实、完整、准确;间接来源数据(外部数据)仅纳入来源可靠、经临床或分子诊断确诊的公开真实病例数据。

2.1.3 数据查重与清洗

所有入库的颜面图像均应标注基本信息,包括图像质量、图像来源、临床资料(地区、性别、年龄、分组)。确保所有入组人员的颜面图像均可与其临床数据相对应,以及所有纳入的病例或对照人群真实唯一且无内部重合。若发现重复,则在记录和封存后将重复数据从数据集中移除。检查和确认所有纳入数据库的数据均为合格数据。应检查图像格式的有效性和内容的合理性,去除不合格数据,包括破损或无法进行人脸自动抓取的图像、有面部遮挡或光照不均的图像等。此外,在数据清洗过程中应秉承非必要不对图像进行压缩或额外处理的原则。所有操作均应建立工作规范,形成记录以确保操作可溯源。

2.1.4 数据处理与标注

对于图像数据

3

审核机制:

①内部审核:对颜面图片、图像标注结果的正确性、数据形式的合理性进行抽查,剔除图像质量差、标注结果不合格的图片;对数据采集人员和标注人员定期展开培训和审核,以优化数据采集与标注流程。

②外部专家审核(可选):邀请全国范围内具有丰富儿童颜面疾病诊疗及利用人工智能提取特征经验的医学专家对数据集进行审核,分析数据采集与标注过程中存在的潜在偏倚,并将其纳入风险控制体系。

对于临床数据

1

标注内容:核心诊断信息,同时还需标注数据来源、标注人员信息、标注时间等,确保数据可追溯。

2

标注方式:建立标注知识库,对可能存在争议的标注项采用概率标注;同时对脱敏数据(如患者ID、姓名)进行加密标注,仅保留匿名化标识符。

3

审核机制:①自动规则检查:通过预设规则(如字段完整性、数值范围、术语一致性)过滤低级错误。②人工抽样审核:按比例随机抽样复核,重点检查复杂病例与高风险数据。③专家终审:关键数据(如用于模型训练的核心数据集)需经领域内专家确认。

2.2

数据库构建规范

颜面信息具有较高的个人信息敏感性,是数字信息时代隐私保护的重点。结合未成年人群体的特殊性,加强儿童颜面信息保护是保障受试儿童权益不可或缺的一环。儿童医疗颜面图像数据库的建立应符合法律要求并全程受到伦理监管。纳入的数据需为通过伦理批准或经过豁免的临床脱敏数据,同时注重入组人员的权益和隐私保护[18]。建议数据库嵌入“法律-伦理-技术”的协作流程,整合法律法规自查、伦理审查工具和加密技术支持方案,在颜面及临床数据采集、存储、共享、传输、销毁等节点实现全流程保护支持。

2.2.1 法律法规

数据库构建过程中涉及儿童生长发育罕见病和人脸识别技术,其均为近年备受重视的新兴领域,数据的采集、传输、保存和使用须符合《中华人民共和国网络安全法》《中华人民共和国个人信息保护法》《医疗器械网络安全注册技术审查指导原则》等法律法规的要求,并遵守国际标准化组织制定的人工智能研究标准化规范。建议建立数据匿名化脱敏、传输协议,以符合相关法律法规要求。对于同步收集的人类遗传资源材料或信息,还应按照《科技部人类遗传资源管理办法》完成申报并获得许可证明,同时持续关注最新的要求及进展,确保研究符合监管规定,持续保障入组人员的权益和隐私保护。

2.2.2 伦理规范

研究者在收集数据前需向课题立项单位的伦理审查委员会递交伦理申请并获得官方批件,确保在正式收集颜面图像数据前有详细的研究方案、符合法规要求的知情同意书、完备的入组人员权益及隐私保护措施等。若颜面图像来源于网络爬取或现有公开数据库等其他途径,还应先征得相应管理者同意以获取数据豁免,确保该外部数据库在构建时已取得知情同意或通过有同等效力的伦理审批程序。为保护受试儿童在参加数据收集过程中及数据收集入库后的权益与隐私安全,研究者应注意在尊重受试儿童意愿的基础上,获取其法定监护人签署的知情同意书后方可正式开展,并告知其可以不参加或在研究过程中随时退出。

此外,研究者需承诺:(1)所有颜面图像及临床资料在采集后将首先进行数据脱敏处理;(2)保证试验过程及数据分析的严谨客观,且所有资料仅研究组内成员有访问权限;(3)不公开发表原始数据。

2.2.3 加密技术

由于颜面图像具有高度身份识别功能,相较于其他数据信息敏感性更高,因此在数据入库时应首先进行去身份化处理,去除图像及临床数据中与受试儿童隐私相关的信息,包括个人资料、医保类别、家庭状况等。具备一定技术条件的研究者还可在数据传输和保存过程中使用“面容遮罩”功能对人脸进行遮挡[19],且仅对研究组内成员开放查看权限。同时,可开发区块链和隐私保护技术,以支持数据库的加密存储与传输共享。需定期监测知情同意书签署比例、数据匿名化达标比例等指标,并根据监测结果及时调整或加强数据保护措施。规范化数据库建设对科研与临床具有长期使用价值,通过合规提升数据共享可信度,可促进多中心研究合作。

2.3

全流程质控框架

为保证质控可量化、可监控和可追溯,建议建立可贯穿全流程的质控框架(图1),确立“质控锚点”,在各个质控节点建立评价指标,并严格执行法律法规、伦理规范和数据加密。同时建立全流程数据预警和风险监控机制,把控数据的可靠性、完整性、一致性和稳定性:

1

建立矛盾数据实时预警机制,对于不符合质控规范的数据进行预警,及时处理;

2

建立风险监控机制,对隐私泄露等法律及伦理风险实时评分,以及时有效地监控评估操作流程的规范性。

图1 质量控制流程图

3

结 语

本文阐述了融合颜面表型及临床资料的儿童生长发育相关疾病数据库的建立和质控要点,强调了遵守法律法规与伦理规范的重要性,为相关数据库的构建提供了可推广的建库模型与质控范式,尤其文中提到的“医-工-研”协作流程,可为其他医学专科数据库提供借鉴。此种集多维度资料为一体的专科数据库,通过整合多模态数据、实施严格质控,确保数据全面、准确与可靠,为及时识别儿童生长发育异常、辅助遗传性疾病诊疗提供了有力支持。数据库的数据可用于临床、教学、科研等多个方向,不仅有助于加深对儿童生长发育规律的理解,同时为促进儿童健康成长、优化医疗资源配置奠定了基础。需注意的是,数据库建立后还应制订持续的完善和优化体系,从而以更加全面、精准和高效的方式服务于儿童生长发育及健康事业。

参考文献

[1]Wójcik D, Beń-Skowronek I. Craniofacial morphology in children with growth hormone deficiency and turner syndrome[J]. Diagnostics (Basel), 2020, 10(2): 88.

[2]Oliveira-Neto L A, Melo M D F B, Franco A A, et al. Cephalometric features in isolated growth hormone deficiency[J]. Angle Orthod, 2011, 81(4): 578-583.

[3]Miralles J C, Soriano J, Negro J M. Facial edema associated with thyroid autoimmunity[J]. Allergol Immunopathol (Madr), 2002, 30(1): 47-50.

[4]Contreras-Jurado C, Lorz C, García-Serrano L, et al. Thyroid hormone signaling controls hair follicle stem cell function[J]. Mol Biol Cell, 2015, 26(7): 1263-1272.

[5]Chandna S, Bathla M. Oral manifestations of thyroid disorders and its management[J]. Indian J Endocrinol Metab, 2011, 15(S2): S113-S116.

[6]Tatsi C, Kamilaris C, Keil M, et al. Paediatric cushing syndrome: a prospective, multisite, observational cohort study[J]. Lancet Child Adolesc Health, 2024, 8(1): 51-62.

[7]刘兆祥, 伍学焱, 邢小平, 等. 儿童库欣综合征临诊应对[J]. 中华内分泌代谢杂志, 2017, 33(9): 781-783.

[8]Starbuck J M, Cole T M 3rd, Reeves R H, et al. The influence of trisomy 21 on facial form and variability[J]. Am J Med Genet A, 2017, 173(11): 2861-2872.

[9]Pan Z X, Shen Z, Zhu H J, et al. Clinical application of an automatic facial recognition system based on deep learning for diagnosis of Turner syndrome[J]. Endocrine, 2021, 72(3): 865-873.

[10]Writing Group for Practice Guidelines for Diagnosis and Treatment of Genetic Diseases Medical Genetics Branch of Chinese Medical Association, Li C, Xie B B, et al. Clinical practice guidelines for Prader-Willi syndrome[J]. Chin J Med Genet, 2020, 37(3): 318-323.

[11]Allanson J E, Bohring A, Drr H G, et al. The face of Noonan syndrome: does phenotype predict genotype[J]. Am J Med Genet A, 2010, 152A(8): 1960-1966.

[12]Al-Saleem A, Al-Jobair A. Achondroplasia: craniofacial manifestations and considerations in dental management[J]. Saudi Dent J, 2010, 22(4): 195-199.

[13]Basel-Vanagaite L, Wolf L, Orin M, et al. Recognition of the Cornelia de Lange syndrome phenotype with facial dysmorphology novel analysis[J]. Clin Genet, 2016, 89(5): 557-563.

[14]Wu D N, Qiang J Q, Hong W X, et al. Artificial intelligence facial recognition system for diagnosis of endocrine and metabolic syndromes based on a facial image database[J]. Diabetes Metab Syndr, 2024, 18(4): 103003.

[15]关舒文, 刘殿全, 张庆丰. 儿童颜面管理与人工智能[J]. 临床耳鼻咽喉头颈外科杂志, 2023, 37(8): 658-661.

[16]Kosowan L, Page J, Protudjer J, et al. Characteristics associated with pediatric growth measurement collection in electronic medical records: a retrospective observational study[J]. BMC Fam Pract, 2020, 21(1): 191.

[17]Liang H Y, Tsui B Y, Ni H, et al. Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence[J]. Nat Med, 2019, 25(3): 433-438.

[18]Nurmi S M, Kangasniemi M, Halkoaho A, et al. Privacy of clinical research subjects: an integrative literature review[J]. J Empir Res Hum Res Ethics, 2019, 14(1): 33-48.

[19]Anonymizing facial images to improve patient privacy[J]. Nat Med, 2022, 28(9): 1767-1768.

作者贡献

强佳祺、王映晶负责研究构思、论文初稿撰写;吴丹宁负责文献检索和筛选;刘润竹、黄久佐负责论文校对;潘慧、龙笑、陈适负责研究的整体把控及论文修订。

作者简介

北京协和医院

内分泌科临床博士后,医学博士,毕业于北京协和医学院临床医学八年制。研究方向为内分泌与代谢性疾病。

通信作者

北京协和医院

陈适

内分泌科主任医师,教授,博士生导师。中华医学会行为医学分会学术委员会委员兼秘书长,中华医学会内分泌学分会电解质紊乱学组副组长,承担国家重点研发计划、北京自然科学基金等多项课题。

北京协和医院

龙笑

整形美容外科主任,主任医师,教授,博士生导师。中华医学会整形外科学分会常务委员、秘书长。

会议通知

2010年创刊,国家卫生健康委主管、中国医学科学院北京协和医院主办的综合性医学期刊,已被评为“中国科技核心期刊”“中国科学引文数据库(CSCD)来源期刊”和“中文核心期刊要目总览(北大中文核心)期刊”,被 Scopus 和 DOAJ 数据库收录,入选“中国科技期刊卓越行动计划”项目。

《协和医学杂志》倡导尊重和保护知识产权,欢迎转载、引用,但需取得本平台授权。如您对文章内容及版权存疑,请发送邮件至medj@pumch.cn,我们会与您及时沟通处理。图文内容仅供交流、学习使用,不以盈利为目的;科普内容仅用于大众健康知识普及,读者切勿作为个体诊疗根据,自行处置,以免延误治疗。治病就医相关需求请于北京协和医院APP线上或线下就诊。

来源:协和医学杂志

相关推荐