^
Fact-checked
х

所有iLive內容都經過醫學審查或事實檢查,以確保盡可能多的事實準確性。

我們有嚴格的採購指南,只鏈接到信譽良好的媒體網站,學術研究機構,並儘可能與醫學同行評審的研究相關聯。 請注意括號中的數字([1],[2]等)是這些研究的可點擊鏈接。

如果您認為我們的任何內容不准確,已過時或有疑問,請選擇它並按Ctrl + Enter。

声音分析:癌症和良性病变的早期信号

阿列克谢·克里文科,医学审稿人
最近審查:18.08.2025
2025-08-12 08:13
">

俄勒冈健康与科学大学的研究人员分析了来自最新公开的Bridge2AI-Voice数据集的语音记录,发现了一个简单的声学特征,可以揭示声带病变。我们所说的特征就是谐波噪声比(HNR),即“音乐泛音”与噪声的比率。它的水平和变异性可以区分喉癌和良性病变患者的声音与健康人以及其他一些嗓音障碍患者的声音。这种差异在顺性别男性中尤为明显;但对于女性来说,统计学意义尚不充分——作者将此归咎于样本量较小,并呼吁扩大数据范围。这项研究以简报的形式发表在《数字健康前沿》(Frontiers in Digital Health)杂志上。

研究背景

  • 为什么要寻找“声音标记”呢?声音嘶哑是常见的症状。其病因多种多样:从感冒、反流到结节/息肉,甚至喉癌。目前,诊断的途径是去看耳鼻喉科专家并进行内窥镜检查(在鼻子/喉咙里放置摄像头)。这种方法虽然准确,但并非总是快速可用,也不适合在家自我监测。需要进行预筛查:这是一种了解哪些人应该优先就医的简单方法。
  • 什么是声音生物标记?语音是一种很容易用手机记录的信号。它的“模式”可以用来判断声带的振动方式。病变会使振动不均匀:“噪音”增多,“音乐”减少。
  • 新数据集的重要性。此前,此类研究依赖于小型“自制”样本——模型十分脆弱。Bridge2AI-Voice 是一个大型、多中心、符合伦理道德的音频记录数据集,收集与诊断相关的音频记录。它旨在成为一个“通用测试平台”,最终用于在海量异构数据上训练和测试算法。
  • 主要的困难在哪里
    • 声音会因麦克风、房间噪音、寒冷、吸烟、语言、性别和年龄而发生变化。
    • 传统上,女性数据较少,而女性声音的频率更高 - 指标表现不同。
    • 没有任何“家庭”测试可以取代检查或做出诊断 - 最多只能帮助决定:“是否有必要紧急去看耳鼻喉科专家?”
  • 为什么诊所和患者需要这个?如果淋巴结/肿瘤高风险患者可以通过短期预约获得优先就诊,这将加快诊断速度,减少不必要的转诊,并提供在两次就诊之间(手术后、治疗期间)自我监测的工具。
  • 这将导致:验证远程医疗应用程序/模块:
    1. 按照标准写一篇演讲稿(短语+冗长的“aaa”),
    2. 计算基本特征(HNR、抖动、闪光、F0),
    3. 如果情况令人担忧,则建议联系专家,
    4. 治疗后维持动态。

这个想法很简单:“把电话放到耳鼻喉科医生的耳朵里”——不是为了诊断,而是为了不错过那些需要快速面对面帮助的人。

他们到底做了什么?

  • 我们首次发布了多中心、合乎道德地收集的 Bridge2AI-Voice 数据集,这是 NIH 的旗舰项目,其中语音记录与临床信息(诊断、问卷等)相关联。
  • 形成了两个分析样品:
    1. “喉癌/良性淋巴结/健康”;
    2. “癌症或良性结节”与痉挛性发音障碍和声带麻痹(其他常见的声音嘶哑原因)。
  • 从标准化短语中识别出基本语音特征:基音 (F0)、抖动、微光和高噪声比 (HNR),并使用非参数统计方法对各组进行比较。结果:最稳定的差异在于 HNR 和 F0,其中 HNR 及其变异性最能区分良性病变与正常病变和喉癌。这些信号在男性中更为明显。

为什么这很重要?

  • 无需探针即可进行早期筛查。目前,确诊途径通常包括鼻内镜检查,如果怀疑存在鼻内镜问题,则需进行活检。如果简单的声学特征与人工智能相结合,能够优先考虑需要内镜检查的患者,患者就能更快地获得耳鼻喉专科医生的诊治,从而减少不必要的转诊。这应该是一种补充,而不是替代医生。
  • 语音大数据。Bridge2AI-Voice 是一个罕见的项目,它使用统一的协议收集语音并将其与诊断关联起来;研究人员可以通过 PhysioNet / Health Data Nexus 获取数据。这加速了可靠语音生物标记物的开发,而不是依靠小样本开发“神奇应用程序”。

什么是 HNR?

当我们说话时,声带会振动并产生泛音(谐波)。但振动并非完美无缺——信号中总是存在噪音。HNR 指的是声音中“音乐”成分比“嘶嘶声”成分多多少。当声带受损时,振动会变得不均匀——噪音增多,HNR 下降,其跳跃(波动性)增加。这就是作者捕捉到的规律。

重要免责声明

  • 这是一项试点探索性分析:未经临床验证,且女性样本受限,因此其效果不显著。我们需要更大规模、更多样化的数据,并在不同的诊所和不同的语言环境下对模型进行“测试”。
  • 声音是一个“多值”的东西:它会受到感冒、吸烟、反流、麦克风以及房间噪音的影响。任何“家庭测试”都应该能够考虑到具体情况,并且仍然能够作为转诊至耳鼻喉科专家的筛选条件,而不是简单的点击式诊断。

下一步是什么?

  • 扩展数据集(包括女性和年龄),标准化任务和声学(阅读短语、延长“aaa”等),尝试多模态模型(语音+问卷症状/风险因素)。
  • 将声学信号与检查结果(内窥镜检查、频闪检查)和治疗后的动态联系起来 - 以便 HNR 轮廓也可用于监测。
  • 继续“开放科学”:Bridge2AI-Voice 已经发布了数据集和工具的版本——这是一个快速接触诊所真实试点的机会。

结论

通过声音“听出”声带问题并非不可能,或许还能更快地将患者转诊给合适的专家。目前,这或许只是个线索(HNR及其变异性),但得益于大数据的开放,声音生物标记终于有机会成为一种可靠的筛查工具。

来源: Jenkins P. 等人。《声音作为生物标志物:良性和恶性声带病变的探索性分析》。 《数字健康前沿》,2025 年(已接受出版)。数据——Bridge2AI-Voice(NIH/PhysioNet)。


iLive門戶網站不提供醫療建議,診斷或治療。
門戶網站上發布的信息僅供參考,未經專家諮詢,不得使用。
仔細閱讀該網站的規則和政策。 您也可以與我們聯繫

版權所有© 2011 - 2025 iLive。 版權所有。