^
A
A
A

Hlas jako analýza: Včasné signály rakoviny a benigních lézí

 
Alexey Kryvenko, Lékařský recenzent
Naposledy posuzováno: 18.08.2025
 
Fact-checked
х

Veškerý obsah iLive je lékařsky zkontrolován nebo zkontrolován, aby byla zajištěna co největší věcná přesnost.

Máme přísné pokyny pro získávání zdrojů a pouze odkaz na seriózní mediální stránky, akademické výzkumné instituce a, kdykoli je to možné, i klinicky ověřené studie. Všimněte si, že čísla v závorkách ([1], [2] atd.) Jsou odkazy na tyto studie, na které lze kliknout.

Pokud máte pocit, že některý z našich obsahů je nepřesný, neaktuální nebo jinak sporný, vyberte jej a stiskněte klávesu Ctrl + Enter.

12 August 2025, 08:13

Výzkumníci z Oregonské univerzity zdraví a vědy analyzovali nahrávky řeči z nového veřejně dostupného datasetu Bridge2AI-Voice a objevili jednoduchý akustický znak, který dokáže odhalit patologii hlasivek. Mluvíme o poměru harmonických k šumu (HNR) – poměru „hudebních alikvotních tónů“ k šumu. Jeho úroveň a variabilita odlišovaly hlasy lidí s rakovinou hrtanu a benigními lézemi od zdravých a některých dalších hlasových poruch. Efekt byl obzvláště patrný u cisgenderových mužů; statistická významnost nebyla dostatečná u žen – autoři viní malý vzorek a volají po rozšíření dat. Práce byla publikována jako stručná zpráva v časopise Frontiers in Digital Health.

Pozadí studie

  • Proč vůbec hledat „hlasové markery“? Chrapot je běžnou stížností. Příčiny jsou různé: od nachlazení a refluxu až po uzlíky/polypy a rakovinu hrtanu. V současné době je cestou k diagnóze návštěva ORL specialisty a endoskopie (kamera v nose/krku). Je to přesné vyšetření, ale ne vždy rychle dostupné a není vhodné pro domácí samomonitoring. Je nutný předběžný screening: jednoduchý způsob, jak pochopit, kdo by měl nejprve navštívit lékaře.
  • Co je hlasový biomarker? Řeč je signál, který lze snadno nahrát na telefon. Její „vzorec“ lze použít k posouzení vibrací hlasivek. Léze způsobují, že vibrace jsou nerovnoměrné: více „šumu“ a méně „hudby“.
  • Proč jsou nové datové sady důležité. Dříve se takové práce spoléhaly na malé, „domácí“ vzorky – modely byly křehké. Bridge2AI-Voice je rozsáhlá, multicentrická, eticky shromážděná sada zvukových nahrávek propojených s diagnózami. Byla vytvořena jako „společné testovací prostředí“ pro konečné trénování a testování algoritmů na velkých a heterogenních datech.
  • Kde jsou hlavní obtíže?
    • Hlas se mění v důsledku mikrofonu, hluku v místnosti, chladu, kouření, jazyka, pohlaví a věku.
    • Tradičně je zde méně ženských dat a ženský hlas je častější – metriky se chovají odlišně.
    • Žádný „domácí“ test nemůže nahradit vyšetření ani stanovit diagnózu – maximálně pomůže rozhodnout se: „Je nutné naléhavě navštívit ORL specialistu?“
  • Proč to klinika a pacienti potřebují? Pokud lze osoby s vysokým rizikem uzlin/nádorů vybrat k prioritnímu vyšetření na základě krátké schůzky, urychlí se tím diagnostika, sníží se počet zbytečných doporučení a poskytne se nástroj pro sebemonitoring mezi návštěvami (po operaci, během terapie).
  • Kam by to mělo vést: K validovaným aplikacím/modulům telemedicíny, které:
    1. napište projev podle standardu (fráze + protáhlé „ááá“),
    2. vypočítat základní charakteristiky (HNR, jitter, shimmer, F0),
    3. vydat doporučení kontaktovat specialistu, pokud je profil alarmující,
    4. udržovat dynamiku i po léčbě.

Myšlenka je jednoduchá: „přiložte telefon k uchu ORL lékaře“ – ne kvůli diagnóze, ale aby se nepřehlédli ti, kteří potřebují rychlou osobní pomoc.

Co přesně udělali?

  • Využili jsme první verzi multicentrické, eticky shromážděné datové sady Bridge2AI-Voice, což je vlajkový projekt NIH, kde jsou hlasové nahrávky propojeny s klinickými informacemi (diagnózy, dotazníky atd.).
  • Byly vytvořeny dva analytické vzorky:
    1. "rakovina hrtanu / benigní uzliny / zdravé";
    2. „rakovina nebo benigní uzlíky“ versus spastická dysfonie a paralýza hlasivek (další běžné příčiny chrapotu).
  • Základní hlasové znaky byly identifikovány ze standardizovaných frází: základní tón (F0), chvění, chvění a HNR (Humor-Related Number - vysoká citlivost) a skupiny byly porovnány pomocí neparametrické statistiky. Výsledek: nejstabilnější rozdíly byly v HNR a F0, přičemž HNR a jeho variabilita nejlépe odlišovaly benigní léze od normy i rakoviny hrtanu. Tyto signály byly výraznější u mužů.

Proč je to důležité?

  • Včasný screening bez použití sondy. V současné době cesta k diagnóze často znamená nazoendoskopii a v případě podezření biopsii. Pokud jednoduché akustické rysy v kombinaci s umělou inteligencí mohou upřednostnit ty, kteří endoskopii potřebují, pacienti se dostanou k ORL specialistovi dříve a sníží se počet zbytečných doporučení. Toto je doplněk, nikoli náhrada lékaře.
  • Velká data pro hlas. Bridge2AI-Voice je vzácný projekt, kde je hlas shromažďován pomocí jednotných protokolů a propojen s diagnózami; data jsou výzkumníkům k dispozici prostřednictvím PhysioNet / Health Data Nexus. To urychluje vývoj spolehlivých hlasových biomarkerů namísto „zázračných aplikací“ na malých vzorcích.

Co je HNR?

Když mluvíme, hlasivky vibrují a vytvářejí alikvotní tóny (harmonické). Vibrace však nikdy nejsou dokonalé – v signálu je vždy šum. HNR je jednoduše o to, o kolik více je v hlase „hudby“ než „syčení“. Když jsou hlasivky poškozeny, vibrace se stávají méně rovnoměrnými – je zde více šumu, HNR klesá a jeho skoky (variabilita) se zvyšují. Toto je vzorec, který autoři zachytili.

Důležitá upozornění

  • Jedná se o pilotní, explorativní analýzu: bez klinické validace, s omezeními vzorku žen – jejich účinky tedy nebyly významné. Je zapotřebí větší a rozmanitější data a „pražení“ modelů v různých klinikách a v různých jazycích.
  • Hlas je „vícehodnotová“ věc: ovlivňuje ho nachlazení, kouření, reflux, mikrofon, hluk v místnosti. Jakýkoli „domácí test“ by měl být schopen zohlednit kontext – a přitom sloužit jako filtr pro doporučení k ORL specialistovi, a ne jako diagnóza stanovená po kliknutí.

Co bude dál?

  • Rozšiřte datovou sadu (včetně žen a věkových kategorií), standardizujte úkoly a akustiku (čtení fráze, prodloužené „ááá“ atd.), vyzkoušejte multimodální modely (hlas + dotazníkové symptomy/rizikové faktory).
  • Propojte akustické příznaky s výsledky vyšetření (endoskopie, stroboskopie) a dynamikou po léčbě – aby bylo možné profil HNR použít i pro monitorování.
  • Pokračování v „otevřené vědě“: Bridge2AI-Voice již publikuje verze datové sady a nástrojů – to je šance, jak rychle oslovit skutečné pilotní projekty v klinikách.

Závěr

Z hlasu je možné „slyšet“ problémy s hlasivkami – a možná tak danou osobu dříve odkázat ke správnému specialistovi. Prozatím je to docela dobrá indicie (HNR a její variabilita), ale díky velkému množství otevřených dat mají hlasové biomarkery konečně šanci stát se spolehlivým screeningovým nástrojem.

Zdroj: Jenkins P. a kol. Hlas jako biomarker: Průzkumná analýza benigních a maligních lézí hlasivek. Frontiers in Digital Health, 2025 (přijato k publikaci). Data — Bridge2AI-Voice (NIH/PhysioNet).

You are reporting a typo in the following text:
Simply click the "Send typo report" button to complete the report. You can also include a comment.