به گزارش سلامت نیوز به نقل از neurosciencenews، یک چارچوب هوش مصنوعی جدید قادر است با تحلیل الگوهای گفتاری، اختلالات عصبی را با دقت بیش از ۹۰٪ شناسایی کند. این مدل که CTCAIT نام دارد، تغییرات ظریف در صدا را که ممکن است نشانه‌های اولیه بیماری‌هایی مانند پارکینسون، هانتینگتون و بیماری ویلسون باشد، تشخیص می‌دهد.

نکات کلیدی:

  • دقت بالا: ۹۲.۰۶٪ دقت در داده‌های زبان چینی ماندارین و ۸۷.۷۳٪ در داده‌های زبان انگلیسی

  • نشانگر غیرتهاجمی: اختلالات گفتار می‌توانند تغییرات عصبی زودهنگام را نشان دهند

  • قابلیت گسترده: قابل استفاده برای غربالگری و پایش بیماری‌های عصبی مختلف

پروفسور لی های و تیم تحقیقاتی‌اش در مؤسسه فناوری سلامت و پزشکی، وابسته به آکادمی علوم چین، چارچوب یادگیری عمیق جدیدی توسعه داده‌اند که دقت و قابلیت تفسیر مدل‌های تشخیص اختلالات عصبی از طریق گفتار را به‌طور قابل توجهی افزایش می‌دهد.

پروفسور لی می‌گوید:«یک تغییر کوچک در نحوه صحبت کردن ما ممکن است فقط یک اشتباه زبانی نباشد، بلکه هشداری از مغز باشد. مدل ما می‌تواند علائم اولیه بیماری‌های عصبی مانند پارکینسون، هانتینگتون و ویلسون را از روی ضبط صداها تشخیص دهد.»

این مدل توانسته با دقت ۹۲.۰۶٪ روی داده‌های گفتار به زبان ماندارین و ۸۷.۷۳٪ روی داده‌های انگلیسی عملکرد بسیار خوبی داشته باشد که نشان‌دهنده قابلیت تطبیق بالای آن در زبان‌های مختلف است.

روش تحقیق

اختلالات گفتاری مانند دیس‌آرتریا (اختلال در تولید صدا و کلام) یکی از نشانه‌های اولیه بیماری‌های عصبی است. این اختلالات معمولاً ناشی از فرآیندهای تخریب عصبی هستند و بنابراین تحلیل صدا به عنوان یک نشانگر غیرتهاجمی و کم‌هزینه برای تشخیص و پایش زودهنگام این بیماری‌ها مورد توجه قرار گرفته است.

با این حال، روش‌های فعلی معمولاً به ویژگی‌های دستی وابسته‌اند و توانایی کمی در مدل‌سازی تعاملات زمانی دارند که باعث کاهش دقت و قابلیت تفسیر می‌شود.

برای حل این مشکلات، تیم تحقیقاتی چارچوبی به نام CTCAIT (Cross-Time and Cross-Axis Interactive Transformer) را معرفی کرده است. این مدل ابتدا ویژگی‌های پیچیده و چندبعدی زمانی را از گفتار استخراج می‌کند و سپس با استفاده از شبکه Inception Time و مکانیزم توجه چندسر متقاطع، الگوهای چندمقیاسی و تعاملات پیچیده در داده‌های صوتی را شناسایی می‌کند.

نتایج:

  • دقت تشخیص ۹۲.۰۶٪ در داده‌های چینی ماندارین

  • دقت ۸۷.۷۳٪ در داده‌های انگلیسی خارجی

  • عملکرد بالا و قابلیت تعمیم‌پذیری زبان‌های مختلف

  • مدل توانسته در تحلیل گفتار ساختارمند بهتر از گفتار آزاد عمل کند که برای کاربردهای بالینی اهمیت دارد

این مطالعه نشان می‌دهد که تحلیل گفتار می‌تواند به عنوان ابزاری کم‌هزینه، غیرتهاجمی و دقیق در تشخیص زودهنگام و پایش بیماری‌های عصبی به‌کار گرفته شود. علاوه بر این، قابلیت تفسیر داخلی مدل به درک بهتر نحوه تصمیم‌گیری آن کمک کرده و راهنمایی‌های مهمی برای استفاده بالینی فراهم می‌کند.

source

توسط argbod.ir

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *