DeepMind یک سیستم هوش مصنوعی (AMIE) را برای بهینه‌سازی گفتگوهای تشخیصی، معرفی کردند.

تعامل پزشک و بیمار در هسته پزشکی قرار دارد، جایی که شرح حال ماهرانه مسیر تشخیص صحیح، مراقبت موفق و اعتماد طولانی مدت را تعیین می کند. سیستم‌های هوش مصنوعی که قادر به گفتمان تشخیصی هستند می‌توانند دسترسی، ثبات و کیفیت مراقبت را بهبود بخشند. با این حال، شبیه سازی مهارت های پزشک موضوع مهمی است.

این تیم یک محیط گفتگوی شبیه‌سازی شده مبتنی بر بازی خود را با بازخورد خودکار ایجاد کرد تا قابلیت‌های یادگیری AMIE را در شرایط، تنظیمات و تخصص‌های پزشکی متعدد گسترش دهد. آنها همچنین تکنیک های زنجیره استدلال مبتنی بر زمان استنتاج را برای بهبود کیفیت مکالمه و دقت تشخیصی AMIE اجرا کردند. در طول استنتاج آنلاین، تکنیک‌ها به تدریج پاسخ‌های AMIE را بر اساس بحث حاضر اصلاح کردند، که منجر به پاسخ‌های دقیق و پایه‌ای به بیماران در هر نوبت گفتگو شد.

تیم از یک استراتژی تکراری خود-بهبودی متشکل از دو چرخه خودبازی استفاده کرد. حلقه داخلی رفتار خود را بر روی عوامل بیمار هوش مصنوعی بر اساس ورودی منتقد درون متنی تغییر داد، در حالی که حلقه بیرونی شامل مکالمات پالایش شده در چرخه های تنظیم دقیق بعدی بود. برای نشان دادن این بهبود، آنها از رویکرد ارزیابی خودکار در گفتگوهای شبیه سازی شده قبل و بعد از رویه خودبازی استفاده کردند.

این تیم چارچوب AMIE را برای ارزیابی پارامترهای عملکرد بالینی مهم مانند ثبت تاریخچه، دقت تشخیصی، استدلال مدیریت، ارتباطات و درک مطلب توسعه دادند. محققان یک معیار ارزیابی اولیه برای اندازه‌گیری تاریخچه، مهارت‌های ارتباطی، استدلال تشخیصی و درک هوش مصنوعی محاوره‌ای تشخیصی پزشکی، از جمله معیارهای بالینی و بیمار محور ایجاد کردند.

پزشکان متخصص داده ها را بررسی کردند. محققان چندین تجزیه و تحلیل را برای بهبود درک قابلیت‌های AMIE انجام دادند، محدودیت‌های اولیه را شناسایی کردند و مراحل بعدی ضروری را برای ترجمه بالینی AMIE در دنیای واقعی ارائه کردند.

این مطالعه نشان داد که AMIE در 28 محور از 32 محور ارزیابی از دیدگاه پزشک متخصص و 24 از 26 محور ارزیابی از دیدگاه بازیگر بیمار، از PCP ها بهتر عمل کرد. تحت معاینه پزشک متخصص، AMIE دقت تشخیص افتراقی بالاتری را نسبت به PCP ها نشان داد، با بالاترین دستاوردها در تخصص های قلبی عروقی و تنفسی. با توجه به ارزیابی خودکار، AMIE به اندازه PCP ها در جمع آوری داده کارآمد بود. این تیم از روش مشابهی برای تکرار آنالیز دقیق تشخیص افتراقی با ارزیاب‌های خودکار مدل به جای ارزیاب‌های متخصص استفاده کرد و متوجه شد که روند عملکرد ارزیاب خودکار با ارزیابی‌های متخصص علی‌رغم تفاوت‌های جزئی در مقادیر محاسبه‌شده برای دقت، همسو است.

پژوهشگران موفق شدند نوعی هوش مصنوعی طراحی کنند که قادر است با اندازه‌گیری فعالیت مغزی با دقت شگفت‌آوری از گفتار رمزگشایی کند. این فناوری می‌تواند به بیمارانی که هوشیاری بسیار کمی دارند در برقراری ارتباط کمک کند.

هوش مصنوعی می‌تواند کلمات و جملات را از روی فعالیت مغز با دقت شگفت‌آور اما محدود رمزگشایی کند. دانشمندان در تحقیقات اولیه دریافتند که فقط با استفاده از چند ثانیه داده فعالیت مغزی، هوش مصنوعی حدس می‌زند که یک شخص چه شنیده است و تا ۷۳ درصد اوقات، پاسخ صحیح را در میان ۱۰ احتمال برتر لیست می‌کند.

این هوش مصنوعی که در شرکت والد فیس‌بوک – متا، طراحی شده است، ‌می‌تواند به هزاران نفر در سراسر دنیا که قادر نیستند از طریق سخن‌گفتن، تایپ‌کردن یا حرکات بدن ارتباط برقرار کنند، کمک کند؛ از جمله به بیمارانی که هوشیاری بسیار کمی دارند یا زندگی نباتی دارند، یعنی به افرادی که دچار مشکلی هستند که عموماً به‌عنوان سندرم بیداری بدون پاسخ شناخته می‌شود.

بیشتر فناوری‌های موجود که قصد دارند به چنین بیمارانی برای برقراری ارتباط کمک کنند، نیازمند عمل‌های پرخطر جراحی مغز برای کاشت الکترودها هستند. این شیوه جدید، به احتمال زیاد راهی بادوام و غیرتهاجمی برای کمک به بیمارانی فراهم خواهد کرد که در برقراری ارتباط مشکل دارند.

رمزگشایی از گفتار با هوش مصنوعی

پژوهشگران فرانسوی به یک ابزار محاسباتی آموزش دادند که کلمات و جملات ۵۶ هزار ساعت گفتار ضبط ‌شده به ۵۳ زبان را تشخیص دهد. این ابزار که به‌عنوان مدل زبان نیز شناخته می‌شود، یاد گرفت که چگونه ویژگی‌های خاص زبان را هم در سطح دقیق، حروف یا هجاها و هم در سطح وسیع‌تر، مانند یک کلمه یا جمله، تشخیص دهد.

این تیم پژوهشی، هوش مصنوعی را با این مدل زبانی در پایگاه‌های داده چهار مؤسسه به‌کار برد که شامل فعالیت‌های مغزی ۱۶۹ داوطلب بود.

در این پایگاه‌های اطلاعاتی، شرکت‌کنندگان به داستان‌ها و جملاتی از برخی کتاب‌ها مثلاً کتاب پیرمرد و دریا نوشته ارنست همینگوِی و آلیس در سرزمین عجایب نوشته لوئیس کارول گوش می‌دادند و در همان زمان مغز آنها با استفاده از مغناطیس‌نگاری مغزی یا نوار مغزی اسکن می‌شد. این تکنیک‌ها جزء مغناطیسی یا الکتریکی سیگنال‌های مغز را اندازه می‌گیرد.

سپس، تیم پژوهشی تلاش کرد با کمک یک روش محاسباتی که به توضیح تفاوت‌های فیزیکی مغزهای شرکت‌کنندگان کمک می‌کرد، مواردی را که شرکت‌کنندگان شنیده‌اند، فقط با استفاده از سه ثانیه داده‌ فعالیت مغزی هرکدام از آن‌ها رمزگشایی کند.

 

این تیم به هوش مصنوعی آموزش داد که صداهایی را که هنگام خواندن داستان‌ها ضبط شده بود با الگوهای فعالیت مغزی که هوش مصنوعی آن را با آنچه مردم می‌شنوند مربوط می‌کرد، تراز کند سپس با توجه به بیش از هزار احتمال، پیش‌بینی‌هایی درباره آنچه ممکن است فرد در این مدت کوتاه بشنود، انجام داد.

پژوهشگران به این نتیجه رسیدند که با استفاده از مغناطیس‌نگاری مغزی در ۷۳ درصد مواقع، پاسخ درست در میان ۱۰ حدس برتر هوش مصنوعی قرار داشت. با نوار مغزی این مقدار به حدود ۳۰ درصد کاهش یافت. هرچند عملکرد مغناطیس‌نگاری مغزی بسیار خوب بود؛ اما پژوهشگران به استفاده عملی از آن خوش‌بین نبودند؛ زیرا نیازمند دستگاهی بزرگ و گران‌قیمت است. آوردن این فناوری به درمانگاه‌ها نیازمند نوآوری‌های علمی برای ارزان‌تر کردن آنها و آسان‌تر کردن استفاده از آنها است.