فرصت ها و موانع یادگیری عمیق در زیست شناسی و پزشکی

ساخت وبلاگ

منتشر شده توسط انجمن سلطنتی تحت شرایط مجوز انتساب Creative Commons http://creativeecommons.org/licenses/by/4. 0/ ، که امکان استفاده نامحدود را فراهم می کند ، به شرط اعتبار نویسنده و منبع اصلی.

داده های مرتبط

این مقاله اطلاعات اضافی ندارد.

خلاصه

یادگیری عمیق یک کلاس از الگوریتم های یادگیری ماشین را توصیف می کند که قادر به ترکیب ورودی های خام در لایه هایی از ویژگی های میانی هستند. این الگوریتم ها اخیراً نتایج چشمگیر در دامنه های مختلف نشان داده اند. زیست شناسی و پزشکی رشته های غنی از داده ها هستند ، اما داده ها پیچیده و غالباً غیرقابل درک هستند. از این رو ، تکنیک های یادگیری عمیق ممکن است به ویژه برای حل مشکلات این زمینه ها مناسب باشد. ما برنامه های یادگیری عمیق را برای انواع مشکلات زیست پزشکی - طبقه بندی بیمار ، فرآیندهای اساسی بیولوژیکی و درمان بیماران بررسی می کنیم و بحث می کنیم که آیا یادگیری عمیق قادر به تغییر این کارها خواهد بود یا اینکه حوزه زیست پزشکی چالش های بی نظیری را ایجاد می کند. به دنبال یک بررسی گسترده ادبیات ، می فهمیم که یادگیری عمیق هنوز برای انقلابی در زیست پزشکی یا حل و فصل قطعی هر یک از مهمترین چالش های این حوزه را حل نکرده است ، اما پیشرفت های امیدوارکننده ای در مورد وضعیت قبلی هنر انجام شده است. حتی اگر پیشرفت در خطوط قبلی به طور کلی متوسط بوده است ، پیشرفت اخیر نشان می دهد که روشهای یادگیری عمیق وسیله ای ارزشمند برای سرعت بخشیدن یا کمک به تحقیقات انسان فراهم می کند. اگرچه پیشرفت در پیوند پیش بینی یک شبکه عصبی خاص به ویژگی های ورودی انجام شده است ، اما درک این که کاربران چگونه باید این مدل ها را تفسیر کنند تا فرضیه های قابل آزمایش در مورد سیستم مورد مطالعه را ایجاد کنند ، یک چالش باز است. علاوه بر این ، مقدار محدودی از داده های دارای برچسب برای آموزش ، مانند محدودیت های قانونی و حریم خصوصی در کار با سوابق بهداشتی حساس ، مشکلات را در برخی حوزه ها ایجاد می کند. با این وجود ، ما یادگیری عمیق را پیش بینی می کنیم و باعث می شود تغییرات در هر دو نیمکت و بستر با پتانسیل تغییر چندین زمینه از زیست شناسی و پزشکی ایجاد شود.

1. آشنایی با یادگیری عمیق

زیست شناسی و پزشکی به سرعت در حال تبدیل شدن به داده ها هستند. مقایسه اخیر ژنومیک با رسانه های اجتماعی ، فیلم های آنلاین و سایر رشته های فشرده داده نشان می دهد که ژنومیک به تنهایی در طی یک دهه آینده برابر خواهد شد یا از زمینه های دیگر در تولید و تجزیه و تحلیل داده ها فراتر خواهد رفت [1]. حجم و پیچیدگی این داده ها فرصت های جدیدی را ارائه می دهد ، اما همچنین چالش های جدیدی را ایجاد می کند. الگوریتم های خودکار که الگوهای معنادار را استخراج می کنند می توانند منجر به دانش عملی شوند و نحوه ایجاد درمان ، طبقه بندی بیماران یا بیماریهای مطالعه ، همه در محیط های بحرانی حریم خصوصی را تغییر دهیم.

اصطلاح یادگیری عمیق به مجموعه ای از تکنیک های جدید اشاره شده است که در کنار هم ، دستاوردهای دستیابی به موفقیت نسبت به الگوریتم های یادگیری بهترین ماشین در کلاس موجود در چندین زمینه را نشان داده اند. به عنوان مثال ، طی 5 سال گذشته ، این روش ها به دلیل انعطاف پذیری و دقت زیاد ، طبقه بندی تصویر و تشخیص گفتار را متحول کرده اند [2]. اخیراً ، الگوریتم های یادگیری عمیق نوید را در زمینه های متنوع به عنوان فیزیک پر انرژی نشان داده اند [3] ، شیمی محاسباتی [4] ، پوست [5] و ترجمه در بین زبانهای نوشتاری [6]. در میان زمینه ها ، اجرای "خارج از قفسه" این الگوریتم ها دقت قابل مقایسه یا بالاتری نسبت به روشهای قبلی در کلاس قبلی که به سالهای سفارشی سازی گسترده نیاز داشتند ، ایجاد کرده اند و اکنون در مقیاس های صنعتی مورد استفاده قرار می گیرد.

رویکردهای یادگیری عمیق از تحقیقات در مورد نورونهای مصنوعی ، که برای اولین بار در سال 1943 [7] به عنوان الگویی برای چگونگی نورون ها در یک اطلاعات فرآیند مغز بیولوژیکی ارائه شد ، رشد یافت. تاریخ شبکه های عصبی مصنوعی - که در طول این مقاله به عنوان "شبکه های عصبی" ارجاع شده است - به خودی خود جالب است [8]. در شبکه های عصبی ، ورودی ها به لایه ورودی تغذیه می شوند که به یک یا چند لایه پنهان تغذیه می شوند ، که در نهایت به یک لایه خروجی پیوند می یابد. یک لایه از مجموعه ای از گره ها تشکیل شده است ، که گاهی اوقات "ویژگی ها" یا "واحدها" نامیده می شوند ، که از طریق لبه ها به بلافاصله زودتر و لایه های بلافاصله عمیق تر وصل می شوند. در برخی از معماری های ویژه شبکه عصبی ، گره ها می توانند با تأخیر به خودشان متصل شوند. گره های لایه ورودی به طور کلی از متغیرهایی که در مجموعه داده های مورد علاقه اندازه گیری می شوند تشکیل شده است - برای مثال ، هر گره می تواند مقدار شدت یک پیکسل خاص را در یک تصویر یا سطح بیان یک ژن در یک آزمایش متن خاص نشان دهد. شبکه های عصبی که برای یادگیری عمیق مورد استفاده قرار می گیرند دارای لایه های مختلفی هستند. هر لایه اساساً ساخت و ساز را برای لایه ها قبل از آن انجام می دهد. فرایند آموزش مورد استفاده اغلب به لایه های عمیق تر در شبکه اجازه می دهد تا در پالایش لایه های قبلی کمک کنند. به همین دلیل ، این الگوریتم ها می توانند به طور خودکار ویژگی هایی را که برای بسیاری از کارها مناسب هستند ، مهندسی کنند و آن ویژگی ها را برای یک یا چند کار خاص سفارشی کنند.

یادگیری عمیق بسیاری از موارد مشابه رویکردهای یادگیری ماشین آشنا را انجام می دهد. به طور خاص ، رویکردهای یادگیری عمیق می تواند در هر دو برنامه تحت نظارت استفاده شود - جایی که هدف این است که یک یا چند برچسب یا پیامدهای مرتبط با هر نقطه داده را به طور دقیق پیش بینی کنید - در جای رویکردهای رگرسیون ، و همچنین در بدون نظارت یا "اکتشافی"برنامه ها - جایی که هدف خلاصه کردن ، توضیح یا شناسایی الگوهای جالب در یک مجموعه داده - به نوعی خوشه بندی است. در حقیقت روشهای یادگیری عمیق ممکن است هر دو مرحله را ترکیب کنند. هنگامی که داده های کافی در دسترس و برچسب گذاری شده است ، این روش ها ویژگی های تنظیم شده با یک مشکل خاص را ایجاد می کنند و آن ویژگی ها را در یک پیش بینی کننده ترکیب می کنند. در حقیقت ، اگر مجموعه داده با کلاسهای باینری "برچسب" باشد ، یک شبکه عصبی ساده و بدون لایه های پنهان و هیچ چرخه ای بین واحدها معادل رگرسیون لجستیک است اگر لایه خروجی یک عملکرد سیگموئید (لجستیک) لایه ورودی باشد. به طور مشابه ، برای نتایج مداوم ، رگرسیون خطی را می توان به عنوان یک شبکه عصبی تک لایه مشاهده کرد. بنابراین ، از بعضی جهات ، رویکردهای تحت نظارت یادگیری عمیق می تواند به عنوان گسترش مدلهای رگرسیون تلقی شود که امکان انعطاف پذیری بیشتر را فراهم می کند و به ویژه برای مدل سازی روابط غیرخطی بین ویژگی های ورودی مناسب است. به تازگی ، پیشرفت های سخت افزاری و مجموعه داده های آموزش بسیار بزرگ به این تکنیک های یادگیری عمیق اجازه داده اند تا از سایر الگوریتم های یادگیری ماشین برای بسیاری از مشکلات پیشی بگیرند. در یک مثال مشهور و اولیه ، دانشمندان گوگل نشان دادند که یک شبکه عصبی "کشف کرده است" که گربه ها ، چهره ها و عابران پیاده اجزای مهم فیلم های آنلاین هستند [9] بدون اینکه به آنها گفته شود که به دنبال آنها هستند. چه می شود اگر به طور کلی ، یادگیری عمیق از رشد داده ها در زیست پزشکی برای مقابله با چالش های موجود در این زمینه استفاده کند؟آیا این الگوریتم ها می توانند "گربه ها" را که در داده های ما پنهان شده اند - الگوهای ناشناخته برای محقق - شناسایی کنند و راه هایی برای عمل بر روی آنها را پیشنهاد کنند؟در این بررسی ، ما کاربردهای یادگیری عمیق در علم زیست پزشکی را بررسی می کنیم و در مورد چالش های منحصر به فرد که داده های زیست پزشکی برای روش های یادگیری عمیق مطرح می کنند ، بحث می کنیم.

چندین پیشرفت مهم باعث افزایش کار فعلی در این زمینه می شود. بسته های نرم افزاری با استفاده آسان ، تکنیک های این زمینه را از ابزار ابزار متخصص به جامعه گسترده ای از دانشمندان محاسباتی منتقل کرده است. علاوه بر این ، تکنیک های جدید برای آموزش سریع ، کاربرد آنها را به مجموعه داده های بزرگتر امکان پذیر کرده است [10]. ترک گره ها ، لبه ها و لایه ها باعث می شود شبکه ها قوی تر شوند ، حتی اگر تعداد پارامترها بسیار بزرگ باشد. سرانجام ، مجموعه داده های بزرگتر که اکنون در دسترس هستند نیز برای قرار دادن پارامترهای زیادی که برای شبکه های عصبی عمیق وجود دارد ، کافی است. همگرایی این عوامل در حال حاضر یادگیری عمیق را بسیار سازگار و قادر به پرداختن به تفاوت های ظریف هر دامنه ای که در آن استفاده می شود ، می کند.

این بررسی در مورد کار اخیر در حوزه زیست پزشکی بحث می کند ، و بیشتر برنامه های کاربردی معماری شبکه عصبی را انتخاب می کنند که به خوبی با مشکل مورد نظر مناسب هستند. ما چند معماری مثال ساده را در شکل 1 ترسیم می کنیم. اگر داده ها از ساختار مجاور طبیعی برخوردار باشند ، یک شبکه عصبی حلقوی (CNN) می تواند با تأکید بر روابط محلی ، به ویژه هنگامی که از لایه های حلقوی در لایه های اولیه شبکه عصبی استفاده می شود ، از آن ساختار استفاده کنند. سایر معماری های شبکه عصبی مانند AutoEncoders نیازی به برچسب ندارند و اکنون به طور مرتب برای کارهای بدون نظارت استفاده می شوند. در این بررسی ، ما به طور جامع در مورد انواع مختلف معماری های شبکه عصبی عمیق بحث نمی کنیم. مروری بر اصطلاحات اصلی مورد استفاده در اینجا در جدول 1 آورده شده است. جدول 1 همچنین برنامه های نمونه انتخابی را ارائه می دهد ، اگرچه در عمل هر معماری شبکه عصبی به طور گسترده ای در انواع مختلفی از داده های زیست پزشکی اعمال شده است. کتاب اخیر از Goodfellow و همکاران.[11] معماری های شبکه عصبی را با جزئیات و لکون و همکاران پوشش می دهد.[2] مقدمه ای کلی تر ارائه می دهد.

An exteal file that holds a picture, illustration, etc. Object name is rsif20170387-g1.jpg

شبکه های عصبی به اشکال مختلف ارائه می شوند. سمت چپ: یک کلید برای انواع مختلف گره های مورد استفاده در شبکه های عصبی. FFNN ساده: یک شبکه عصبی به جلو که در آن ورودی ها از طریق برخی از عملکردها به یک گره خروجی وصل می شوند و مدل برای تولید برخی از خروجی ها برای مجموعه ای از ورودی ها آموزش داده می شود. MLP: Perceptron چند لایه یک شبکه عصبی به جلو است که در آن حداقل یک لایه پنهان بین گره های ورودی و خروجی وجود دارد. CNN: شبکه عصبی Convolutional یک شبکه عصبی به جلو است که در آن ورودی ها به صورت مکانی در گره های پنهان گروه بندی می شوند. در مورد این مثال ، هر گره ورودی فقط به گره های پنهان در کنار گره ورودی همسایه خود وصل می شود. AutoEncoder: نوعی MLP که در آن شبکه عصبی برای تولید خروجی که مطابق با ورودی به شبکه باشد ، آموزش داده می شود. RNN: از یک شبکه عصبی مکرر عمیق استفاده می شود تا شبکه عصبی بتواند حافظه را به مرور زمان یا ورودی های متوالی حفظ کند. این رقم از باغ وحش شبکه عصبی توسط Fjodor Van Veen الهام گرفته شده است.

میز 1.

مدت، اصطلاحتعریفبرنامه های نمونه
یادگیری تحت نظارترویکردهای یادگیری ماشین با هدف پیش بینی برچسب ها یا نتایج
یادگیری بدون نظارترویکردهای یادگیری ماشین با هدف جمع بندی داده ها یا شناسایی الگوی
شبکه عصبی (NN)رویکرد یادگیری ماشین با الهام از نورونهای بیولوژیکی که ورودی ها در یک یا چند لایه تغذیه می شوند و یک لایه خروجی تولید می کنند
شبکه عصبی عمیقnn با چندین لایه پنهان. آموزش از طریق شبکه اتفاق می افتد ، و در نتیجه چنین معماری ها باعث می شود ساخت و سازهای ویژگی در کنار بهینه سازی هدف کلی آموزش اتفاق بیفتد
شبکه عصبی Feed-Forward (FFNN)NN که در همان لایه چرخه ای بین گره ها نداردبیشتر نمونه های زیر موارد خاص FFNN ها است ، به جز شبکه های عصبی مکرر
MLPنوع ffnn با حداقل یک لایه پنهان که در آن هر لایه عمیق تر یک عملکرد غیرخطی از هر لایه قبلی استMLP ها ساختار را تحمیل نمی کنند و در صورت عدم وجود سفارش طبیعی ورودی ها (مثلاً مانند اندازه گیری بیان ژن) اغلب مورد استفاده قرار می گیرند.
CNNNN با لایه هایی که در آن اتصال ساختار محلی را حفظ می کند. اگر داده ها با فرضیات اساسی عمل می کنند ، عملکرد اغلب خوب است ، و چنین شبکه هایی می توانند برای آموزش موثر به نمونه های کمتری نیاز داشته باشند زیرا پارامترهای کمتری دارند و همچنین بهره وری بهبود یافته را ارائه می دهندCNN برای داده های توالی - مانند توالی DNA - یا داده های شبکه - مانند تصاویر پزشکی و میکروسکوپی استفاده می شود
شبکه عصبی مکرر (RNN)یک شبکه عصبی با چرخه بین گره ها در یک لایه پنهان.معماری RNN برای داده های پی در پی استفاده می شود - مانند سری زمانی بالینی و توالی متن یا ژنوم
شبکه عصبی LSTMاین نوع خاص از RNN دارای ویژگی هایی است که مدل ها را قادر می سازد وابستگی های بلند مدت را ضبط کنندLSTM ها در تجزیه و تحلیل زبان طبیعی جایگاه قابل توجهی کسب می کنند ، و ممکن است به طور گسترده ای برای داده های توالی بیولوژیکی استفاده شود
AutoEncoder (AE)NN که در آن هدف آموزش به حداقل رساندن خطای بین لایه خروجی و لایه ورودی است. چنین شبکه های عصبی تحت نظارت قرار نمی گیرند و اغلب برای کاهش ابعاد مورد استفاده قرار می گیرندautoencoders برای تجزیه و تحلیل بدون نظارت از داده های بیان ژن و همچنین داده های استخراج شده از EHR استفاده شده است
AutoEncoder متغیر (VAE)این نوع خاص از AE مولد یک مدل متغیر نهفته احتمالی را می آموزدنشان داده شده است که VAE ها اغلب در حوزه تصویربرداری بازنمایی های کاهش یافته معنی دار ایجاد می کنند ، و برخی از نشریات اولیه از VAES برای تجزیه و تحلیل داده های بیان ژن استفاده کرده اند
Denoising AutoEncoder (DA)این نوع خاص AE شامل گامی است که در طی فرایند آموزش سر و صدا به ورودی اضافه می شود. مرحله denoising به عنوان صاف کننده عمل می کند و ممکن است امکان استفاده مؤثر در داده های ورودی را که ذاتاً پر سر و صدا هستند امکان پذیر کندمانند AES ، DAS برای تجزیه و تحلیل بدون نظارت از داده های بیان ژن و همچنین داده های استخراج شده از EHR استفاده شده است
شبکه عصبی تولیدیاز شبکه های عصبی که در این کلاس قرار می گیرند می توانند برای تولید داده های مشابه با داده های ورودی استفاده شوند. این مدل ها را می توان برای تولید نمونه های فرضی نمونه برداری کردتعدادی از معماری های شبکه عصبی یادگیری بدون نظارت که در اینجا خلاصه می شوند می توانند به روشی مولد استفاده شوند
RBMیک NN تولیدی که برای بسیاری از رویکردهای یادگیری عمیق ، دارای یک لایه ورودی واحد و یک لایه پنهان واحد ، بلوک ساختمان را تشکیل می دهد و هیچ ارتباطی بین گره ها در هر لایه وجود نداردRBMS برای ترکیب انواع مختلف داده های OMIC (به عنوان مثال متیلاسیون DNA ، بیان mRNA و بیان miRNA) استفاده شده است
DBNNN مولد با چندین لایه پنهان ، که می توان از ترکیب چندین RBMS به دست آوردDBN ها را می توان برای پیش بینی روابط جدید در یک شبکه تعامل دارویی و هدف قرار داد
شبکه مخالف تولید کننده (GAN)یک رویکرد NN مولد که در آن دو شبکه عصبی آموزش دیده اند. یک شبکه عصبی ، ژنراتور ، مجموعه ای از ورودی های تولید شده به طور تصادفی و وظیفه تولید نمونه را ارائه می دهد. دوم ، تبعیض آمیز ، برای تمایز نمونه های واقعی و تولید شده آموزش دیده است. پس از آموزش دو شبکه عصبی در برابر یکدیگر ، می توان از ژنراتور حاصل برای تولید نمونه های جدید استفاده کردGAN ها می توانند نمونه های جدیدی را با همان خصوصیات آماری مجموعه داده هایی که حاوی سوابق سطح فردی هستند ، سنتز کنند و در معرض محدودیت های به اشتراک گذاری قرار بگیرند. آنها همچنین برای تولید تصاویر میکروسکوپی استفاده شده اند
آموزش مخالففرآیندی که نمونه های آموزش مصنوعی به طرز مخرب برای فریب NN طراحی شده و سپس به عنوان نمونه های آموزشی برای ایجاد قوی NN (هیچ ارتباطی با GANS) طراحی شده است.از آموزش مخالف در تجزیه و تحلیل تصویر استفاده شده است
افزایش داده هافرآیندی که توسط آن تحولات بر خصوصیات مربوط به داده های ورودی (به عنوان مثال چرخش دلخواه تصاویر هیستوپاتولوژی) برای نمونه های آموزش برای افزایش اندازه مجموعه آموزش اعمال می شود.افزایش داده ها به طور گسترده ای در تجزیه و تحلیل تصاویر استفاده می شود زیرا تحولات چرخش برای تصاویر زیست پزشکی اغلب خصوصیات مربوط به تصویر را تغییر نمی دهد

در حالی که یادگیری عمیق باعث افزایش انعطاف پذیری نسبت به سایر رویکردهای یادگیری ماشین می شود ، همانطور که در قسمت باقی مانده این بررسی مشاهده می شود ، برای متناسب با لایه های پنهان و همچنین برچسب های دقیق برای برنامه های یادگیری تحت نظارت ، نیاز به مجموعه های آموزشی بزرگی دارد. به همین دلایل ، یادگیری عمیق اخیراً در برخی از زمینه های زیست شناسی و پزشکی محبوب شده است ، در حالی که در سایر زمینه ها فرزندخواندگی کمتری دارد. در عین حال ، با توجه به افزایش داده ها در همه زمینه های زیست پزشکی ، این نقش بالقوه حتی بزرگتر را که ممکن است در تحقیقات آینده ایفا کند ، برجسته می کند. همچنین مهم است که آن را به عنوان شاخه ای از یادگیری ماشین ببینیم و تصدیق کنید که محدودیت های مشابهی با سایر رویکردهای موجود در آن زمینه دارد. به طور خاص ، نتایج هنوز به طرح مطالعه اساسی بستگی دارد و عملکردهای معمول همبستگی در مقابل علیت هنوز هم اعمال می شود - اگر پاسخ صحیح به سؤال صحیح باشد ، پاسخ دقیق تر فقط بهتر از یک مورد کمتر است.

1. 1آیا یادگیری عمیق مطالعه بیماری انسان را تغییر خواهد داد؟

با این بررسی ، این سؤال را مطرح می کنیم: برای یادگیری عمیق چه چیزی لازم است تا نحوه طبقه بندی ، مطالعه و معالجه افراد را برای حفظ یا ترمیم سلامت تغییر دهیم؟ما یک نوار بلند برای "تبدیل" انتخاب می کنیم. Grove [12] ، مدیرعامل سابق اینتل ، اصطلاح تورم استراتژیک را ابداع کرد تا به تغییر در فناوری ها یا محیطی اشاره کند که نیاز به یک تجارت دارد تا اساساً تغییر شکل یابد. در اینجا ، ما به دنبال این هستیم که تشخیص دهیم که آیا یادگیری عمیق نوآوری است که می تواند یک نقطه تورم استراتژیک در عمل زیست شناسی یا پزشکی را القا کند.

در حال حاضر تعدادی از بررسی ها بر روی کاربردهای یادگیری عمیق در زیست شناسی [13-17] ، مراقبت های بهداشتی [18-20] و کشف مواد مخدر [4،21-23] وجود دارد. تحت سؤال راهنمایی ما ، ما به دنبال این بودیم که مواردی را که یادگیری عمیق محققان را قادر می سازد چالش هایی را که قبلاً غیرقابل تصور تلقی می شدند یا روال های سخت و خسته کننده را حل می کنند ، حل کنیم. ما همچنین رویکردهایی را که محققان از چالش های کنار گذاشته شده توسط داده های زیست پزشکی استفاده می کنند ، شناسایی کردیم. ما می دانیم که ملاحظات خاص دامنه تا حد زیادی بر نحوه مهار بهترین قدرت و انعطاف پذیری یادگیری عمیق تأثیر گذاشته است. تفسیر مدل اغلب مهم است. درک الگوهای موجود در داده ها ممکن است به همان اندازه مناسب بودن داده ها مهم باشد. علاوه بر این ، سؤالاتی مهم و مهم در مورد نحوه ساخت شبکه هایی وجود دارد که به طور مؤثر نمایانگر ساختار و منطق داده ها هستند. کارشناسان دامنه می توانند نقش مهمی در طراحی شبکه ها برای نشان دادن مناسب داده ها ، رمزگذاری برجسته ترین دانش قبلی و ارزیابی موفقیت یا شکست ایفا کنند. همچنین پتانسیل بسیار خوبی برای ایجاد سیستم های یادگیری عمیق وجود دارد که با اولویت بندی آزمایش ها یا ساده سازی وظایف که نیازی به قضاوت متخصص ندارند ، زیست شناسان و پزشکان را تقویت می کنند. ما طیف وسیعی از مباحث را به سه طبقه گسترده تقسیم کرده ایم: طبقه بندی بیماری و بیمار ، مطالعه بیولوژیکی اساسی و درمان بیماران. در زیر ، ما به طور خلاصه انواع سؤالات ، رویکردها و داده هایی را که برای هر کلاس معمولی در استفاده از یادگیری عمیق است ، معرفی می کنیم.

1. 1. 1. بیماری و طبقه بندی بیمار

یک چالش اساسی در زیست پزشکی طبقه بندی دقیق بیماری ها و زیرگروه های بیماری است. در انکولوژی ، رویکردهای فعلی "استاندارد طلا" شامل بافت شناسی است که نیاز به تفسیر متخصصان یا ارزیابی نشانگرهای مولکولی مانند گیرنده های سطح سلول یا بیان ژن دارد. یک مثال ، رویکرد PAM50 برای طبقه بندی سرطان پستان است که در آن بیان 50 ژن نشانگر بیماران مبتلا به سرطان پستان را به چهار زیرگروه تقسیم می کند. ناهمگونی قابل توجهی هنوز در این چهار زیرگروه باقی مانده است [24،25]. با توجه به افزایش ثروت داده های مولکولی موجود ، زیرگروه جامع تر به نظر می رسد. مطالعات متعددی از روشهای یادگیری عمیق برای طبقه بندی بهتر بیماران مبتلا به سرطان پستان استفاده کرده اند: به عنوان مثال ، استفاده از اتوآنمان ها ، رویکرد بدون نظارت ، می تواند برای خوشه کردن بیماران مبتلا به سرطان پستان استفاده شود [26] ، و CNN ها می توانند به شمارش بخش های میتوتیک کمک کنند ، ویژگی ای که بسیار همبسته استبا نتیجه بیماری در تصاویر بافت شناسی [27]. با وجود این پیشرفت های اخیر ، تعدادی از چالش ها در این زمینه از تحقیقات وجود دارد ، که مهمترین آنها ادغام داده های مولکولی و تصویربرداری با سایر انواع متفاوت داده ها مانند سوابق بهداشت الکترونیکی (EHR) است.

1. 1. 2. مطالعه بیولوژیکی اساسی

یادگیری عمیق می تواند برای پاسخ به سوالات اساسی تر بیولوژیکی استفاده شود. این امر به ویژه برای استفاده از مقادیر زیادی از داده ها از مطالعات با توان بالا ‘OMICS مناسب است. یک مشکل بیولوژیکی کلاسیک که در آن یادگیری ماشین و اکنون یادگیری عمیق به طور گسترده ای به کار رفته است ، پیش بینی هدف مولکولی است. به عنوان مثال ، از شبکه های عصبی مکرر عمیق (RNN) برای پیش بینی اهداف ژن میکرو RNA ها (miRNA) [28] استفاده شده است ، و CNN ها برای پیش بینی تماس های باقیمانده پروتئین و ساختار ثانویه استفاده شده اند [29-31]. سایر کاربردهای هیجان انگیز اخیر یادگیری عمیق شامل شناخت عناصر ژنومی عملکردی مانند تقویت کننده ها و پروموترها [32-34] و پیش بینی اثرات مضر پلی مورفیسم نوکلئوتیدی است [35].

1. 1. 3. درمان بیماران

اگرچه استفاده از یادگیری عمیق برای درمان بیمار تازه آغاز شده است ، ما انتظار داریم روشهای جدیدی برای توصیه به درمان بیمار ، پیش بینی نتایج درمانی و هدایت توسعه روشهای جدید انجام شود. یک نوع تلاش در این زمینه با هدف شناسایی اهداف دارویی و تعامل یا پیش بینی پاسخ به دارو انجام شده است. یکی دیگر از یادگیری عمیق در ساختارهای پروتئین برای پیش بینی تعامل دارو و فعالیت زیستی دارویی استفاده می کند [36]. جابجایی مواد مخدر با استفاده از یادگیری عمیق بر روی داده های transcriptomic یکی دیگر از مناطق هیجان انگیز تحقیق است [37]. دستگاه های محدود بولتزمن (RBM) را می توان در شبکه های اعتقاد عمیق (DBN) برای پیش بینی تعامل جدید مواد مخدر و تدوین فرضیه های تغییر مکان دارو ترکیب کرد [38،39]. سرانجام ، یادگیری عمیق همچنین در مراحل اولیه کشف مواد مخدر برای اهداف جدید ، مواد شیمیایی را در اولویت قرار می دهد [23].

2. یادگیری عمیق و طبقه بندی بیمار

در مراقبت های بهداشتی ، افراد بر اساس علائم ، نتایج آزمایش های تشخیصی خاص یا سایر عوامل ، به بیماری یا بیماری مبتلا می شوند. پس از تشخیص بیماری ، ممکن است یک فرد بر اساس مجموعه دیگری از قوانین تعریف شده توسط انسان مرحله ای اختصاص یابد. در حالی که این قوانین به مرور زمان تصفیه می شوند ، این روند تکاملی و موقت است ، که به طور بالقوه مانع شناسایی مکانیسم های بیولوژیکی اساسی و مداخلات درمانی مربوطه می شود.

روشهای یادگیری عمیق که برای یک قسمت بزرگ فنوتیپ بیمار اعمال می شود ، ممکن است یک رویکرد معنی دار و بیشتر داده محور برای طبقه بندی بیمار فراهم کند. به عنوان مثال ، آنها ممکن است مکانیسم های مشترک جدیدی را شناسایی کنند که در غیر این صورت به دلیل تعاریف تاریخی موقت از بیماری مبهم می شوند. شاید شبکه های عصبی عمیق ، با ارزیابی مجدد داده ها بدون زمینه فرضیات ما ، می توانند کلاسهای جدید از شرایط قابل درمان را نشان دهند.

علیرغم چنین خوش بینی ، توانایی مدل های یادگیری عمیق در استخراج سیگنال های پیش بینی غیرقانونی نیز باید با مراقبت ارزیابی و عملیاتی شود. تصور کنید که یک شبکه عصبی عمیق با نتایج آزمایش بالینی حاصل از EHR ها ارائه شده است. از آنجا که پزشکان ممکن است آزمایش های خاصی را بر اساس تشخیص مشکوک خود سفارش دهند ، یک شبکه عصبی عمیق ممکن است یاد بگیرد که بیماران را به سادگی بر اساس آزمایشاتی که سفارش داده می شود ، تشخیص دهند. برای برخی از کارکردهای عینی ، مانند پیش بینی طبقه بندی بین المللی بیماری (ICD) ، این ممکن است عملکرد خوبی را ارائه دهد حتی اگر بینشی در مورد بیماری زمینه ای فراتر از فعالیت پزشکان ارائه ندهد. این چالش برای رویکردهای یادگیری عمیق منحصر به فرد نیست. با این حال ، این مهم است که پزشکان از این چالش ها و امکان ساخت طبقه بندی کننده های بسیار پیش بینی کننده از ابزار سوال برانگیز آگاه باشند.

هدف ما در این بخش ارزیابی میزان یادگیری عمیق در حال حاضر در کشف دسته های جدید است. جایی که نیست ، ما بر روی موانع دستیابی به این اهداف تمرکز می کنیم. ما همچنین رویکردهایی را که محققان برای رفع چالش های موجود در این زمینه انجام می دهند ، به ویژه در مورد در دسترس بودن داده ها و برچسب زدن ، برجسته می کنیم.

2. 1برنامه های تصویربرداری در مراقبت های بهداشتی

روشهای یادگیری عمیق تجزیه و تحلیل تصاویر و فیلم های طبیعی را تغییر داده اند و نمونه های مشابه با تصاویر پزشکی شروع به ظهور می کنند. از یادگیری عمیق برای طبقه بندی ضایعات و گره ها استفاده شده است. ارگان ها ، مناطق ، نقاط دیدنی و ضایعات بومی سازی. ارگان های بخش ، زیرساخت های اندام و ضایعات. بازیابی تصاویر بر اساس محتوا ؛ایجاد و تقویت تصاویر ؛و تصاویر را با گزارش های بالینی ترکیب کنید [19،40].

اگرچه با تجزیه و تحلیل تصاویر طبیعی مشترکات زیادی وجود دارد ، اما تفاوت های اساسی نیز وجود دارد. در همه مواردی که ما مورد بررسی قرار دادیم ، کمتر از یک میلیون تصویر برای آموزش در دسترس بود و مجموعه داده ها اغلب سفارشات زیادی با اندازه کوچکتر از مجموعه تصاویر طبیعی هستند. محققان استراتژی های خاص Subtask را برای رسیدگی به این چالش تدوین کرده اند.

افزایش داده ها یک استراتژی موثر برای کار با مجموعه های آموزشی کوچک ارائه می دهد. این عمل با مجموعه‌ای از مقالات که تصاویر ماموگرافی را تجزیه و تحلیل می‌کند، نمونه‌ای است [41-45]. برای گسترش تعداد و تنوع تصاویر، محققان نمونه های متخاصم [44] یا افزوده شده [45] را ساختند. نمونه‌های آموزش خصمانه با انتخاب تبدیل‌های کوچک هدفمند برای داده‌های ورودی که باعث می‌شود یک مدل خروجی‌های بسیار متفاوتی تولید کند، ساخته می‌شوند. آموزش افزوده اختلالاتی را در داده های ورودی اعمال می کند که معنای اصلی را تغییر نمی دهد، مانند چرخش برای تصاویر آسیب شناسی. یک جایگزین در این حوزه، آموزش به سمت ویژگی‌های ایجاد شده توسط انسان قبل از تنظیم دقیق بعدی است [42]، که می‌تواند به دور زدن این چالش کمک کند، اگرچه قدرت تکنیک‌های یادگیری عمیق را به عنوان سازنده ویژگی‌ها از بین می‌برد.

استراتژی دوم ویژگی‌های استخراج شده از تصاویر طبیعی توسط مدل‌های یادگیری عمیق، مانند ImageNet [46] را برای اهداف جدید تغییر می‌دهد. تشخیص رتینوپاتی دیابتی از طریق تصاویر رنگی فوندوس پس از اینکه یک مجموعه تصویر بزرگ با برچسب در طول مسابقه Kaggle در سال 2015 در دسترس عموم قرار گرفت، به یک منطقه مورد توجه محققان یادگیری عمیق تبدیل شد. اکثر شرکت کنندگان شبکه های عصبی را از ابتدا آموزش دادند [47-49]، اما گلشن و همکاران.[50] یک معماری عمیق 48 لایه Inception-v3 را که از قبل بر روی تصاویر طبیعی آموزش داده شده بود، تغییر داد و از ویژگی و حساسیت پیشرفته پیشی گرفت. چنین ویژگی‌هایی همچنین برای تشخیص ملانوم، کشنده‌ترین شکل سرطان پوست، از تصاویر درموسکوپی [51،52] و غیردرموسکوپی ضایعات پوستی [5،53،54] و همچنین دژنراسیون ماکولای مرتبط با سن [55] تغییر کاربری دادند. پیش‌آموزش تصاویر طبیعی می‌تواند شبکه‌های بسیار عمیق را قادر به موفقیت بدون برازش بیش از حد کند. برای کار ملانوما، عملکرد گزارش شده رقابتی یا بهتر از هیئت متخصصان پوست تایید شده بود [5،51]. استفاده مجدد از ویژگی های تصاویر طبیعی نیز یک رویکرد در حال ظهور برای تصاویر رادیوگرافی است، که در آن مجموعه داده ها اغلب برای آموزش شبکه های عصبی عمیق بدون این تکنیک ها بسیار کوچک هستند [56-59]. یک CNN عمیق آموزش دیده بر روی تصاویر طبیعی عملکرد را در تصاویر رادیوگرافی افزایش می دهد [58]. با این حال، وظیفه هدف نیازمند آموزش مجدد مدل اولیه از ابتدا با پیش پردازش ویژه یا تنظیم دقیق کل شبکه در رادیوگرافی با افزایش داده های سنگین بود تا از برازش بیش از حد جلوگیری شود.

تکنیک استفاده مجدد از ویژگی های یک کار متفاوت در حوزه وسیع تری از یادگیری انتقال قرار می گیرد (به بحث مراجعه کنید). اگرچه ما برای انتقال ویژگی های تصویر طبیعی به کارهای جدید به موفقیت های بی شماری اشاره کرده ایم ، اما انتظار داریم که بخش کمتری از نتایج منفی منتشر شده باشد. تجزیه و تحلیل تصاویر رزونانس مغناطیسی نیز با چالش مجموعه های آموزش کوچک روبرو است. در این دامنه ، آمیت و همکاران.[60] تجارت بین مدلهای از پیش آموزش از یک دامنه متفاوت و یک CNN کوچک که فقط با تصاویر MRI آموزش دیده است ، بررسی کرد. در مقابل با سایر ادبیات منتخب ، آنها یک شبکه کوچکتر را یافتند که با افزایش داده ها در چند صد تصویر آموزش داده شده از چند ده بیمار می تواند از طبقه بندی کننده خارج از دامنه از پیش آموزش استفاده کند.

راه دیگر برای مقابله با داده های آموزشی محدود ، تقسیم داده های غنی است - e. g. تصاویر سه بعدی - به پیش بینی های کاهش یافته بی شماری. شین و همکاران.[57] با مقایسه معماری های مختلف شبکه عمیق ، ویژگی های مجموعه داده ها و روش های آموزش برای تشخیص ناهنجاری مبتنی بر توموگرافی رایانه (CT). آنها نتیجه گرفتند که شبکه های عمق 22 لایه با وجود اندازه محدود مجموعه داده های آموزشی می توانند برای داده های سه بعدی مفید باشند. با این حال ، آنها خاطرنشان كردند كه انتخاب معماری ، تنظیم پارامترها و تنظیم دقیق مدل مورد نیاز بسیار مشكل و مجموعه داده های خاص است. علاوه بر این ، این نوع کار اغلب به محلی سازی ضایعه و ظاهر بستگی دارد ، که برای رویکردهای مبتنی بر CNN چالش هایی را ایجاد می کند. تلاش های ساده برای گرفتن اطلاعات مفید از تصاویر با اندازه کامل در هر سه بعد به طور همزمان از طریق معماری استاندارد شبکه عصبی از نظر محاسباتی غیر ممکن بود. در عوض ، از مدل های دو بعدی برای پردازش برش های تصویر به صورت جداگانه (2D) یا اطلاعات جمع شده از تعدادی از پیش بینی های 2D در فضای بومی (2. 5D) استفاده شد.

راث و همکاران.[61] CNN های 2D ، 2. 5D و 3D را در تعدادی از کارها برای تشخیص به کمک رایانه از اسکن های CT مقایسه کرد و نشان داد که CNN 2. 5D نسبتاً خوب با آنالوگ های سه بعدی انجام داده است ، در حالی که به زمان آموزش بسیار کمتری نیاز دارد ، به خصوص در مجموعه های آموزش های افزوده. یکی دیگر از مزیت های شبکه های 2D و 2. 5D در دسترس بودن گسترده تر مدل های از پیش آموزش است. با این حال ، کاهش ابعاد همیشه مفید نیست. نی و همکاران.[62] نشان داد که معماری عمیق چند کانال ، چند کانال عمیق در یادگیری ویژگی های سطح بالا تومور مغز به طور مشترک از MRI ، MRI کاربردی و تصاویر MRI انتشار ، بهتر از مدل های تکدادی یا 2D موفقیت آمیز است. به طور کلی ، تنوع روش ها ، خواص و اندازه های مجموعه های آموزشی ، ابعاد ورودی و اهمیت اهداف نهایی در تجزیه و تحلیل تصویر پزشکی باعث ایجاد توسعه معماری های تخصصی شبکه عصبی عمیق ، پروتکل های آموزش و اعتبار سنجی و بازنمایی های ورودی نمی شود که نیستندمشخصه تصاویر طبیعی بسیار مورد مطالعه.

پیش بینی های شبکه های عصبی عمیق را می توان برای استفاده در گردش کار که شامل متخصصان انسانی نیز می باشد ، ارزیابی کرد. در یک مجموعه داده بزرگ از تصاویر ماموگرافی ، Kooi و همکاران.[63] نشان داد که شبکه های عصبی عمیق از یک سیستم تشخیص سنتی به کمک رایانه با حساسیت پایین عمل می کنند و با حساسیت بالا عمل می کنند. آنها همچنین عملکرد شبکه را با رادیولوژیست های غربالگری معتبر در سطح پچ مقایسه کردند و تفاوت معنی داری بین شبکه و خوانندگان مشاهده نکردند. با این حال ، استفاده از روشهای عمیق برای عمل بالینی با دشواری در تعیین سطح اعتماد به نفس به هر پیش بینی به چالش کشیده می شود. لیبیگ و همکاران.[49] عدم اطمینان از شبکه های عمیق برای تشخیص رتینوپاتی دیابتی با پیوند دادن شبکه های ترک تحصیل با استنتاج تقریبی بیزی. تکنیک هایی که به هر پیش بینی اعتماد به نفس را اختصاص می دهند ، باید به تعامل پزشک و رایانه کمک کرده و جذب پزشکان را بهبود بخشند.

سیستم هایی برای کمک به تجزیه و تحلیل اسلایدهای بافت شناسی نیز موارد استفاده امیدوارکننده ای برای یادگیری عمیق هستند [64]. Ciresan و همکاران[27] یکی از اولین رویکردها را برای اسلایدهای بافت شناسی توسعه داد، که در کنفرانس بین المللی تشخیص الگو در سال 2012 در مسابقه تشخیص میتوز در حالی که به دقت رقابتی انسان دست یافت، برنده شد. در کارهای اخیرتر، وانگ و همکاران.[65] اسلایدهای رنگ آمیزی شده برش های غدد لنفاوی را برای شناسایی سرطان ها تجزیه و تحلیل کردند. در این کار، یک آسیب شناس حدود 3٪ درصد خطا دارد. آسیب شناس هیچ گونه مثبت کاذب تولید نکرد اما تعدادی منفی کاذب داشت. این الگوریتم تقریباً دوبرابر میزان خطای یک آسیب شناس داشت، اما خطاها به شدت همبستگی نداشتند. ترکیب معماری‌های شبکه عمیق از قبل آموزش‌دیده با تکنیک‌های تقویت چندگانه، تشخیص دقیق سرطان سینه را از مجموعه بسیار کوچکی از تصاویر بافت‌شناسی با کمتر از ۱۰۰ تصویر در هر کلاس، امکان‌پذیر می‌سازد [66]. در این زمینه، این الگوریتم‌ها ممکن است برای کمک به آسیب‌شناسان و کاهش نرخ منفی کاذب در ابزارهای موجود گنجانده شوند. مجموعه‌های یادگیری عمیق و متخصصان انسانی ممکن است به غلبه بر برخی از چالش‌های ارائه شده توسط محدودیت‌های داده کمک کنند.

یکی از منابع نمونه های آموزشی با حاشیه نویسی فنوتیپی غنی EHR است. اطلاعات صورت‌حساب در قالب کدهای ICD حاشیه‌نویسی ساده‌ای هستند، اما الگوریتم‌های فنوتیپی می‌توانند آزمایش‌های آزمایشگاهی، نسخه‌های دارو و یادداشت‌های بیمار را برای تولید فنوتیپ‌های قابل اعتمادتر ترکیب کنند. اخیراً لی و همکاران.[67] رویکردی را برای تشخیص افراد مبتلا به دژنراسیون ماکولا وابسته به سن از افراد کنترل ایجاد کرد. آنها یک شبکه عصبی عمیق را بر روی تقریباً 100000 تصویر استخراج شده از EHR های ساختاریافته آموزش دادند که دقت آنها به بیش از 93 درصد رسید. نویسندگان از مجموعه تست خود برای ارزیابی زمان توقف تمرین استفاده کردند. در سایر حوزه‌ها، این منجر به تغییر حداقلی در دقت تخمینی شده است [68]، اما توصیه می‌کنیم در صورت امکان از یک مجموعه تست مستقل استفاده کنید.

اطلاعات بالینی غنی در EHR ذخیره می شود. با این حال ، حاشیه نویسی دستی یک مجموعه بزرگ به متخصصان نیاز دارد و وقت گیر است. برای مطالعات اشعه ایکس قفسه سینه ، یک رادیولوژیست معمولاً در هر مثال چند دقیقه می گذراند. تولید تعداد نمونه های مورد نیاز برای یادگیری عمیق بسیار گران است. در عوض ، محققان ممکن است از استفاده از معدن متن برای تولید حاشیه نویسی بهره مند شوند [69] ، حتی اگر این حاشیه نویسی ها از دقت متوسطی برخوردار باشند. وانگ و همکاران.[70] پیشنهاد ساخت مدل های شبکه عصبی عمیق پیش بینی شده از طریق استفاده از تصاویر با برچسب های ضعیف. چنین برچسب هایی به طور خودکار توسط انسان تولید می شوند و تأیید نمی شوند ، بنابراین ممکن است پر سر و صدا یا ناقص باشند. در این حالت ، آنها یک سری تکنیک های پردازش زبان طبیعی (NLP) را برای گزارش های رادیولوژی اشعه ایکس قفسه سینه مرتبط به کار بردند. آنها ابتدا تمام بیماری های ذکر شده در گزارش ها را با استفاده از یک ابزار پیشرفته NLP استخراج کردند ، سپس یک روش جدید به نام Negbio [71] را برای فیلتر کردن یافته های منفی و دو طرفه در گزارش ها به کار بردند. ارزیابی چهار مجموعه داده مستقل نشان داد که Negbio برای تشخیص یافته های منفی و دو برابر بسیار دقیق است (تقریباً 90 ٪ در F1امتیاز ، که دقت و فراخوان را متعادل می کند [72]). مجموعه داده های حاصل [73] شامل 112 120 تصویر اشعه ایکس قفسه سینه از جلو از 30 805 بیمار بود ، و هر تصویر با یک یا چند گروه آسیب شناسی با یک یا چند متن (با برچسب ضعیف) همراه بود (به عنوان مثال پنومونی و کاردیومگالی) یا "نهدر غیر این صورت پیدا کردنعلاوه بر این ، وانگ و همکاران.[70] از این مجموعه داده با یک چارچوب طبقه بندی تصویر چند برچسب ضعیف یکپارچه برای تشخیص بیماری های مشترک قفسه سینه استفاده کرد. این عملکرد برتر را نسبت به یک معیار با استفاده از داده های کاملاً دارای برچسب نشان داد.

نمونه دیگر تولید برچسب نیمه اتوماتیک برای تقسیم رادیوگرافی دست ، از معدن مثبت استفاده کرد ، یک روش تکراری که برچسب زدن دستی را با پردازش خودکار ترکیب می کند [74]. اول ، مجموعه آموزش اولیه با برچسب زدن دستی 100 از 12 600 رادیوگرافی بدون برچسب که برای آموزش یک مدل و پیش بینی برچسب ها برای بقیه مجموعه داده ها ایجاد شده است. سپس ، پیش بینی های با کیفیت ضعیف از طریق بازرسی دستی دور ریخته شد ، مجموعه آموزش اولیه با تقسیم بندی های قابل قبول گسترش یافت و روند تکرار شد. این روش باید شش بار تکرار شود تا برچسب زدن تقسیم بندی با کیفیت خوب برای همه رادیوگرافی ها بدست آید ، به جز 100 مورد گوشه ای که هنوز نیاز به حاشیه نویسی دستی دارند. این حاشیه نویسی ها امکان تقسیم دقیق کلیه تصاویر دست در مجموعه آزمون را فراهم کرده و عملکرد نهایی را در طبقه بندی رادیوگرافی تقویت می کند [74].

به استثنای مشکلات طبیعی مانند تصویر (به عنوان مثال تشخیص ملانوما) ، تصویربرداری زیست پزشکی تعدادی از چالش ها را برای یادگیری عمیق ایجاد می کند. مجموعه داده ها به طور معمول کوچک هستند ، حاشیه نویسی ها می توانند پراکنده باشند و تصاویر اغلب با ابعاد بالا ، چند مدلی و چند کانال هستند. تکنیک هایی مانند یادگیری انتقال ، تقویت مجموعه داده های سنگین و استفاده از معماری های چند منظوره و چند جریان متداول تر از حوزه تصویر طبیعی است. علاوه بر این ، حساسیت و ویژگی مدل بالا می تواند مستقیماً به ارزش بالینی تبدیل شود. بنابراین ، ارزیابی پیش بینی ، برآورد عدم اطمینان و روشهای تفسیر مدل نیز در این حوزه از اهمیت زیادی برخوردار است (به بحث مراجعه کنید). سرانجام ، نیاز به تکنیک های تعامل پاتولوژیست بهتر و رایانه ای وجود دارد که امکان ترکیب قدرت روشهای یادگیری عمیق را با تخصص انسان فراهم می کند و منجر به تصمیمات آگاهانه برای درمان و مراقبت از بیمار می شود.

2. 2برنامه های متنی در مراقبت های بهداشتی

با توجه به رشد سریع انتشارات علمی و EHR ، استخراج متن زیست پزشکی در سالهای اخیر به طور فزاینده ای اهمیت پیدا کرده است. وظایف اصلی در استخراج متن بیولوژیکی و بالینی شامل ، اما محدود به نامگذاری موجودیت (NER) ، استخراج رابطه/رویداد و بازیابی اطلاعات محدود نمی شود (شکل 2). یادگیری عمیق به دلیل عملکرد رقابتی در مقابل روشهای سنتی و توانایی غلبه بر چالش های مهندسی ویژگی ، در این دامنه جذاب است. برنامه های مربوطه می توانند توسط دامنه کاربرد (ادبیات زیست پزشکی در مقابل نت های بالینی) و کار واقعی (به عنوان مثال مفهوم یا استخراج رابطه) طبقه بندی شوند.

راهنمای تجارت فارکس...
ما را در سایت راهنمای تجارت فارکس دنبال می کنید

برچسب : نویسنده : لیال حقیقی بازدید : 72 تاريخ : سه شنبه 8 فروردين 1402 ساعت: 18:13