تشخیص و طبقه‌بندی سرطان پوست با استفاده از یادگیری عمیق

فولادی, صابر; فرسی, حسن; محمدزاده, سجاد

doi:10.32592/JBirjandUnivMedSci.2019.26.1.105

دوره 26، شماره 1 - ( بهار 1398 ) جلد 26 شماره 1 صفحات 53-44 | برگشت به فهرست نسخه ها

‎ 10.32592/JBirjandUnivMedSci.2019.26.1.105

Mendeley

Zotero

RefWorks

Fooladi S, Farsi H, Mohamadzadeh S. Detection and classification of skin cancer using deep learning. Journals of Birjand University of Medical Sciences 2019; 26 (1) :44-53
URL: http://journal.bums.ac.ir/article-1-2533-fa.html

فولادی صابر، فرسی حسن، محمدزاده سجاد. تشخیص و طبقه‌بندی سرطان پوست با استفاده از یادگیری عمیق. مجله علمی دانشگاه علوم پزشکی بیرجند. 1398; 26 (1) :44-53

URL: http://journal.bums.ac.ir/article-1-2533-fa.html

تشخیص و طبقه‌بندی سرطان پوست با استفاده از یادگیری عمیق

صابر فولادی¹

، حسن فرسی¹

، سجاد محمدزاده^*²

1- گروه مهندسی برق، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند، ایران
2- گروه مهندسی برق، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند، ایران ، s.mohamadzadeh@birjand.ac.ir

واژه‌های کلیدی: یادگیری عمیق، سرطان پوست، ملانوما، شبکه عصبی عمیق

متن کامل [PDF 423 kb] (4428 دریافت) | چکیده (HTML) (8176 مشاهده)

متن کامل: (4283 مشاهده)

Abstract Original Article

Detection and Classification of Skin Cancer
Using Deep Learning

Saber Fooladi[1], Hasan Farsi1, Sajad Mohamadzadeh[2]

Background and Aim: Skin cancer has grown dramatically over the past decades, and the importance of early treatment is increasing day by day. The purpose of this study is to use deep neural networks to create an auto-diagnosis system for melanoma, in which data is directly controlled as part of a deep learning process.
Materials and Methods: In this paper, studies on related pictures of skin cancer were performed. For the diagnosis of benign or malignant skin cancer, the deep neural network classifier is used with the help of the Tensorflow framework and the use of the Keras libraries. The dataset which are used in this study consist 70 images of melanoma and 100 images of benign moles. In the proposed model, 80% of the database images are used for training and 20% of the database images are selected for testing.
Results: The proposed method offers a higher detection accuracy than other existing methods, which has increased the accuracy of diagnosis in most cases by more than 10%. The high accuracy of the diagnosis and classification and the speed of convergence to the final result are the characteristics of this Research Compared to other Research.
Conclusion: An automatic system based on deep learning is presented to identify and categorize skin cancer which provides high accuracy and speed.
Key Words: Deep Learning; Skin Cancer; Melanoma; Deep Neural Network
Received: July 8, 2018 Accepted: October 27, 2018
Citation Fooladi S, Farsi H, Mohamadzadeh S. [Detection and Classification of Skin Cancer Using Deep Learning]. J Birjand Univ Med Sci. 2019; 26(1):44-53. [Persian]

مقاله اصیل پژوهشی

تشخیص و طبقه‌بندی سرطان پوست با استفاده از یادگیری عمیق

صابر فولادی[3]، حسن فرسی1، سجاد محمدزاده[4]

چکیده
زمینه و هدف: سرطان پوست در طول دهه‌های گذشته رشد چشم‌گیری داشته است و اهمیت درمان اولیه آن روز به روز در حال افزایش است. هدف از این مطالعه، استفاده از شبکه‌های عصبی عمیق برای ایجاد یک سیستم خودکار تشخیص ملانوما بود که در آن داده‌ها به‌طور مستقیم به‌عنوان بخشی از فرآیند یادگیری عمیق کنترل می‌شود.
روش تحقیق: در این پژوهش مطالعات بر روی تصاویر مربوط به سرطان پوست انجام شده است. برای تشخیص خوش‌خیم یا بدخیم بودن سرطان پوست از طبقه‌بندی کننده شبکه عصبی عمیق به کمک فریمورک تنسورفلو و بهره‌گیری از کتابخانه کراس استفاده شده است. مجموعه داده مورد استفاده در این پژوهش از 70 تصویر ملانوما و 100 تصویر مربوط به خال گوشتی خوش خیم تشکیل شده است. در مدل پیَشنهادی این پژوهش 80 درصد از تصاویر پایگاه‌داده برای آموزش و 20 درصد تصاویر پایگاه داده برای آزمون انتخاب می‌شود،.
یافته‌ها: روش پیشنهادی، دقت تشخیص بالاتری دارد که نسبت به روش‌های موجود باعث افزایش بیش از 10درصد در دقت تشخیص در بسیاری از موارد گردیده است. دقت بالای تشخیص و طبقه‌بندی و سرعت بالای همگرایی به‌ نتیجه نهایی، از ویژگی‌های این پژوهش نسبت به سایر تحقیقات است.
نتیجه‌گیری: سیستم اتوماتیک تشخیص و طبقه‌بندی سرطان پوست بر مبنای یادگیری عمیق، با دقت و سرعت مطلوبی ارائه می‌شود.
واژه‌های کلیدی: یادگیری عمیق؛ سرطان پوست؛ ملانوما؛ شبکه عصبی عمیق
مجله علمی دانشگاه علوم پزشکی بیرجند. 1398؛ 26(1): 44-53.
دریافت: 17/04/1397 پذیرش: 05/08/1397

مقدمه
سرطان پوست در طول دهه‌های گذشته رشد چشم‌گیری داشته و اهمیت درمان اولیه آن روز به روز در حال افزایش است. ملانوما[5] سومین نوع رایج سرطان پوست و یکی از سرطان‌های بدخیم است (1). ملانوما همچنین به‌عنوان ملانوم بدخیم نیز نامیده می‌شود که به‌علت عملکرد غیرطبیعی سلول‌های تولیدکننده رنگدانه، رنگ پوست را تغییر می‌دهد (2). این بیماری از تجمع دانه‌های ملانین و سرایت آن به خارجی‌ترین لایه پوست شکل می‌گیرد. با وجود مرگ و میر قابل توجه، ملانوما در مراحل اولیه تشخیص، در اغلب موارد قابل درمان است (3). در همین حال تمایز بین ملانوما و خال‌های خوش‌خیم دیگر، در مراحل اولیه رشد یک کار چالش‌برانگیز حتی برای متخصصان پوستی است (1).
رشد سرطان پوست زمانی آغاز می‌شود که آسیب‌های ناشی از سلول‌های پوست (اغلب ناشی از اشعه ماوراء بنفش) باعث جهش‌هایی می‌شود که سلول‌های پوست را به‌سرعت تکثیر داده و تومورهای بدخیم را تشکیل می‌دهد. به‌طور معمول، سلول‌های پوستی به‌صورت کنترل‌شده و منظم رشد می‌کنند؛ اما برخی از سلول‌های تازه تولیدشده ممکن است رشد غیر قابل کنترل داشته باشند و یک توده سلول‌های سرطانی ایجاد کنند (4). تغییر در شکل، اندازه و رنگ در خال یک فرد، اغلب از اولین علائم ملانوماست. ملانوما، حاشیه سیاه یا آبی متمایل به سیاه دارد؛ همچنین ملانوما به شکل خال‌های جدید سیاه و با ظاهری غیرطبیعی ظاهر می‌شود (5). این تومورهای تولیدکننده رنگدانه، در لایه سطحی پوست (اپیدرم^{^[6]}) وجود دارند (1).
تشخیص سرطان پوست به‌دلیل ظاهر انواع مختلف ضایعات پوستی به‌خصوص Melanoma و Nevi برای تمایز دشوار است. حتی با درموسکوپی (Dermoscopy) که یک تکنیک آزمایشی غیر تهاجمی است، دقت تشخیص ملانوم توسط متخصصان پوست 84-75 درصد می‌باشد. با این حال نمونه‌برداری، تشخیص بهتری را فراهم می‌کند که تنها بر اساس جراحی امکان‌پذیر بوده که این عملیات تهاجمی^{^[7]} تجربه ناخوشایندی را برای بیمار در پی دارد (1). برای جلوگیری از نمونه‌برداری غیرضروری، محققان روش‌های غیرتهاجمی متعددی را برای تشخیص ملانوما بررسی کرده‌اند (7، 6). این روش‌ها معمولاً شامل سه مرحله می‌باشند: 1) شناسایی مرز (محدوده) پوست، 2) استخراج ویژگی و 3) طبقه‌بندی. فرآیند تشخیص مرز، تومور را در تصاویر مربوط به پوست تشخیص می‌دهد که برای طبقه‌بندی دقیق ضایعات پوستی ضروری است. فرآیند استخراج ویژگی، ویژگی‌های تصویری مانند: رنگ، شکل توده و اطلاعات بافت^{^[8]} را برای طبقه‌بندی استفاده می‌کند. فرآیند طبقه‌بندی نیز نوع ضایعات پوستی را از ویژگی‌های تصویر استخراج می‌کند و عملیات طبقه‌بندی را انجام می‌دهد که بعضی از این نوع طبقه‌بندی‌ها عبارتند از: طبقه‌بندی‌کننده‌های خطی، KNN، شبکه‌های عصبی مصنوعی.
ساختار این مقاله به این شرح است که در بخش دوم، مدل و روش پیشنهادی معرفی می‌شود؛ در بخش سوم تجربیات این پژوهش گزارش داده می‌شود؛ در بخش چهارم به مرور برخی کارهای انجام‌گرفته در این زمینه پرداخته می‌شود و سرانجام در بخش پنجم با نتیجه‌گیری، این پژوهش به پایان می‌رسد.

روش تحقیق
از فناوری‌های یادگیری عمیق، شبکه‌های عصبی کانولوشن (CNNs)[9] در زمینه تصاویر پزشکی، از محبوبیت بالاتری برخوردار هستند. بیشتر تکنولوژی‌های یادگیری عمیق مربوط به غربالگری سرطان، بر اساس CNNها می‌باشند. به‌کارگیری شبکه‌های عصبی کانولوشن از اواخر دهه 1970 آغاز شده و از سال 1995 به تجزیه و تحلیل تصاویر پزشکی اعمال شده است (8). یادگیری عمیق، یک روش جدید برای اعمال یادگیری ماشین است؛ زیرا براساس یادگیری داده‌هاست. شبکه‌های عصبی کانولوشن عمیق، یک نوع روش یادگیری عمیق می‌باشند که در آن فیلترها قابل تعویض هستند و عملیات ادغام بر روی تصاویر ورودی اعمال می‌شود و مجموعه‌ای سطح بالا از ویژگی‌ها را به‌صورت خودکار استخراج می‌کند (9). استخراج سطح بالای این ویژگی‌ها باعث می‌شود تا مفاهیم گسترده و پیچیده به مفاهیم ساده‌تری تقسیم شود که این مفاهیم ساده، ماشین را قادر به تصمیم‌گیری برای آنها می‌سازد و بدین‌ترتیب نیازی به نظارت کامل انسان برای مشخص‌کردن اطلاعات لازم ماشین در هر لحظه نیست. در یادگیری عمیق، ویژگی‌های غیرخطی چندین لایه استخراج می‌شوند و به یک دسته‌بند اعمال شده و آن هم این ویژگی‌ها را با هم ترکیب می‌کند تا بتواند یک پیش‌بینی انجام دهد.
در این پژوهش، مطالعات بر روی تصاویر سرطان پوست انجام شده است. برای تشخیص خوش‌خیم یا بدخیم بودن سرطان پوست، از طبقه‌بند شبکه عصبی عمیق به کمک ساختار تنسورفلو (Tensorflow) و بهره‌گیری از کتابخانه کراس (Keras) استفاده شده است. اولین مرحله در روش پیشنهادی، پیش‌پردازش تصاویر پایگاه داده می‌باشد که در این مرحله آثاری که می‌تواند شبکه عصبی پیچیده را گمراه کند، کاهش می‌یابد. تصاویر پیش‌پردازش‌شده پس از کلاس‌بندی، در مرحله دوم به یک شبکه عصبی عمیق در مرحله بعد وارد می‌شوند و با استفاده از معماری خاص شبکه عصبی عمیق پیشنهادی، مراحل آموزش و تست بر روی تصاویر اعمال می‌گردد. تصاویر سطح پوست حتی از طریق دوربین‌های دیجیتال حرفه‌ای، دارای نور و اثرات نویز هستند که باید حذف شوند. این اثرات ناشی از نور و نویز غیرمتعارف، از عوامل گمراه‌کننده در آموزش و طبقه‌بندی شبکه عصبی عمیق بر روی تصاویر ورودی است. پیکسل‌های با فرکانس بالا، اثرات نویزی مخرّب بر روی تصاویر را در پی دارد که با استفاده از یک فیلتر پایین‌گذر به کاهش اثر نویز در تصاویر پزشکی پایگاه داده مورد نظر پرداخته می‌شود. در معماری پیشنهادی در این پژوهش، تصاویری با ابعاد ثابت در ورودی مورد نیاز است؛ به همین دلیل پیش از آموزش، تصاویر به ابعاد ثابت 300×300 تغییر اندازه داده می‌شود. در شکل یک، نمونه‌ای از تصویر پیش‌پردازش شده از پایگاه داده مورد استفاده برای دورکردن شبکه از عوامل گمراه‌کننده شدت نور و اثرات نویز، نشان داده شده است.

شکل 1- نمونه‌ای از تصویر پیش‌پردازش‌ شده

آموزش شبکه در واقع حداقل‌کردن تابع خطا بر حسب خروجی‌های واقعی شبکه در مقایسه با خروجی‌های مطلوب شبکه است. این کار از طریق اصلاح پارامترهای آزاد شبکه یعنی وزن‌ها و بایاس‌ها صورت می‌گیرد. روش آموزش مورد استفاده در ساختار پیشنهاد فعلی، روش آموزش همراه با ناظر است. در این روش یک سرپرست بر رفتار یادگیرنده نظارت می‌کند و نحوه عملکرد صحیح را به او یادآور می‌شود؛ به بیانی دیگر، به سیستم یادگیرنده، مجموعه‌ای از زوج‌های داده متشکل از ورودی شبکه و خروجی مطلوب اعمال می‌شود. پس از اعمال ورودی شبکه، خروجی آن با خروجی مطلوب مقایسه شده و سپس خطای یادگیری محاسبه و از آن برای تنظیم پارامترهای شبکه به گونه‌ای استفاده می‌شود که اگر به‌طور مجدد به شبکه همان ورودی اعمال گردد، خروجی شبکه به خروجی مطلوب نزدیک‌تر گردد. پارامترهای شبکه را می‌توان به دو طریق آموزش داد: آموزش پس از هر نمونه آموزشی که به آن روش آموزش «ترتیبی یا تصادفی» گویند و یا اینکه پس از اعمال تمام نمونه‌های آموزشی، بروزرسانی پارامترها انجام شود که آن را روش آموزش «دسته‌ای» می‌گویند. روش اول، حافظه کمتری نیاز دارد، ولی پایداری آن نیز پایین‌تر است؛ زیرا هر نمونه آموزشی می‌تواند پارامترهای شبکه را به سمت جدیدی هدایت کند. اما روش دوم با وجود اینکه نیازمند حافظه بالاتری است، چون باید تغییرات در پارامترها را ذخیره‌سازی کند، پایداری بیشتری خواهد داشت. بنابراین در ادامه از روش آموزش دسته‌ای استفاده می‌کنیم. در این پژوهش دسته‌هایی با اندازه 32 برای آموزش تصاویر پایگاه داده مورد استفاده قرار گرفته است.
در معماری شبکه عصبی عمیق این پژوهش، از سه لایه کانولوشن و سه لایه ادغام ماکزیمم (Max_pooling) استفاده شده است که در شکل 2 شمای کلی این معماری نمایش داده شده است. لایه کانولوشن، هسته اصلی تشکیل‌دهنده شبکه عصبی کانولوشن است و توده خروجی آن را می‌توان به‌صورت یک توده سه‌بعدی از نورون‌ها تفسیر کرد.

کانولوشن، یک عملیات ریاضی برای پردازش سیگنال است که از این طریق توسط نورون‌ها، عملیات کانولوشن به ورودی‌ها اعمال می‌گردد. مهمترین پارامتر در نورون‌های کانولوشن اندازه فیلتر است که در مدل پیشنهادی برای طبقه‌بندی سرطان پوست، از سه لایه کانولوشن با ابعاد فیلتر 32×32، 64×64 و 128×128 استفاده شده است که در این حالت، عمق آن با عمق تصویر برابر است. کانولوشن، یک عملیات ریاضی برای پردازش سیگنال است که از این طریق، توسط نورون‌ها، عملیات کانولوشن به ورودی‌ها اعمال می‌گردد. مهمترین پارامتر در نورون‌های کانولوشن، اندازه فیلتر می‌باشد. بعد از لایه کانولوشن برای کاهش اندازه فضایی (فقط عرض و ارتفاع نه عمق) از لایه ادغام استفاده شده و تعداد پارامترها کاهش یافته است که منجر به کاهش محاسبات و افزایش سرعت می‌گردد. لایه‌های ادغام باعث کاهش نمونه‌های خروجی فیلتر می‌شوند. در این پژوهش از Max_Pooling با اندازه فیلتر 2×2 استفاده شده است. در واقع هدف اصلی این لایه Subsample تصویر ورودی به‌منظور کاهش بار محاسباتی، حافظه و تعداد پارامترهاست.

کاهش اندازه تصویر ورودی همچنین باعث کاهش حساسیت شبکه عصبی می‌شود. در لایه ادغام مانند لایه کانولوشن، هر نورون به خروجی تعداد محدودی از نورون‌ها در لایه قبل متصل است. به‌منظور کاهش ابعاد و افزایش سرعت محاسبات، از لایه ادغام به‌منظور نمونه‌برداری استفاده می‌شود. در این پژوهش لایه ادغام که با اندازه پنجره 2×2 روی تصویر گام برمی‌دارد، از میان 4 پیکسل موجود در این پنجره، پیکسل ماکزیمم را انتخاب و به لایه بعد منتقل می‌کند (10). نحوه عملکرد Max_Pooling در شکل 3 مشاهده

می‌شود.
شکل 3- عملکرد لایه Max_Pooling (10)
بعد از هر لایه کانولوشن بلافاصله از یک لایه فعال‌سازی استفاده شده است که هدف آن معرفی عملیات غیر خطی به یک سیستم است که اساساً عملیات خطی را در طول لایه‌های محاسباتی، مورد محاسبه قرار داده است. در این پژوهش از لایه‌های RELU استفاده شده است؛ زیرا شبکه به‌دلیل کارآیی محاسباتی قادر به آموزش سریع‌تر بدون ایجاد تفاوت در دقت می‌باشد. نمودار عملکرد تابع فعال‌ساز RELU، در نمودار یک مشاهده می‌شود. لایه RELU تابع f(X) را به تمام تصاویر ورودی اعمال می‌کند و تمام فعالیت‌های منفی را به صفر تغییر می‌دهد. با استفاده از این لایه، خواص غیر خطی مدل و شبکه کلی بدون تأثیر در لایه‌های کانولوشن افزایش داده شده است.

نمودار 1- نمودار عملکرد تابع فعال‌ساز RELU (10)

با استفاده از لایه Dropout در حین آموزش، بر اساس احتمالی مشخص، خروجی تعدادی از نورون‌ها صفر می‌شود که با این کار عملاً یک شبکه متفاوت در دسترس است و این شبکه در مواجهه با داده‌ها بدون اتّکا به نورون‌های دیگر، ویژگی‌های قدرتمندی را کشف و استفاده می‌کند. بنابراین از تکنیک Dropout به‌منظور جلوگیری از Overfitting استفاده می‌شود. از آنجایی که در یک شبکه عمیق، تعداد پارامترها در لایه تمام‌متصل زیاد است، آموزش کند شده و در حین آموزش، احتمال عدم همگرایی زیادتر می‌شود. بنابراین، در میان لایه‌های تمام‌متصل از لایه Dropout برای کاهش پارامترها استفاده شده است. نحوه عملکرد لایه Dropout در شکل 4 آورده شده است.
شکل 4- نحوه عملکرد لایه Dropout (10)

پس از لایه کانولوشن و ادغام، تعداد زیادی صفحات ویژگی با ابعاد کوچک در اختیار داریم. با اتصال این لایه‌ها به طبقه‌بند Softmax با توجه به اینکه در مرحله آموزش برچسب تصاویر ورودی مشخص است، شبکه می‌تواند با واردکردن تمام تصاویر آموزشی و مشخص‌بودن برچسب هر کلاس، برای طبقه‌بندی تصاویر آموزش ببیند. سیستم در فرآیند آموزش به‌دنبال پیداکردن بهترین پارامترهای مجهول، از جمله وزن‌های فیلتر و ضرایب لایه‌ها می‌باشد؛ به نحوی که کمترین میزان خطا در طبقه‌بندی حاصل شود.

فرمول (1):

با در نظر گرفتن لایه Flatten خروجی، لایه‌های کانولوشن که یک تنسور چندبعدی است، به یک تنسور یک‌بعدی تبدیل می‌شود و در نهایت با استفاده از Optimizer RMSprop که برای محاسبه بسیاری از توابع بهینه‌ساز در تنسورفلو است (8)، بهینه‌سازی وزن‌ها انجام می‌شود. در مرحله آزمون، تصاویری که تداخلی با داده‌های آموزشی ندارند، به‌عنوان تصویر مورد تقاضا دریافت و با تغییر ابعاد تصویر به اندازه مشخص 300×300، تصویر به شبکه کانولوشنی عمیق با وزن‌های بهینه وارد می‌شود. در این حالت خروجی لایه‌ها به‌عنوان بردار ویژگی تصویر تقاضا مورد استفاده قرار می‌گیرد. در انتها بردار ویژگی تصویر مورد تقاضا با ماتریس ویژگی، مورد مقایسه قرار گرفته و شبکه عصبی عمیق از چند لایه برای درک بخش‌هایی از داده‌ها استفاده می‌کند؛ اما برای طبقه‌بندی داده‌ها باید مجموعه‌ای از احتمالات را برای تصمیم‌گیری نهایی داشته باشیم. Softmax یک تابع شناخته شده است که مقادیر احتمالات را در یک محدوده استاندارد (صفر تا 1) نرمالیزه می‌کند.
پایگاه داده:
مجموعه داده مورد استفاده در این پژوهش، از 70 تصویر ملانوما و 100 تصویر مربوط به خال گوشتی خوش‌خیم^{^[10]} (naevus) از آرشیو تصاویر دیجیتال گروه پوست در مرکز پزشکی دانشگاه گرونینگن^{^[11]} (UMCG) تشکیل شده است. عکس ضایعات پوستی، توسط دوربین نیکون D1x یا D3 با فاصله 33 سانتی‌متری لنز دوربین از ضایعه، تصویر‌برداری شده است. شرایط روشنایی با استفاده از دو فلاش Multiblitz Variolite 600 با دمای رنگ 5200 کلوین تنظیم شده است (13). شکل 5 نمونه‌ای از تصاویر پایگاه داده مربوط به کلاس‌های مختلف را نشان می‌دهد.

(الف)

(ب)

شکل 5- (الف) تصاویر سرطان پوست بدخیم (ملانوما) و (ب) تصاویر سرطان پوست خوش‌خیم

معیار ارزیابی:
معیار دقّت، معیار سنجشی است که میزان توانایی یک مدل در مرتبط‌نمودن نتیجه با ویژگی‌های اطلاعات موجود را مشخص می‌نماید.
جدول 1- عناصر ماتریس درهم‌ریختگی

Negative	Positive	---
اشتباه مثبت (FN)	صحیح مثبت (TP)	Positive
صحیح منفی (TN)	اشتباه مثبت(FP)	Negative

فرمول (2):

در آمار، دو شاخص دقت و صحت برای ارزیابی نتیجه یک آزمایش دسته‌بندی دودویی (دوحالته) وجود دارد؛ به عبارت دیگر، زمانی که بتوان داده‌ها را به دو گروه مثبت و منفی تقسیم کرد، دقت نتایج یک آزمایش که اطلاعات را به این دو دسته تقسیم می‌کند، با استفاده از شاخص‌های حساسیت و ویژگی قابل اندازه‌گیری و توصیف است. حساسیت[12] به معنی نسبتی از موارد مثبت است که آزمایش، آن‌ها را به‌درستی به‌عنوان مثبت علامت‌گذاری می‌کند. حساسیت و تشخیص یک آزمایش تنها به ماهیت آزمایش و نمونه‌ای که آزمایش در آن استفاده می‌شود، بستگی دارد. با این حال، فقط با استفاده از حساسیت و ویژگی نمی‌توان نتیجه یک آزمایش را تعبیر کرد.
فرمول (3):

معیار خطای طبقه‌بندی دقیقاٌ برعکس معیار دقت دسته‌بندی است که با استفاده از رابطه 4 به‌دست می‌آید. کمترین مقدار آن برابر صفر است و یا به عبارت دیگر زمانی که بیشترین و بهترین بازدهی را داریم، مقدار آن برابر یک است.
فرمول (4):

یافته‌ها
ابزار یادگیری عمیق برای شناسایی ویژگی‌های کلیدی از مجموعه داده‌های پیچیده، نشان‌دهنده اهمیت آنها در این دوره مدرن پزشکی است. در روش پیشنهادی در این پژوهش، 80 درصد از تصاویر پایگاه ‌داده برای آموزش و 20 درصد تصاویر پایگاه داده برای آزمون انتخاب می‌شود، در حالی که هیچ تداخلی بین نمونه‌های آموزش و آزمون وجود ندارد. داده‌های آموزشی با اندازه دسته 32 به شبکه عصبی عمیق ارسال می‌گردد که این شبکه در طی 100 تکرار، آموزش دیده است. مدل پیشنهادی با بهره‌گیری از یادگیری سلسله مراتبی و استخراج ویژگی‌های سطح بالا، عملکرد بهتری را نسبت به سایر روش‌ها در پی دارد. جدول 2 به مقایسه و گزارش روش‌های پیشنهادی در پایگاه ‌داده‌های مربوط به سرطان پوست می‌پردازد که نشان می‌دهد روش پیشنهادی دقت تشخیص بالاتری دارد که نسبت به روش‌های موجود باعث افزایش بیش از 10 درصد در دقت تشخیص در بسیاری از موارد گردیده است.
در نمودار 2 مدل پیشنهادی، علاوه بر دقت بالایی که برای محققان فراهم می‌آورد، در تعداد گام‌های کمتری به نتیجه نهایی مطلوب می‌رسد که این قابلیّت سرعت بالای آموزش و تست داده‌ها را نشان می‌دهد.

نمودار 2- نمودار سیر همگرایی دقت تشخیص در سرطان پوست

جدول 2- مقایسه نتایج پیشنهادی با سایر روش‌ها در سرطان پوست

نام روش	Acc (%)	Spe (%)	Recall(%)	Error Rate(%)
FNN (11)	22/87	83/95	70	78/12
Neural Network Ensembel Model (12)	11/91	95	33/83	89/8
VGG-16 VGG-19	60	-	-	40
الگوریتم k همسایه نزدیکتر	89	50/97	67/71	11
Adaboost	78/87	83/95	75	22/12
MED-NOD (13)	1/82	-	-	9/17
RBF SVM (14)	78/87	17/94	75	22/12
روش پیشنهادی	1/92	3/96	97	9/7

بحث
یادگیری عمیق به‌صورت گسترده در زمینه‌های گوناگونی از بینایی ماشین همانند: طبقه‌بندی تصاویر، تشخیص اشیا، قطعه‌بندی معنایی و بازیابی تصویر و برآورد حالت بدن انسان که فعالیت‌های کلیدی برای درک تصویر می‌باشند، مورد استفاده قرار گرفته است. دسته‌بندی تصاویر را می‌توان با استفاده از آموزش شبکه عصبی عمیق بر روی پایگاه داده‌ها انجام داد. فعالیت چشم‌گیر در حوزه یادگیری عمیق، امکان استفاده بهینه از شبکه‌های عصبی عمیق را برای محققان در پی داشته است که منجر به رشد و تعالی این زمینه در حوزه‌های متفاوت علم مهندسی شده است.
مطالعات قابل توجهی در مورد مسئله تشخیص خودکار سرطان بر روی تصاویر بافت سرطان پوست صورت گرفته است؛ این تلاش‌های تحقیقاتی، بینش ارزشمندی را در خصوص ماهیت این مسئله به ارمغان آورده است. در مطالعه Moussa و همکاران که یک پژوهش گسترده در زمینه طبقه‌بندی ضایعات پوستی می‌باشد، محققان ضایعات پوستی را به 23 کلاس متمایز طبقه‌بندی کردند و برای انجام این کار از شبکه‌های عصبی کانولوشن استفاده کردند. آنها از دو مدل VGG-16 و VGG-19 برای این منظور بهره بردند و در نهایت به دقت 60درصدی برای طبقه‌بندی کلاس‌های تعریف‌شده دست پیدا کردند (15).
برای شناسایی ملانوما نیز به‌طور خاص تحقیقات متعددی صورت گرفته است. در مطالعه Giotis و همکاران، با استفاده از ویژگی‌های هندسی ملانوما و بهره‌گیری از الگوریتم k همسایه نزدیکتر^{^[13]}، طبقه‌بندی و تمایز تصاویر مربوط به ملانوما از ضایعات خوش‌خیم صورت گرفت و با وجود مجموعه داده‌های محدود در این پژوهش، دقت 89درصدی به‌دست آمد (16). در مطالعه Jukić و همکاران، با استفاده از یک سیستم پشتیبان برای تصمیم‌گیری که MED-NOD نامیده می‌شود، ضایعات پوستی متشکل از 70 تصویر ملانوم و 100 تصویر خال گوشتی به‌طور خودکار از تصاویر دیجیتال غیرتراکمی استخراج شد و توصیف‌گر‌های مربوط به رنگ و بافت محاسبه گردید که نتایج آن در دقت تشخیص تومور، 81درصد گزارش شد (17). در مطالعه Arel و همکاران، (18) از یک روش برای استخراج ویژگی از تصاویر رنگی، به‌منظور طبقه‌بندی ضایعات پوستی استفاده شد که روش استخراج ویژگی ارائه‌شده، بر مبنای عملیات تجزیه از تصویر بالینی ضایعه پوستی بود. این روش، همزمان ویژگی‌های مکانی و طیفی تصویر را مورد بررسی قرار می‌دهد. این روش روی 180 تصویر رنگی بالینی ضایعات پوستی، شامل 90 تصویر ملانوما و 90 تصویر خال خوش‌خیم آزمایش شد که دقت 1/82درصدی به‌دست آمد.

نتیجه‌گیری
در این پژوهش به‌منظور تشخیص و طبقه‌بندی سرطان پوست در تصاویر پزشکی، سیستم اتوماتیک بر مبنای یادگیری عمیق ارائه گردید. به دلیل اینکه در روش پیشنهادی، ویژگی‌های سطح بالا توسط یادگیری عمیق استخراج می‌شود، دقت طبقه‌بندی و تشخیص بسیار بالا بود؛ همچنین اندازه بردار ویژگی نیز با کاهش همراه است و در همان گام‌های ابتدایی با سرعت بالایی دقت آموزش بالا می‌رود که منجر به کاهش فضای ذخیره‌سازی و افزایش دقت و سرعت می‌گردد.

تقدیر و تشکر

این مقاله حاصل بخشی از پایان‌نامه کارشناسی ارشد تحت عنوان «تشخیص و طبقه‌بندی سرطان سینه و روده با استفاده از یادگیری عمیق» می‌باشد. در پایان نویسندگان این مقاله مراتب تشکر و سپاس‌گزاری خود را از همه کسانی که آنها را در انجام این پژوهش یاری نمودند، اعلام می‌دارند.

تضاد منافع
نویسندگان مقاله اعلام می‌دارند که هیچ‌گونه تضاد منافعی در پژوهش حاضر وجود ندارد.

منابع:
1- Shimizu K, Iyatomi H, Celebi ME, Norton KA, Tanaka M. Four-class classification of skin lesions with task decomposition strategy. IEEE Trans Biomed Eng. 2015; 62(1):274-83.
2- Nasr-Esfahani E, Samavi S, Karimi N, Soroushmehr SMR, Jafari MH, Ward K, et al. Melanoma detection by analysis of clinical images using convolutional neural network. 38th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC); 2016 Aug 16-20; Orlando, FL, USA. IEEE; 2016.
3- American Cancer Society. Cancer Facts & Figures 2016. Atlanta, GA, USA: American Cancer Society; 2016.
4- Gautam D, Ahmed M. Melanoma detection and classification using SVM based decision support system. Annual IEEE India Conference (INDICON); 2015 Dec 17-20; New Delhi, India. IEEE; 2016.
5- Jain S, Jagtap V, Pise N. Computer aided melanoma skin cancer detection using image processing. Procedia Comput Sci. 2015; 48: 735-40.
6- Garnavi R, Aldeen M, Bailey J. Computer-aided diagnosis of melanoma using border-and wavelet-based texture analysis. IEEE Trans Inf Technol Biomed. 2012; 16(6): 1239-52.
7- Sheha MA, Mabrouk MS, Sharawy A. Automatic detection of melanoma skin cancer using texture analysis. Int J Comput Appl. 2012; 42(20): 22-6.
8- Lo SC, Lou SL, Lin JS, Freedman MT, Chien MV, Mun SK. Artificial convolution neural network techniques and applications for lung nodule detection. IEEE Trans Med Imaging. 1995; 14(4): 711-8.
9- Ji S, Xu W, Yang M, Yu K. 3D convolutional neural networks for human action recognition.    IEEE Trans Pattern Anal Mach Intell. 2013; 35(1): 221-31.
10- Litjens G, Kooi T, Bejnordi BE, Adiyoso Setio AA, Ciompi F, Ghafoorian M, et al. A survey on deep learning in medical image analysis. Med Image Anal. 2017; 42: 60-88.
11- Rajesh A. Classification of malignant melanoma and Benign Skin Lesion by using back propagation neural network and ABCD rule. 2017 IEEE International Conference on Electrical, Instrumentation and Communication Engineering (ICEICE); 2017 Apr 27-28; Karur, India. IEEE; 2017.
12- Xie F, Fan H, Li Y, Jiang Z, Meng R, Bovik A. Melanoma classification on dermoscopy images using a neural network ensemble model. IEEE Trans Med Imaging. 2017; 36(3): 849-58.
13- Premaladha J, Ravichandran KS. Novel approaches for diagnosing melanoma skin lesions through supervised and deep learning algorithms. J Med Syst. 2016; 40(4): 96.
14- Barata C, Ruela M, Francisco M, Mendonça T, Marques JS. Two systems for the detection of melanomas in dermoscopy images using texture and color features. IEEE Syst J. 2014; 8(3): 965-79.
15- Moussa R, Gerges F, Salem C, Akiki R, Falou O, Azar D. Computer-aided detection of Melanoma using geometric features. InBiomedical Engineering (MECBME). 3rd Middle East Conference on Biomedical Engineering (MECBME); 2016 Oct 6-7; Beirut, Lebanon. IEEE; 2016.
16- Giotis I, Molders N, Land S, Biehl M, Jonkman MF, Petkov N. MED-NODE: A computer-assisted melanoma diagnosis system using non-dermoscopic images. Expert Syst Appl. 2015; 42(19): 6578-85.
17- Jukić A, Kopriva I, Cichocki A. Noninvasive diagnosis of melanoma with tensor decomposition-based feature extraction from clinical color image. Biomed Signal Process Control. 2013; 8(6): 755-63.
18- Arel I, Rose DC, Karnowski TP. Deep machine learning-a new frontier in artificial intelligence research [research frontier]. IEEE Comput Intell Mag. 2010; 5(4): 13-8.

[1] Department of Electrical and Computer Engineering, University of Birjand, Birjand, Iran.

[2] Corresponding Author; Department of Electrical and Computer Engineering, University of Birjand, Birjand, Iran.
Tel: +5632202049 E-mail: s.mohamadzadeh@birjand.ac.ir

1 گروه مهندسی برق، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند، ایران

3 نویسنده مسؤول؛ گروه مهندسی برق، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند، ایران
آدرس: بیرجند ـ انتهای بلوار دانشگاه ـ پردیس شوکت آباد ـ دانشگاه بیرجند
تلفن: 05632202049 پست الکترونیکی: s.mohamadzadeh@birjand.ac.ir

[5] Melanoma

[6] Epidermis

[7] Traumatic

[8] Histology

[9] Convolutional Neural Networks

[10] Benign

[11] Groningen

[12] True Positive Rate

[13] k-Nearest Neighbours algorithm

نوع مطالعه: مقاله اصیل پژوهشی | موضوع مقاله: انكولوژي
دریافت: 1397/4/17 | پذیرش: 1397/8/5 | انتشار الکترونیک: 1397/12/26

ارسال پیام به نویسنده مسئول

بازنشر اطلاعات
	این مقاله تحت شرایط Creative Commons Attribution-NonCommercial 4.0 International License قابل بازنشر است.