1- گروه مهندسی برق، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند، ایران
2- گروه مهندسی برق، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند، ایران ، s.mohamadzadeh@birjand.ac.ir
متن کامل [PDF 423 kb]
(3800 دریافت)
|
چکیده (HTML) (7302 مشاهده)
متن کامل: (3336 مشاهده)
Abstract Original Article
Detection and Classification of Skin Cancer
Using Deep Learning
Saber Fooladi[1], Hasan Farsi1,
Sajad Mohamadzadeh[2]
Background and Aim: Skin cancer has grown dramatically over the past decades, and the importance of early treatment is increasing day by day. The purpose of this study is to use deep neural networks to create an auto-diagnosis system for melanoma, in which data is directly controlled as part of a deep learning process.
Materials and Methods: In this paper, studies on related pictures of skin cancer were performed. For the diagnosis of benign or malignant skin cancer, the deep neural network classifier is used with the help of the Tensorflow framework and the use of the Keras libraries. The dataset which are used in this study consist 70 images of melanoma and 100 images of benign moles. In the proposed model, 80% of the database images are used for training and 20% of the database images are selected for testing.
Results: The proposed method offers a higher detection accuracy than other existing methods, which has increased the accuracy of diagnosis in most cases by more than 10%. The high accuracy of the diagnosis and classification and the speed of convergence to the final result are the characteristics of this Research Compared to other Research.
Conclusion: An automatic system based on deep learning is presented to identify and categorize skin cancer which provides high accuracy and speed.
Key Words: Deep Learning; Skin Cancer; Melanoma; Deep Neural Network
Received: July 8, 2018 Accepted: October 27, 2018
Citation Fooladi S, Farsi H, Mohamadzadeh S. [Detection and Classification of Skin Cancer Using Deep Learning]. J Birjand Univ Med Sci. 2019; 26(1):44-53. [Persian]
مقاله اصیل پژوهشی
تشخیص و طبقهبندی سرطان پوست با استفاده از یادگیری عمیق
صابر فولادی[3]، حسن فرسی1، سجاد محمدزاده[4]
چکیده
زمینه و هدف: سرطان پوست در طول دهههای گذشته رشد چشمگیری داشته است و اهمیت درمان اولیه آن روز به روز در حال افزایش است. هدف از این مطالعه، استفاده از شبکههای عصبی عمیق برای ایجاد یک سیستم خودکار تشخیص ملانوما بود که در آن دادهها بهطور مستقیم بهعنوان بخشی از فرآیند یادگیری عمیق کنترل میشود.
روش تحقیق: در این پژوهش مطالعات بر روی تصاویر مربوط به سرطان پوست انجام شده است. برای تشخیص خوشخیم یا بدخیم بودن سرطان پوست از طبقهبندی کننده شبکه عصبی عمیق به کمک فریمورک تنسورفلو و بهرهگیری از کتابخانه کراس استفاده شده است. مجموعه داده مورد استفاده در این پژوهش از 70 تصویر ملانوما و 100 تصویر مربوط به خال گوشتی خوش خیم تشکیل شده است. در مدل پیَشنهادی این پژوهش 80 درصد از تصاویر پایگاهداده برای آموزش و 20 درصد تصاویر پایگاه داده برای آزمون انتخاب میشود،.
یافتهها: روش پیشنهادی، دقت تشخیص بالاتری دارد که نسبت به روشهای موجود باعث افزایش بیش از 10درصد در دقت تشخیص در بسیاری از موارد گردیده است. دقت بالای تشخیص و طبقهبندی و سرعت بالای همگرایی به نتیجه نهایی، از ویژگیهای این پژوهش نسبت به سایر تحقیقات است.
نتیجهگیری: سیستم اتوماتیک تشخیص و طبقهبندی سرطان پوست بر مبنای یادگیری عمیق، با دقت و سرعت مطلوبی ارائه میشود.
واژههای کلیدی: یادگیری عمیق؛ سرطان پوست؛ ملانوما؛ شبکه عصبی عمیق
مجله علمی دانشگاه علوم پزشکی بیرجند. 1398؛ 26(1): 44-53.
دریافت: 17/04/1397 پذیرش: 05/08/1397
مقدمه
سرطان پوست در طول دهههای گذشته رشد چشمگیری داشته و اهمیت درمان اولیه آن روز به روز در حال افزایش است. ملانوما[5] سومین نوع رایج سرطان پوست و یکی از سرطانهای بدخیم است (1). ملانوما همچنین بهعنوان ملانوم بدخیم نیز نامیده میشود که بهعلت عملکرد غیرطبیعی سلولهای تولیدکننده رنگدانه، رنگ پوست را تغییر میدهد (2). این بیماری از تجمع دانههای ملانین و سرایت آن به خارجیترین لایه پوست شکل میگیرد. با وجود مرگ و میر قابل توجه، ملانوما در مراحل اولیه تشخیص، در اغلب موارد قابل درمان است (3). در همین حال تمایز بین ملانوما و خالهای خوشخیم دیگر، در مراحل اولیه رشد یک کار چالشبرانگیز حتی برای متخصصان پوستی است (1).
رشد سرطان پوست زمانی آغاز میشود که آسیبهای ناشی از سلولهای پوست (اغلب ناشی از اشعه ماوراء بنفش) باعث جهشهایی میشود که سلولهای پوست را بهسرعت تکثیر داده و تومورهای بدخیم را تشکیل میدهد. بهطور معمول، سلولهای پوستی بهصورت کنترلشده و منظم رشد میکنند؛ اما برخی از سلولهای تازه تولیدشده ممکن است رشد غیر قابل کنترل داشته باشند و یک توده سلولهای سرطانی ایجاد کنند (4). تغییر در شکل، اندازه و رنگ در خال یک فرد، اغلب از اولین علائم ملانوماست. ملانوما، حاشیه سیاه یا آبی متمایل به سیاه دارد؛ همچنین ملانوما به شکل خالهای جدید سیاه و با ظاهری غیرطبیعی ظاهر میشود (5). این تومورهای تولیدکننده رنگدانه، در لایه سطحی پوست (اپیدرم[6]) وجود دارند (1).
تشخیص سرطان پوست بهدلیل ظاهر انواع مختلف ضایعات پوستی بهخصوص Melanoma و Nevi برای تمایز دشوار است. حتی با درموسکوپی (Dermoscopy) که یک تکنیک آزمایشی غیر تهاجمی است، دقت تشخیص ملانوم توسط متخصصان پوست 84-75 درصد میباشد. با این حال نمونهبرداری، تشخیص بهتری را فراهم میکند که تنها بر اساس جراحی امکانپذیر بوده که این عملیات تهاجمی[7] تجربه ناخوشایندی را برای بیمار در پی دارد (1). برای جلوگیری از نمونهبرداری غیرضروری، محققان روشهای غیرتهاجمی متعددی را برای تشخیص ملانوما بررسی کردهاند (7، 6). این روشها معمولاً شامل سه مرحله میباشند: 1) شناسایی مرز (محدوده) پوست، 2) استخراج ویژگی و 3) طبقهبندی. فرآیند تشخیص مرز، تومور را در تصاویر مربوط به پوست تشخیص میدهد که برای طبقهبندی دقیق ضایعات پوستی ضروری است. فرآیند استخراج ویژگی، ویژگیهای تصویری مانند: رنگ، شکل توده و اطلاعات بافت[8] را برای طبقهبندی استفاده میکند. فرآیند طبقهبندی نیز نوع ضایعات پوستی را از ویژگیهای تصویر استخراج میکند و عملیات طبقهبندی را انجام میدهد که بعضی از این نوع طبقهبندیها عبارتند از: طبقهبندیکنندههای خطی، KNN، شبکههای عصبی مصنوعی.
ساختار این مقاله به این شرح است که در بخش دوم، مدل و روش پیشنهادی معرفی میشود؛ در بخش سوم تجربیات این پژوهش گزارش داده میشود؛ در بخش چهارم به مرور برخی کارهای انجامگرفته در این زمینه پرداخته میشود و سرانجام در بخش پنجم با نتیجهگیری، این پژوهش به پایان میرسد.
روش تحقیق
از فناوریهای یادگیری عمیق، شبکههای عصبی کانولوشن (CNNs)[9] در زمینه تصاویر پزشکی، از محبوبیت بالاتری برخوردار هستند. بیشتر تکنولوژیهای یادگیری عمیق مربوط به غربالگری سرطان، بر اساس
CNNها میباشند. بهکارگیری شبکههای عصبی کانولوشن از اواخر دهه 1970 آغاز شده و از سال 1995 به تجزیه و تحلیل تصاویر پزشکی اعمال شده است (8). یادگیری عمیق، یک روش جدید برای اعمال یادگیری ماشین است؛ زیرا براساس یادگیری دادههاست. شبکههای عصبی کانولوشن عمیق، یک نوع روش یادگیری عمیق میباشند که در آن فیلترها قابل تعویض هستند و عملیات ادغام بر روی تصاویر ورودی اعمال میشود و مجموعهای سطح بالا از ویژگیها را بهصورت خودکار استخراج میکند (9). استخراج سطح بالای این ویژگیها باعث میشود تا مفاهیم گسترده و پیچیده به مفاهیم سادهتری تقسیم شود که این مفاهیم ساده، ماشین را قادر به تصمیمگیری برای آنها میسازد و بدینترتیب نیازی به نظارت کامل انسان برای مشخصکردن اطلاعات لازم ماشین در هر لحظه نیست. در یادگیری عمیق، ویژگیهای غیرخطی چندین لایه استخراج میشوند و به یک دستهبند اعمال شده و آن هم این ویژگیها را با هم ترکیب میکند تا بتواند یک پیشبینی انجام دهد.
در این پژوهش، مطالعات بر روی تصاویر سرطان پوست انجام شده است. برای تشخیص خوشخیم یا بدخیم بودن سرطان پوست، از طبقهبند شبکه عصبی عمیق به کمک ساختار تنسورفلو (Tensorflow) و بهرهگیری از کتابخانه کراس (Keras) استفاده شده است. اولین مرحله در روش پیشنهادی، پیشپردازش تصاویر پایگاه داده میباشد که در این مرحله آثاری که میتواند شبکه عصبی پیچیده را گمراه کند، کاهش مییابد. تصاویر پیشپردازششده پس از کلاسبندی، در مرحله دوم به یک شبکه عصبی عمیق در مرحله بعد وارد میشوند و با استفاده از معماری خاص شبکه عصبی عمیق پیشنهادی، مراحل آموزش و تست بر روی تصاویر اعمال میگردد. تصاویر سطح پوست حتی از طریق دوربینهای دیجیتال حرفهای، دارای نور و اثرات نویز هستند که باید حذف شوند. این اثرات ناشی از نور و نویز غیرمتعارف، از عوامل گمراهکننده در آموزش و طبقهبندی شبکه عصبی عمیق بر روی تصاویر ورودی است. پیکسلهای با فرکانس بالا، اثرات نویزی مخرّب بر روی تصاویر را در پی دارد که با استفاده از یک فیلتر پایینگذر به کاهش اثر نویز در تصاویر پزشکی پایگاه داده مورد نظر پرداخته میشود. در معماری پیشنهادی در این پژوهش، تصاویری با ابعاد ثابت در ورودی مورد نیاز است؛ به همین دلیل پیش از آموزش، تصاویر به ابعاد ثابت 300×300 تغییر اندازه داده میشود. در شکل یک، نمونهای از تصویر پیشپردازش شده از پایگاه داده مورد استفاده برای دورکردن شبکه از عوامل گمراهکننده شدت نور و اثرات نویز، نشان داده شده است.
|
|
|
شکل 1- نمونهای از تصویر پیشپردازش شده
آموزش شبکه در واقع حداقلکردن تابع خطا بر حسب خروجیهای واقعی شبکه در مقایسه با خروجیهای مطلوب شبکه است. این کار از طریق اصلاح پارامترهای آزاد شبکه یعنی وزنها و بایاسها صورت میگیرد. روش آموزش مورد استفاده در ساختار پیشنهاد فعلی، روش آموزش همراه با ناظر است. در این روش یک سرپرست بر رفتار یادگیرنده نظارت میکند و نحوه عملکرد صحیح را به او یادآور میشود؛ به بیانی دیگر، به سیستم یادگیرنده، مجموعهای از زوجهای داده متشکل از ورودی شبکه و خروجی مطلوب اعمال میشود. پس از اعمال ورودی شبکه، خروجی آن با خروجی مطلوب مقایسه شده و سپس خطای یادگیری محاسبه و از آن برای تنظیم پارامترهای شبکه به گونهای استفاده میشود که اگر بهطور مجدد به شبکه همان ورودی اعمال گردد، خروجی شبکه به خروجی مطلوب نزدیکتر گردد. پارامترهای شبکه را میتوان به دو طریق آموزش داد: آموزش پس از هر نمونه آموزشی که به آن روش آموزش «ترتیبی یا تصادفی» گویند و یا اینکه پس از اعمال تمام نمونههای آموزشی، بروزرسانی پارامترها انجام شود که آن را روش آموزش «دستهای» میگویند. روش اول، حافظه کمتری نیاز دارد، ولی پایداری آن نیز پایینتر است؛ زیرا هر نمونه آموزشی میتواند پارامترهای شبکه را به سمت جدیدی هدایت کند. اما روش دوم با وجود اینکه نیازمند حافظه بالاتری است، چون باید تغییرات در پارامترها را ذخیرهسازی کند، پایداری بیشتری خواهد داشت. بنابراین در ادامه از روش آموزش دستهای استفاده میکنیم. در این پژوهش دستههایی با اندازه 32 برای آموزش تصاویر پایگاه داده مورد استفاده قرار گرفته است.
در معماری شبکه عصبی عمیق این پژوهش، از سه لایه کانولوشن و سه لایه ادغام ماکزیمم (Max_pooling) استفاده شده است که در شکل 2 شمای کلی این معماری نمایش داده شده است. لایه کانولوشن، هسته اصلی تشکیلدهنده شبکه عصبی کانولوشن است و توده خروجی آن را میتوان بهصورت یک توده سهبعدی از نورونها تفسیر کرد.
کانولوشن، یک عملیات ریاضی برای پردازش سیگنال است که از این طریق توسط نورونها، عملیات کانولوشن به ورودیها اعمال میگردد. مهمترین پارامتر در نورونهای کانولوشن اندازه فیلتر است که در مدل پیشنهادی برای طبقهبندی سرطان پوست، از سه لایه کانولوشن با ابعاد فیلتر 32×32، 64×64 و 128×128 استفاده شده است که در این حالت، عمق آن با عمق تصویر برابر است. کانولوشن، یک عملیات ریاضی برای پردازش سیگنال است که از این طریق، توسط نورونها، عملیات کانولوشن به ورودیها اعمال میگردد. مهمترین پارامتر در نورونهای کانولوشن، اندازه فیلتر میباشد. بعد از لایه کانولوشن برای کاهش اندازه فضایی (فقط عرض و ارتفاع نه عمق) از لایه ادغام استفاده شده و تعداد پارامترها کاهش یافته است که منجر به کاهش محاسبات و افزایش سرعت میگردد. لایههای ادغام باعث کاهش نمونههای خروجی فیلتر میشوند. در این پژوهش از Max_Pooling با اندازه فیلتر 2×2 استفاده شده است. در واقع هدف اصلی این لایه Subsample تصویر ورودی بهمنظور کاهش بار محاسباتی، حافظه و تعداد پارامترهاست.
کاهش اندازه تصویر ورودی همچنین باعث کاهش حساسیت شبکه عصبی میشود. در لایه ادغام مانند لایه کانولوشن، هر نورون به خروجی تعداد محدودی از نورونها در لایه قبل متصل است. بهمنظور کاهش ابعاد و افزایش سرعت محاسبات، از لایه ادغام بهمنظور نمونهبرداری استفاده میشود. در این پژوهش لایه ادغام که با اندازه پنجره 2×2 روی تصویر گام برمیدارد، از میان 4 پیکسل موجود در این پنجره، پیکسل ماکزیمم را انتخاب و به لایه بعد منتقل میکند (10). نحوه عملکرد Max_Pooling در شکل 3 مشاهده
میشود.
شکل 3- عملکرد لایه Max_Pooling (10)
بعد از هر لایه کانولوشن بلافاصله از یک لایه فعالسازی استفاده شده است که هدف آن معرفی عملیات غیر خطی به یک سیستم است که اساساً عملیات خطی را در طول لایههای محاسباتی، مورد محاسبه قرار داده است. در این پژوهش از لایههای RELU استفاده شده است؛ زیرا شبکه بهدلیل کارآیی محاسباتی قادر به آموزش سریعتر بدون ایجاد تفاوت در دقت میباشد. نمودار عملکرد تابع فعالساز RELU، در نمودار یک مشاهده میشود. لایه RELU تابع f(X) را به تمام تصاویر ورودی اعمال میکند و تمام فعالیتهای منفی را به صفر تغییر میدهد. با استفاده از این لایه، خواص غیر خطی مدل و شبکه کلی بدون تأثیر در لایههای کانولوشن افزایش داده شده است.
نمودار 1- نمودار عملکرد تابع فعالساز RELU (10)
با استفاده از لایه Dropout در حین آموزش، بر اساس احتمالی مشخص، خروجی تعدادی از نورونها صفر میشود که با این کار عملاً یک شبکه متفاوت در دسترس است و این شبکه در مواجهه با دادهها بدون اتّکا به نورونهای دیگر، ویژگیهای قدرتمندی را کشف و استفاده میکند. بنابراین از تکنیک Dropout بهمنظور جلوگیری از Overfitting استفاده میشود. از آنجایی که در یک شبکه عمیق، تعداد پارامترها در لایه تماممتصل زیاد است، آموزش کند شده و در حین آموزش، احتمال عدم همگرایی زیادتر میشود. بنابراین، در میان لایههای تماممتصل از لایه Dropout برای کاهش پارامترها استفاده شده است. نحوه عملکرد لایه Dropout در شکل 4 آورده شده است.
شکل 4- نحوه عملکرد لایه Dropout (10)
پس از لایه کانولوشن و ادغام، تعداد زیادی صفحات ویژگی با ابعاد کوچک در اختیار داریم. با اتصال این لایهها به طبقهبند Softmax با توجه به اینکه در مرحله آموزش برچسب تصاویر ورودی مشخص است، شبکه میتواند با واردکردن تمام تصاویر آموزشی و مشخصبودن برچسب هر کلاس، برای طبقهبندی تصاویر آموزش ببیند. سیستم در فرآیند آموزش بهدنبال پیداکردن بهترین پارامترهای مجهول، از جمله وزنهای فیلتر و ضرایب لایهها میباشد؛ به نحوی که کمترین میزان خطا در طبقهبندی حاصل شود.
فرمول (1):
با در نظر گرفتن لایه Flatten خروجی، لایههای کانولوشن که یک تنسور چندبعدی است، به یک تنسور یکبعدی تبدیل میشود و در نهایت با استفاده از Optimizer RMSprop که برای محاسبه بسیاری از توابع بهینهساز در تنسورفلو است (8)، بهینهسازی وزنها انجام میشود. در مرحله آزمون، تصاویری که تداخلی با دادههای آموزشی ندارند، بهعنوان تصویر مورد تقاضا دریافت و با تغییر ابعاد تصویر به اندازه مشخص 300×300، تصویر به شبکه کانولوشنی عمیق با وزنهای بهینه وارد میشود. در این حالت خروجی لایهها بهعنوان بردار ویژگی تصویر تقاضا مورد استفاده قرار میگیرد. در انتها بردار ویژگی تصویر مورد تقاضا با ماتریس ویژگی، مورد مقایسه قرار گرفته و شبکه عصبی عمیق از چند لایه برای درک بخشهایی از دادهها استفاده میکند؛ اما برای طبقهبندی دادهها باید مجموعهای از احتمالات را برای تصمیمگیری نهایی داشته باشیم. Softmax یک تابع شناخته شده است که مقادیر احتمالات را در یک محدوده استاندارد (صفر تا 1) نرمالیزه میکند.
پایگاه داده:
مجموعه داده مورد استفاده در این پژوهش، از 70 تصویر ملانوما و 100 تصویر مربوط به خال گوشتی خوشخیم[10] (naevus) از آرشیو تصاویر دیجیتال گروه پوست در مرکز پزشکی دانشگاه گرونینگن[11] (UMCG) تشکیل شده است. عکس ضایعات پوستی، توسط دوربین نیکون D1x یا D3 با فاصله 33 سانتیمتری لنز دوربین از ضایعه، تصویربرداری شده است. شرایط روشنایی با استفاده از دو فلاش Multiblitz Variolite 600 با دمای رنگ 5200 کلوین تنظیم شده است (13). شکل 5 نمونهای از تصاویر پایگاه داده مربوط به کلاسهای مختلف را نشان میدهد.
شکل 5- (الف) تصاویر سرطان پوست بدخیم (ملانوما) و (ب) تصاویر سرطان پوست خوشخیم
معیار ارزیابی:
معیار دقّت، معیار سنجشی است که میزان توانایی یک مدل در مرتبطنمودن نتیجه با ویژگیهای اطلاعات موجود را مشخص مینماید.
جدول 1- عناصر ماتریس درهمریختگی
Negative |
Positive |
--- |
اشتباه مثبت (FN) |
صحیح مثبت (TP) |
Positive |
صحیح منفی (TN) |
اشتباه مثبت(FP) |
Negative |
فرمول (2):
در آمار، دو شاخص دقت و صحت برای ارزیابی نتیجه یک آزمایش دستهبندی دودویی (دوحالته) وجود دارد؛ به عبارت دیگر، زمانی که بتوان دادهها را به دو گروه مثبت و منفی تقسیم کرد، دقت نتایج یک آزمایش که اطلاعات را به این دو دسته تقسیم میکند، با استفاده از شاخصهای حساسیت و ویژگی قابل اندازهگیری و توصیف است. حساسیت[12] به معنی نسبتی از موارد مثبت است که آزمایش، آنها را بهدرستی بهعنوان مثبت علامتگذاری میکند
. حساسیت و تشخیص یک آزمایش تنها به ماهیت آزمایش و نمونهای که آزمایش در آن استفاده میشود، بستگی دارد. با این حال، فقط با استفاده از حساسیت و ویژگی نمیتوان نتیجه یک آزمایش را تعبیر کرد.
فرمول (3):
معیار خطای طبقهبندی دقیقاٌ برعکس معیار دقت دستهبندی است که با استفاده از رابطه 4 بهدست میآید. کمترین مقدار آن برابر صفر است و یا به عبارت دیگر زمانی که بیشترین و بهترین بازدهی را داریم، مقدار آن برابر یک است.
فرمول (4):
یافتهها
ابزار یادگیری عمیق برای شناسایی ویژگیهای کلیدی از مجموعه دادههای پیچیده، نشاندهنده اهمیت آنها در این دوره مدرن پزشکی است. در روش پیشنهادی در این پژوهش، 80 درصد از تصاویر پایگاه داده برای آموزش و 20 درصد تصاویر پایگاه داده برای آزمون انتخاب میشود، در حالی که هیچ تداخلی بین نمونههای آموزش و آزمون وجود ندارد. دادههای آموزشی با اندازه دسته 32 به شبکه عصبی عمیق ارسال میگردد که این شبکه در طی 100 تکرار، آموزش دیده است. مدل پیشنهادی با بهرهگیری از یادگیری سلسله مراتبی و استخراج ویژگیهای سطح بالا، عملکرد بهتری را نسبت به سایر روشها در پی دارد. جدول 2 به مقایسه و گزارش روشهای پیشنهادی در پایگاه دادههای مربوط به سرطان پوست میپردازد که نشان میدهد روش پیشنهادی دقت تشخیص بالاتری دارد که نسبت به روشهای موجود باعث افزایش بیش از 10 درصد در دقت تشخیص در بسیاری از موارد گردیده است.
در نمودار 2 مدل پیشنهادی، علاوه بر دقت بالایی که برای محققان فراهم میآورد، در تعداد گامهای کمتری به نتیجه نهایی مطلوب میرسد که این قابلیّت سرعت بالای آموزش و تست دادهها را نشان میدهد.
نمودار 2- نمودار سیر همگرایی دقت تشخیص در سرطان پوست
جدول 2- مقایسه نتایج پیشنهادی با سایر روشها در سرطان پوست
نام روش |
Acc (%) |
Spe (%) |
Recall(%) |
Error Rate(%) |
FNN (11) |
22/87 |
83/95 |
70 |
78/12 |
Neural Network Ensembel Model (12) |
11/91 |
95 |
33/83 |
89/8 |
VGG-16 VGG-19 |
60 |
- |
- |
40 |
الگوریتم k همسایه نزدیکتر |
89 |
50/97 |
67/71 |
11 |
Adaboost |
78/87 |
83/95 |
75 |
22/12 |
MED-NOD (13) |
1/82 |
- |
- |
9/17 |
RBF SVM (14) |
78/87 |
17/94 |
75 |
22/12 |
روش پیشنهادی |
1/92 |
3/96 |
97 |
9/7 |
بحث
یادگیری عمیق بهصورت گسترده در زمینههای گوناگونی از بینایی ماشین همانند: طبقهبندی تصاویر، تشخیص اشیا، قطعهبندی معنایی و بازیابی تصویر و برآورد حالت بدن انسان که فعالیتهای کلیدی برای درک تصویر میباشند، مورد استفاده قرار گرفته است. دستهبندی تصاویر را میتوان با استفاده از آموزش شبکه عصبی عمیق بر روی پایگاه دادهها انجام داد. فعالیت چشمگیر در حوزه یادگیری عمیق، امکان استفاده بهینه از شبکههای عصبی عمیق را برای محققان در پی داشته است که منجر به رشد و تعالی این زمینه در حوزههای متفاوت علم مهندسی شده است.
مطالعات قابل توجهی در مورد مسئله تشخیص خودکار سرطان بر روی تصاویر بافت سرطان پوست صورت گرفته است؛ این تلاشهای تحقیقاتی، بینش ارزشمندی را در خصوص ماهیت این مسئله به ارمغان آورده است. در مطالعه Moussa و همکاران که یک پژوهش گسترده در زمینه طبقهبندی ضایعات پوستی میباشد، محققان ضایعات پوستی را به 23 کلاس متمایز طبقهبندی کردند و برای انجام این کار از شبکههای عصبی کانولوشن استفاده کردند. آنها از دو مدل VGG-16 و VGG-19 برای این منظور بهره بردند و در نهایت به دقت 60درصدی برای طبقهبندی کلاسهای تعریفشده دست پیدا کردند (15).
برای شناسایی ملانوما نیز بهطور خاص تحقیقات متعددی صورت گرفته است. در مطالعه Giotis و همکاران، با استفاده از ویژگیهای هندسی ملانوما و بهرهگیری از الگوریتم k همسایه نزدیکتر[13]، طبقهبندی و تمایز تصاویر مربوط به ملانوما از ضایعات خوشخیم صورت گرفت و با وجود مجموعه دادههای محدود در این پژوهش، دقت 89درصدی بهدست آمد (16). در مطالعه Jukić و همکاران، با استفاده از یک سیستم پشتیبان برای تصمیمگیری که MED-NOD نامیده میشود، ضایعات پوستی متشکل از 70 تصویر ملانوم و 100 تصویر خال گوشتی بهطور خودکار از تصاویر دیجیتال غیرتراکمی استخراج شد و توصیفگرهای مربوط به رنگ و بافت محاسبه گردید که نتایج آن در دقت تشخیص تومور، 81درصد گزارش شد (17). در مطالعه Arel و همکاران، (18) از یک روش برای استخراج ویژگی از تصاویر رنگی، بهمنظور طبقهبندی ضایعات پوستی استفاده شد که روش استخراج ویژگی ارائهشده، بر مبنای عملیات تجزیه از تصویر بالینی ضایعه پوستی بود. این روش، همزمان ویژگیهای مکانی و طیفی تصویر را مورد بررسی قرار میدهد. این روش روی 180 تصویر رنگی بالینی ضایعات پوستی، شامل 90 تصویر ملانوما و 90 تصویر خال خوشخیم آزمایش شد که دقت 1/82درصدی بهدست آمد.
نتیجهگیری
در این پژوهش بهمنظور تشخیص و طبقهبندی سرطان پوست در تصاویر پزشکی، سیستم اتوماتیک بر مبنای یادگیری عمیق ارائه گردید. به دلیل اینکه در روش پیشنهادی، ویژگیهای سطح بالا توسط یادگیری عمیق استخراج میشود، دقت طبقهبندی و تشخیص بسیار بالا بود؛ همچنین اندازه بردار ویژگی نیز با کاهش همراه است و در همان گامهای ابتدایی با سرعت بالایی دقت آموزش بالا میرود که منجر به کاهش فضای ذخیرهسازی و افزایش دقت و سرعت میگردد.
تقدیر و تشکر
این مقاله حاصل بخشی از پایاننامه کارشناسی ارشد تحت عنوان «تشخیص و طبقهبندی سرطان سینه و روده با استفاده از یادگیری عمیق» میباشد. در پایان نویسندگان این مقاله مراتب تشکر و سپاسگزاری خود را از همه کسانی که آنها را در انجام این پژوهش یاری نمودند، اعلام میدارند.
تضاد منافع
نویسندگان مقاله اعلام میدارند که هیچگونه تضاد منافعی در پژوهش حاضر وجود ندارد.
منابع:
1- Shimizu K, Iyatomi H, Celebi ME, Norton KA, Tanaka M. Four-class classification of skin lesions with task decomposition strategy. IEEE Trans Biomed Eng. 2015; 62(1):274-83.
2- Nasr-Esfahani E, Samavi S, Karimi N, Soroushmehr SMR, Jafari MH, Ward K, et al. Melanoma detection by analysis of clinical images using convolutional neural network. 38th Annual International Conference of the IEEE Engineering in Medicine and Biology Society (EMBC); 2016 Aug 16-20; Orlando, FL, USA. IEEE; 2016.
3- American Cancer Society. Cancer Facts & Figures 2016. Atlanta, GA, USA: American Cancer Society; 2016.
4- Gautam D, Ahmed M. Melanoma detection and classification using SVM based decision support system. Annual IEEE India Conference (INDICON); 2015 Dec 17-20; New Delhi, India. IEEE; 2016.
5- Jain S, Jagtap V, Pise N. Computer aided melanoma skin cancer detection using image processing. Procedia Comput Sci. 2015; 48: 735-40.
6- Garnavi R, Aldeen M, Bailey J. Computer-aided diagnosis of melanoma using border-and wavelet-based texture analysis. IEEE Trans Inf Technol Biomed. 2012; 16(6): 1239-52.
7- Sheha MA, Mabrouk MS, Sharawy A. Automatic detection of melanoma skin cancer using texture analysis. Int J Comput Appl. 2012; 42(20): 22-6.
8- Lo SC, Lou SL, Lin JS, Freedman MT, Chien MV, Mun SK. Artificial convolution neural network techniques and applications for lung nodule detection. IEEE Trans Med Imaging. 1995; 14(4): 711-8.
9- Ji S, Xu W, Yang M, Yu K. 3D convolutional neural networks for human action recognition. IEEE Trans Pattern Anal Mach Intell. 2013; 35(1): 221-31.
10- Litjens G, Kooi T, Bejnordi BE, Adiyoso Setio AA, Ciompi F, Ghafoorian M, et al. A survey on deep learning in medical image analysis. Med Image Anal. 2017; 42: 60-88.
11- Rajesh A. Classification of malignant melanoma and Benign Skin Lesion by using back propagation neural network and ABCD rule. 2017 IEEE International Conference on Electrical, Instrumentation and Communication Engineering (ICEICE); 2017 Apr 27-28; Karur, India. IEEE; 2017.
12- Xie F, Fan H, Li Y, Jiang Z, Meng R, Bovik A. Melanoma classification on dermoscopy images using a neural network ensemble model. IEEE Trans Med Imaging. 2017; 36(3): 849-58.
13- Premaladha J, Ravichandran KS. Novel approaches for diagnosing melanoma skin lesions through supervised and deep learning algorithms. J Med Syst. 2016; 40(4): 96.
14- Barata C, Ruela M, Francisco M, Mendonça T, Marques JS. Two systems for the detection of melanomas in dermoscopy images using texture and color features. IEEE Syst J. 2014; 8(3): 965-79.
15- Moussa R, Gerges F, Salem C, Akiki R, Falou O, Azar D. Computer-aided detection of Melanoma using geometric features. InBiomedical Engineering (MECBME). 3rd Middle East Conference on Biomedical Engineering (MECBME); 2016 Oct 6-7; Beirut, Lebanon. IEEE; 2016.
16- Giotis I, Molders N, Land S, Biehl M, Jonkman MF, Petkov N. MED-NODE: A computer-assisted melanoma diagnosis system using non-dermoscopic images. Expert Syst Appl. 2015; 42(19): 6578-85.
17- Jukić A, Kopriva I, Cichocki A. Noninvasive diagnosis of melanoma with tensor decomposition-based feature extraction from clinical color image. Biomed Signal Process Control. 2013; 8(6): 755-63.
18- Arel I, Rose DC, Karnowski TP. Deep machine learning-a new frontier in artificial intelligence research [research frontier]. IEEE Comput Intell Mag. 2010; 5(4): 13-8.
[1] Department of Electrical and Computer Engineering, University of Birjand, Birjand, Iran.
[2] Corresponding Author; Department of Electrical and Computer Engineering, University of Birjand, Birjand, Iran.
Tel: +5632202049 E-mail: s.mohamadzadeh@birjand.ac.ir
1 گروه مهندسی برق، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند، ایران
3 نویسنده مسؤول؛ گروه مهندسی برق، دانشکده مهندسی برق و کامپیوتر، دانشگاه بیرجند، ایران
آدرس: بیرجند ـ انتهای بلوار دانشگاه ـ پردیس شوکت آباد ـ دانشگاه بیرجند
تلفن: 05632202049 پست الکترونیکی: s.mohamadzadeh@birjand.ac.ir
[9] Convolutional Neural Networks
[13] k-Nearest Neighbours algorithm
نوع مطالعه:
مقاله اصیل پژوهشی |
موضوع مقاله:
انكولوژي دریافت: 1397/4/17 | پذیرش: 1397/8/5 | انتشار الکترونیک: 1397/12/26