مدلسازی پیش‌بینی‌کننده داده‌محور اینده نگری موادمعدنی با استفاده از یادگیری ماشین و روش‌های یادگیری عمیق

مدل‌سازی پیش‌بینی‌کننده داده‌محور اینده نگری مواد معدنی با استفاده از یادگیری ماشین و روش‌های یادگیری عمیق: مطالعه موردی از استان جیانگشی جنوبی، چین

چکیده

مدل‌سازی پیش‌بینی آینده‌نگری مواد معدنی، یک روش مهم، اما چالش برانگیز برای تعیین اهداف آینده‌نگری کشف‌نشده در اکتشاف معدنی، با پیشرفت‌های اخیر تکنیک‌های مدل‌سازی فضایی و الگوریتم‌های یادگیری ماشین تحریک شده است. در این مطالعه، مجموعه‌ای از روش‌های یادگیری ماشین، از جمله جنگل تصادفی (RF)، ماشین بردار پشتیبان (SVM)، شبکه عصبی مصنوعی (ANN)، و یک شبکه عصبی پیچیده یادگیری عمیق (CNN)، برای انجام یک مدل‌سازی داده آینده‌نگری W در استان جیانگشی جنوبی، چین استفاده شد.

در مجموع 118 رویدادw شناخته شده به دست آمده از اکتشاف طولانی مدت این منطقه متروکه و هشت لایه شامل شواهدی از اطلاعات زمین شناسی چند منبع مرتبط با کانی سازی W ،مجموعه داده‌های ورودی را تشکیل می‌دهند. این اطلاعات یک پایه غنی از داده برای آموزش مدل‌های یادگیری ماشینی فراهم کرد. پیکربندی بهینه پارامترهای مدل با یک روش جستجوی شبکه آموزش داده شد و با اعتبارسنجی متقابل 10 برابری تأیید شد. مدل‌های پیش‌بینی‌کننده به‌طور جامع توسط یک ماتریس درهم ریختگی، منحنی مشخصه عملکرد گیرنده و منحنی نرخ موفقیت ارزیابی شدند.

نتایج مدل‌سازی نشان می‌دهد که مدل CNN بهترین عملکرد طبقه‌بندی را با دقت 92.38 درصد به دست می‌آورد و پس از آن مدل RF (87.62 درصد) قرار دارد. در مقابل، مدل RF از بقیه مدل‌های ML در عملکرد پیش‌بینی کلی و کارایی پیش‌بینی برتری دارد. این با بیشترین مقدار مساحت زیر منحنی و تندترین شیب منحنی نرخ موفقیت مشخص می‌شود. مدل RF به عنوان مدل بهینه برای آینده نگری مواد معدنی در این منطقه انتخاب شد زیرا بهترین پیش بینی کننده است.

مناطق آینده نگری مشخص شده توسط نقشه چشم انداز 9 درصد از منطقه مورد مطالعه را اشغال کرده و 66.95 درصد از رخدادهای معدنی شناخته شده را به خود اختصاص داده اند. تفسیر زمین‌شناسی مدل نشان می‌دهد که انومالی‌های منگنز قبلاً نادیده گرفته شده، شاخص‌های مهمی هستند. این نشان می‌دهد که غنی سازی مواد معدنی در سنگ‌های میزبان ممکن است نقش مهمی در فرآیند تشکیل ولفرامیت داشته باشد و می‌تواند یک معیار اکتشافی نوآورانه برای اکتشاف بیشتر در این منطقه باشد.

مقدمه

مدلسازی آینده‌نگری معدنی (MPM) که به عنوان نقشه برداری معدنی نیز شناخته می‌شود، با هدف ترسیم و اولویت‌بندی مناطق آینده نگر برای اکتشاف ذخایر معدنی کشف نشده از یک نوع خاص است .اساساً، مدل‌سازی آینده نگری فرآیند ایجاد یک تابع یکپارچه‌سازی است که مجموعه‌ای از ویژگی‌های زمین‌شناسی (متغیرهای ورودی) را با حضور ذخایر معدنی مورد نظر (متغیرهای خروجی) مرتبط می‌کند. این فرآیند شامل دو مرحله کلیدی است:

(الف) تولید نقشه‌های مشهود منطقی که نشان‌دهنده پروکسی‌های فضایی فرآیندهای تشکیل سنگ بر اساس مدل مفهومی که از مجموعه داده‌های اکتشاف از نوع کانسار و در دسترس است به دست امده است (به عنوان مثال، زمین‌شناسی، ژئوفیزیک، ژئوشیمیایی). و داده‌های سنجش از دور) و

(ب) یکپارچه‌سازی و وزن دهی نقشه‌های مشهود با استفاده از الگوریتم‌های ریاضی متنوع برای ایجاد تابعی که وقوع ذخایر معدنی را تقریب می‌کند. دو دسته اصلی از مدل‌های MPM بر اساس تخصیص وزن‌های شواهد در مرحله دوم تعریف می‌شوند:

(1) مدل‌های دانش محور که نقشه‌های مشهود را به صورت اکتشافی بر اساس دانش متخصصان وزن می‌کنند، و
(2) مدل‌های مبتنی بر داده که وزن‌های شواهد را به صورت تجربی تعیین می‌کنند. در مورد رابطه فضایی بین نقشه‌های مشهود و ذخایر معدنی شناخته شده.

مدل‌های ترکیبی با در نظر گرفتن قضاوت کارشناسان و ذخایر معدنی موجود نیز توسط برخی از محققین پیشنهاد و اعمال شده است. به طور کلی، مدل‌های MPM مبتنی بر دانش برای مناطقی که کمتر کاوش‌شده (یا حوزه بکر) انجام می‌شوند، مناسب هستند، جایی که MPM برای ترسیم اهداف اکتشافی جدید انجام می‌شود. در حالی که مدل‌های MPM مبتنی بر داده برای مناطقی که به خوبی کاوش شده (یا متروکه) مناسب هستند، جایی که MPM برای ترسیم اهداف اکتشافی بیشتر اجرا می‌شود.

در چند دهه گذشته، انواع روش‌های مدل‌سازی مبتنی بر داده منجر به پیشرفت‌هایی در زمینه MPM شده است. روش‌های احتمالی مانند وزن شواهد و رگرسیون لجستیک به دلیل بیان واضح مدل‌ها و سادگی تفسیر، محبوبیت زیادی به دست آورده‌اند و الگوریتم‌های پرکاربرد باقی مانده‌اند. در طول دهه گذشته، روش‌های یادگیری ماشین (ML) که عمدتا توسط یک دانشمند کامپیوتر برای حل مسائل چند زمینه‌ای طبقه‌بندی و تشخیص الگو توسعه یافته‌اند، به عنوان ابزار امیدوارکننده‌ای برای تولید مدل‌های پیش‌بینی‌کننده آینده‌نگری معدنی ظاهر شده‌اند.. برخی از متداول‌ترین روش‌های یادگیری ماشینی عبارتند از:

شبکه عصبی مصنوعی (ANN)،
ماشین بردار پشتیبان (SVM)،
جنگل تصادفی (RF).

بسیاری از مطالعات قبلی نشان می‌دهند که این روش‌های ML از تکنیک‌های آماری سنتی و مدل‌های اکتشافی تجربی در عملکرد پیش‌بینی بهتر عمل می‌کنند، به‌ویژه زمانی که ویژگی‌های شواهد ورودی به‌طور پیچیده توزیع شده‌اند و انتظار می‌رود ارتباط آن‌ها با کانی‌سازی غیرخطی باشد. اخیراً، روش‌های یادگیری عمیق، شاخه‌ای مهم از الگوریتم‌های یادگیری ماشین، در بسیاری از حوزه‌های علم به موفقیت زیادی دست یافته‌اند. یادگیری عمیق به مدل‌ها اجازه می‌دهد تا نمایش‌های سلسله مراتبی داده‌های ورودی را با سطوح مختلف انتزاعی بیاموزند.

بنابراین، می‌تواند ساختار پیچیده‌ای را در مجموعه داده‌های هدفمند کشف کند و توانایی تشخیص و طبقه‌بندی الگو را تقویت کند. بسیاری از محققان این ابزار سودمند را برای مقابله با مشکلات مدل‌سازی مختلف، مانند نقشه‌برداری استعداد زمین لغزش، نقشه‌برداری ژئوشیمیایی و مدل‌سازی هواشناسی به حوزه علوم زمین معرفی کرده‌اند. با این حال، کاربردهای کمی از این روش را می‌توان در حوزه MPM یافت. شایان ذکر است که اگرچه الگوریتم‌های ابتکاری و قوی متعددی برای MPM پیشنهاد شده است، هیچ مدل واحدی در همه شرایط برتری ندارد. مطالعه تطبیقی مدل‌های پیش‌بینی‌کننده چندگانه لزوماً در یک MPM داده‌محور کارآمد مورد نیاز است.

استان جیانگشی جنوبی یکی از مهم ترین پایگاه‌های تولید جهانی W است. ده‌ها رخداد W، از جمله هشت کانسار در مقیاس بزرگ (بیش از 50000 تن)، 18 کانسار در مقیاس متوسط (10،000 50،000 تن)، و همچنین کانسارهای کوچک مقیاس متعدد (< 10،000 تن) و چشم‌اندازها، در این منطقه کشف شده‌اند. با ذخیره اثبات شده W تجمعی 1.7 Mt این منطقه نمونه خوبی از ناحیه متروکه است که داده‌های زمین‌شناسی کافی را برای آموزش مدل‌های آینده نگری فراهم می‌کند.

دو سهم اصلی این کار را می‌توان در زیر خلاصه کرد: اول، تا جایی که ما می‌دانیم، این مقاله برای اولین بار مدل‌سازی منطقه‌ای را در این منطقه معدنی مهم با کاربرد و مقایسه الگوریتم‌های مختلف یادگیری ماشین و یادگیری عمیق بر اساس گزارش می‌کند. ادغام اطلاعات اکتشافی چند منبعی به طور خاص، مدل CNN یادگیری عمیق به ندرت در MPM استفاده شده است و عملکرد پیش‌بینی آن در این مطالعه ارزیابی شده است. دوم، برخی معیارهای اکتشافی نوآورانه توسط نتایج مدل‌سازی آشکار می‌شوند، که می‌تواند اکتشاف آینده را تسهیل کند و بینش‌هایی را در مورد مدل ژنتیکی کانی‌سازی تنگستن در این منطقه ارائه دهد.

زمین‌شناسی منطقه‌ای و کانی‌سازی تنگستن

استان جیانگشی جنوبی، واقع در بخش مرکزی بلوک کاتایزیا، مربوط به بخش شرقی کمربند متالوژنیک بزرگ نانلینگ است (شکل 2). توالی رسوبی در معرض، در این منطقه شامل سنگ‌های آواری رخساره شیست سبز نئوپروتروزوییک، سنگ‌های کربناته و سیلیکاتی دریایی کم‌عمق پالئوزوئیک، لایه‌های مزوزوئیک متشکل از ماسه‌سنگ‌های آتشفشانی و ماسه سنگ سرخ اواری و پوشش سنوزوئیک (شکل 2) است. چارچوب زمین ساختی منطقه مورد مطالعه عمدتاً توسط سه سیستم گسلی کنترل می‌شود که به ترتیب تقریباً در شمال شرقی، شرق و غرب و شمال غربی هستند (شکل 2).

منطقه مورد مطالعه چهار دوره ماگماتیسم گرانیتی را تجربه کرده است، از جمله کالدونین (پالئوزوئیک اولیه تا میانی)، هرسینین (پالئوزوئیک پسین)، ایندوسینین (مزوزوئیک اولیه) و یانشانین (مزوزوئیک پسین) ،که منجر به نفوذهای متعدد همراه با رخنمون است. تقریباً 14000 کیلومتر مربع (شکل 2). رخنمو‌های گرانیت‌های این منطقه عمدتاً بیوتیت مونزوگرانیت، مونزونیت و مونزوگرانیت پورفیریتی هستند. نهشته‌های W پراکنده در این ناحیه تحت سلطه نوع رگه کوارتز، با مقادیر کمتری از انواع اسکارن و گریزن هستند [41]. ضخامت رگه‌های کانی سازی شده از چند میلی‌متر تا رگه‌های با عرض یک متر متغیر است (شکل 1). کانی سازی W در انواع مختلف از نظر مکانی، زمانی و ژنتیکی با توده‌های گرانیتی یانشانیان مرتبط است.

Predictive Modelling of Mineral 01 — شکل 1. نقشه زمین‌شناسی ساده شده منطقه مورد مطالعه،

تمام رسوبات W در تماس‌های بین توده نفوذی آذرین و سنگ‌های دیواره رسوبی رخ می‌دهد (شکل 1). مطالعات دقیق زمانی نشان می‌دهد که نهشته‌های W در این منطقه در اواخر ژوراسیک (عمدتاً 170-150) تشکیل شده‌اند و هیچ تفاوت زمانی قابل توجهی (1-6 Ma) بین سنگ‌های W و توده‌های گرانیتی نزدیک آنها وجود ندارد. مدل‌های ژنتیکی نهشته‌های W در این منطقه بر رابطه نزدیک کانی‌سازی W و تکامل گرانیت‌های یانشانی تأکید می‌کند.

ماگماهای گرانیتی از ذوب نسبی پوسته با ورودی مواد مافیک به دست آمدند و سپس در W با مواد فرار فراوان در قسمت‌های رأسی اتاقک‌های ماگما دچار تفکیک و غنی‌سازی قابل‌توجهی شدند. هنگامی که ماگما در سطح کم عمقی قرار می‌گرفت، مایعات فلزی از مذاب‌ها خارج شدند. کانی‌سازی گرایزن، رگه کوارتز و اسکارن احتمالاً زمانی تشکیل می‌شود که سیالات متوالی با نفوذهای گرانیتی، آواری و سنگ‌های کربناته مواجه می‌شوند (شکل 1).

این نوع کانی‌سازی W متعلق به یک سیستم معدنی هیدروترمال یکپارچه است و بنابراین اجزای تشکیل دهنده کانه مانند منبع فلزی و مسیرهای سیالات را به اشتراک می‌گذارد. کانی‌سازی w را می‌توان با ترکیب مشابهی از نقشه‌های شواهد نشان‌دهنده مؤلفه‌های فوق پیش‌بینی کرد. اعتقاد بر این است که سیستم‌های گسلی منطقه‌ای کنترل قابل‌توجهی بر فعالیت تکتونو ماگمایی Yanshanian و کانی‌سازی W مرتبط اعمال می‌کنند. استقرار ماگمای گرانیتی مربوط به سنگ معدن توسط گسل‌های عمیق، به‌ویژه آن دسته از گسل‌های مربوط به سیستم تکتونیکی NE-NNE که در دوران یانشانی تشکیل می‌شود، کنترل می‌شود. اینها مسیرهایی را برای صعود ماگمای مرتبط با سنگ معدن فراهم کردند. گسل‌های ثانویه در پوش سنگ‌ها، شبکه‌های انتقال سیالات فلزی را تشکیل می‌دادند و تقاطع این گسل‌ها فضای قابل نفوذی را برای به دام انداختن و تمرکز سیالات فراهم می‌کرد.

Predictive Modelling of Mineral 02 — شکل 2. طرحی که موقعیت انواع مختلف کانی‌سازی W را نسبت به توده‌های یانشانی نشان می‌دهد،

روش‌ها

1- جنگل تصادفی (RF)

جنگل تصادفی یک الگوریتم یادگیری گروهی است. این درخت‌های تصمیم چندگانه را برای پیش‌بینی‌های مکرر پدیده نشان‌داده‌شده توسط مجموعه داده آموزشی جمع‌آوری می‌کند. درختان تصمیم به عنوان طبقه‌بندی‌کننده پایه استفاده می‌شوند که «جنگل» را تشکیل می‌دهند. این درختان بر اساس زیر مجموعه‌های آموزشی متنوع تولید می‌شوند. یک روش نمونه‌گیری به نام «جمع‌سازی خودگردان ساز» (که به اختصار «انباشت سازی» نیز نامیده می‌شود) برای تولید زیرمجموعه‌های آموزشی با نمونه‌گیری تصادفی از مجموعه داده آموزشی اصلی با جایگزینی استفاده می‌شود (یعنی نمونه‌های انتخاب شده برای ایجاد یک درخت از فهرست حذف نمی‌شوند. مجموعه داده ورودی را می‌توان دوباره برای تولید درخت بعدی انتخاب کرد).

درختان با تقسیم مکرر گره‌های ریشه به گره‌های برگ دوتایی رشد می‌کنند. چنین فرآیند تقسیم داده‌ها در هر گره داخلی تا رسیدن به یک شرط توقف از پیش تعیین شده تکرار می‌شود .بر خلاف درخت تصمیم استاندارد، زیرمجموعه‌ای از متغیرها که به‌طور تصادفی از متغیرهای پیش‌بینی‌کننده ورودی انتخاب می‌شوند، به عنوان شرایط متمایز در هر گره درخت در جنگل استفاده می‌شوند. سپس الگوریتم RF در تمام شکاف‌ها جستجو می‌کند تا گره بهینه را بیابد که درجه خلوص درختان حاصل را به حداکثر می‌رساند. خلوص اندازه‌گیری این است که اگر یک نمونه تصادفی انتخاب شده از مجموعه داده ورودی، به دستی برچسب گذاری می‌شود اگر به‌طور تصادفی بر اساس توزیع برچسب‌ها در زیر مجموعه‌ها برچسب‌گذاری شود. شاخص جینی (IG) که به طور گسترده استفاده می‌شود در این مطالعه برای محاسبه خلوص اطلاعات گره‌های برگ در مقایسه با گره‌های ریشه آنها استفاده می‌شود که می‌تواند به صورت فرموله شود: $I_{G} (f) = \sum_{i = 1}^{n} f_{i} (1 - f_{i})$

$I_{G} (f) = \sum_{i = 1}^{n} f_{i} (1 - f_{i})$

که در آن fi احتمال کلاس i در گره n است. این چنین تعریف می‌شود:

$f_{i} = \frac{m_{j}}{m}$

که در آن mj تعداد نمونه‌های متعلق به کلاس j است و m نشان دهنده تعداد کل نمونه‌ها در یک گره خاص است. خروجی پیش‌بینی نهایی RF به رأی اکثریت همه پیش‌بینی‌های درخت‌های تصمیم بستگی دارد.

سناریوهای تصادفی انتخاب نمونه و انتخاب متغیر، همبستگی بین درختان منفرد را کاهش می‌دهند و تنوع جنگل را افزایش می‌دهند، که می‌تواند به طور موثر استحکام الگوریتم را افزایش داده و از برازش بیش از حد جلوگیری کند.

2- ماشین بردار پشتیبانی (SVM)

ماشین بردار پشتیبانی بر اساس یادگیری آماری و به حداقل رساندن ریسک ساختاری توسعه یافته است. این الگوریتم به دنبال ایجاد طبقه‌بندی‌ است که طبقات مختلف را با استفاده از وسیع‌ترین مرزهای تصمیم جدا می‌کند، که با تولید یک ابر صفحه با حداکثر حاشیه به دست می‌اید .از آنجایی که این مطالعه بر طبقه‌بندی باینری (وقوع رویداد معدنی یا عدم وقوع) بر اساس ویژگی‌های زمین‌شناسی یکپارچه که روابط غیرخطی پیچیده‌ای دارند، تمرکز دارد، الگوریتم SVM غیرخطی مورد استفاده برای طبقه‌بندی باینری استفاده می‌شود.

این الگوریتم در زیر توضیح داده شده است. با توجه به مجموعه داده آموزشی با n بردار پیش بینی کننده، به هر بردار یک برچسب yi اختصاص داده می‌شود. در این حالت، yi=1 نشان دهنده وقوع رخداد معدنی و yi=~1 نشان دهنده عدم وقوع است. داده‌های ورودی ابتدا از طریق یک تابع نگاشت F به فضای H با ابعاد بالاتر نگاشت می‌شوند، جایی که یک ابر صفحه برای جداسازی دو کلاس می‌تواند با معادله زیر تولید شود

${\begin{matrix} w Φ (x_{i}) + b \geq 1 - ξ_{i} for y_{i} = 1 \\ w Φ (x_{i}) + b \leq - 1 + ξ_{i} for y_{i} = - 1 \\ ξ_{i} \geq 0, i = 1, 2, \dots, n \end{matrix}$

که در آن w و b بردار وزن و سوگیری ابر صفحه هستند. و i متغیر کمکی مثبت است. طبق نظریه بهینه‌سازی، مسئله یافتن ابر صفحه بهینه به مسئله حل معادله درجه دوم محدب زیر تبدیل می‌شود:

${\begin{matrix} Minimize : \frac{1}{2} {‖ w ‖}^{2} \\ Subjected to : y_{i} (w Φ (x_{i}) + b) \geq 1, i = 1, 2, \dots, n \end{matrix}$

این مسئله بهینه‌سازی را می‌توان با ساخت تابع لاگرانژ حل کرد:

$L (w, α, b) = \frac{1}{2} {‖ w ‖}^{2} - \sum_{i = 1}^{n} α_{i} y_{i} (w Φ (x_{i}) + b) + \sum_{i = 1}^{n} α_{i}$

که i (i = 1, 2, : : : , n) ضریب لاگرانژ است که توسط یک تابع بهینه سازی به دست می‌آید:

${\begin{array}{l} Maximize : \sum_{i = 1}^{n} α_{i} - \frac{1}{2} \sum_{i = 1}^{n} \sum_{j = 1}^{n} α_{i} α_{j} y_{i} y_{j} Φ (x_{i}) Φ (x_{j}) \\ Subjected to : \sum_{i = 0}^{n} α_{i} y_{i} = 0, 0 \leq α_{i} \leq C, i = 1, 2, \dots, n \end{array}$

که در آن C ضریب مجازات خطای طبقه‌بندی اشتباه است. یک تابع هسته‌ای K را می‌توان در اینجا تعریف کرد:

$K (x_{i}, x_{j}) = Φ (x_{i}) \cdot Φ (x_{j})$

برخی از توابع هسته‌ای که معمولاً مورد استفاده قرار می‌گیرند عبارتند از: پایه شعاعی، خطی، چند جمله‌ای و سیگموئید. تابع پایه شعاعی به دلیل خطاهای کم و سادگی پارامترها در کاربرد عملی در این مطالعه استفاده شد:

$K (x_{i}, x_{j}) = \exp (- γ ‖ x_{i} - x_{j} ‖^{2}), γ > 0$

جایی که عرض تابع پایه شعاعی است.

3- شبکه عصبی مصنوعی (ANN)

ANN یک روش مدلسازی است که از سیستم‌های عصبی بیولوژیکی الهام گرفته شده و توانایی تشخیص الگوی مغز انسان را شبیه‌سازی می‌کند. یک نورون مصنوعی واحد عملکردی است که اطلاعات دریافتی را پردازش می‌کند. با استفاده از یک تابع فعال‌سازی انجام می‌شود. تابع فعال‌سازی سیگموئید به کار رفته در این مطالعه را می‌توان به صورت زیر بیان کرد:

$f (x) = \frac{1}{1 + E x p (- x)}$

که در آن x داده ورودی است. نورون‌ها به طور موازی در گروهی به نام “لایه” مرتب شده اند. ANN دارای یک پیکربندی چند لایه معمولی است که از یک لایه ورودی، یک یا چند لایه پنهان و یک لایه خروجی تشکیل شده است. رایج ترین شبکه عصبی مورد استفاده، شبکه پیشرو است و در این مقاله به کار گرفته شده است. در این شبکه عصبی، نورون‌های لایه‌های مختلف به طور کامل به یکدیگر متصل هستند، اما اطلاعات یک طرفه است که از لایه ورودی از طریق لایه‌های پنهان به لایه خروجی شروع می‌شود. انتشار اطلاعات با اختصاص وزن‌های اولیه به اتصالات نورون‌های مختلف انجام می‌شود که می‌تواند به صورت زیر فرموله شود:

$y_{j} = f (\sum_{i} w_{j i} x_{i} + b_{j})$

که در آن وزنی است که نورون i در لایه قبلی را به نورون j متصل می‌کند، و bj عبارت بایاس نورون j است، در حالی که f تابع فعال سازی است.

روش انتشار پسرو برای افزایش قابلیت یادگیری ANN استفاده می‌شود. این روش خطای خروجی را بین مقدار پیش‌بینی‌شده و مقدار هدف واقعی محاسبه می‌کند، سپس آن را به ANN باز می‌گرداند، و سپس ANN وزن‌ها و بایاس‌ها را در شبکه تنظیم می‌کند تا خطای خروجی را به حداقل برساند.. میزان به روز رسانی وزن توسط نرخ یادگیری کنترل می‌شود. چنین فرآیندهای انتشار مجدد تا رسیدن به دقت از پیش تعیین شده یا حداکثر تعداد تکرار ،تکرار می‌شوند.

4- شبکه عصبی پیچشی (CNN)

CNN یک کلاس از شبکه‌های عصبی یادگیری عمیق است که اساساً از یک لایه ورودی، یک یا چند لایه پیچشی، لایه‌های ادغام و لایه‌های کاملاً متصل و یک لایه خروجی تشکیل شده است. داده‌های ورودی که با X = (x1, x2, : : : , xn) نشان داده می‌شوند، ابتدا به یک لایه پیچشی داده می‌شوند. لایه پیچشی از یک فیلتر به طور تصادفی اولیه (که هسته نیز نامیده می‌شود) برای انجام یک عملیات پیچشی استفاده می‌کند.

شکل 3a نمونه‌ای از پیچشی را نشان می‌دهد، که در آن یک فیلتر پیچشی در کل مجموعه داده ورودی جابجا می‌شود، و محصولات نقطه‌ای بین ورودی‌های فیلتر و داده‌های ورودی محاسبه می‌شوند، که منجر به ایجاد یک مجموعه داده با ویژگی جدید می‌شود (که به عنوان یک نگاشت ویژگی شناخته می‌شود.استفاده از هسته‌های مختلف (که به عنوان Si مشخص می‌شود) نتایج پیچشی متعددی را تولید می‌کند که بر اساس آن مجموعه‌ای از نگاشت‌های ویژگی جدید برای ارائه نمایش‌های متفاوتی از بردارهای ورودی به صورت سلسله مراتبی تولید می‌شود که می‌تواند به صورت زیر بیان شود:

$F_{i} = (f_{1}, f_{2}, \dots, f_{n}) = g (X \cdot Σ_{i})$

که در آن g یک تابع فعال‌سازی است که برای تقویت غیرخطی نتایج کانولوشن استفاده می‌شود. تابع واحد خطی اصلاح شده (ReLU) متداول‌ترین مورد استفاده در CNN است که می‌تواند به صورت زیر فرموله شود:

$g (x) = \max (0, x)$

Predictive Modelling of Mineral 03 — شکل 3- نمونه‌هایی که عملیات خارج از کانولوشن (a) و تجمع ماکزیمم (b) را نشان می‌دهد.

نگاشت‌های ویژگی که توسط یک یا چند لایه پیچشی تولید می‌شوند، سپس به یک لایه ادغام ارسال می‌شوند. ادغام همچنین یک عملیات مبتنی بر فیلتر است که از یک فیلتر متحرک برای استخراج حداکثر (حداکثر ادغام) یا میانگین (متوسط تجمع) داده‌هایی که با فیلتر همپوشانی دارند، استفاده می‌کند، همانطور که در شکل 3b نشان داده شده است. در این مطالعه از حداکثر ادغام استفاده شده است.

لایه‌های ادغام برای یک فرآیند نمونه‌برداری پایین برای کاهش ابعاد شبکه استفاده می‌شود که به کاهش هزینه محاسباتی و کنترل مشکلات اضافه برازش کمک می‌کند. به این ترتیب، داده‌های ورودی از طریق لایه‌های پیچشی و ادغام متوالی برای استخراج ویژگی‌ها منتشر می‌شوند. نگاشت‌های ویژگی استخراج شده به چندین لایه کاملاً متصل ارسال می‌شود که می‌تواند به عنوان ANN وابسته که در بالا توضیح داده شد در نظر گرفته شود. خروجی لایه‌های کاملاً متصل به آخرین لایه ارسال می‌شود که از یک تابع فعال‌سازی softmax برای محاسبه احتمال پیش‌بینی همه کلاس‌ها با فرمول زیر استفاده می‌کند:

$P (y = j | x) = \frac{\exp (w_{j} x + b_{j})}{\sum_{i = 1}^{2} \exp (w_{i} x + b_{i})}$

که در آن y کلاس پیش بینی شده را نشان می‌دهد و w و b به ترتیب وزن و بایاس برای کلاس مربوطه هستند.

در MPM، داده‌های ورودی یادگیری ماشین را می‌توان به عنوان تصویر در نظر گرفت که در آن هر پیکسل نشان دهنده اندازه گیری یک ویژگی خاص است. بنابراین، هر سلول شبکه با یک بردار ستونی با طول تعیین شده توسط تعداد ویژگی‌های شواهد نشان داده می‌شود. در این راستا، CNN با نمایش داده‌های یک بعدی که دارای یک معماری معمولی نشان داده شده در شکل 4 است، در این مطالعه استفاده شد. با فرض وجود n ویژگی شواهد در مجموعه داده ورودی، یک لایه کانولوشن با استفاده از N فیلتر با اندازه (n1) منجر به N بردار ویژگی جدید با طول (m × n + 1) می‌شود.

سپس خروجی لایه کانولوشن با استفاده از فیلتر (a*1) یک لایه ادغام شده تنظیم می‌شود که در نتیجه N نگاشت ویژگی با اندازه (m – n – a + 2)*1] ایجاد می‌شود. پس از یک یا چند عملیات ادغام کانولوشن، نگاشت‌های ویژگی خروجی به یک شبکه عصبی کاملاً متصل با نورون‌های x وارد می‌شوند. در نهایت، آخرین لایه کاملاً متصل از یک تابع softmax برای بدست آوردن احتمال پیش‌بینی استفاده می‌کند و یک تولید باینری را به عنوان خروجی می‌دهد.

Predictive Modelling of Mineral 04 — شکل 4. معماری معمولی مدل یک بعدی CNN.

مجموعه داده‌ها و برنامه

آماده سازی داده‌های ورودی (شامل متغیرهای پیش بینی کننده و هدف) اولین و یک مرحله مهم MPM است. ادغام متغیرهای پیش‌بینی چند منبع و تولید مجموعه داده‌های ورودی با استفاده از نرم‌افزار ArcGIS ESRI نسخه 10.2، مؤسسه تحقیقات سیستم‌های محیطی، Redlands، CA، USA اجرا شد. استفاده از مدل‌سازی مبتنی بر ML، شامل آموزش و ارزیابی مدل، در (استودیو RapidMiner نسخه 9.3، RapidMiner، Inc.، بوستون، MA، ایالات متحده آمریکا) انجام شد. این نرم افزار ابزارهای مدل سازی کاربردی متعددی را ارائه می‌دهد و منبع فراوانی از الگوریتم‌های یادگیری ماشین را تعبیه می‌کند.

1) متغیرهای پیش‌بینی کننده

متغیرهای پیش‌بینی کننده به عنوان شرایط تعیین کننده برای پیش بینی پتانسیل معدنی استفاده می‌شوند. متغیرهای قابل اعتماد باید با درک سیستم معدنی W هدایت شوند.با توجه به مدل ژنتیکی و عوامل کنترل کننده کانی سازی W که در بخش 2 توضیح داده شد، و بر اساس مجموعه داده‌های در دسترس عموم، ما از هشت نقشه شواهد به عنوان متغیرهای پیش بینی کننده شامل اطلاعات زمین شناسی، ژئوفیزیک و ژئوشیمیایی استفاده کردیم.

داده‌های زمین شناسی از پایگاه داده آنلاین سازمان زمین شناسی چین بر اساس دهه‌ها تحقیقات منطقه ای گرفته شده است. نزدیکی به رخنمون‌های یانشانی به عنوان یک نقشه شواهد که منبع سیستم تشکیل سنگ معدن را نشان می‌دهد به کار گرفته شد (شکل 5) a با توجه به تجزیه و تحلیل فضایی انجام شده در این منطقه ، گسل‌های منطقه ای با روند NE و EW رابطه مثبتی با رخداد w نشان می‌دهند، در حالی که گسل‌های با روند NW احتمالاً پس از کانی سازی تشکیل شده اند، و هیچ ارتباط فضایی آشکاری با وقوع کانی نشان نمی‌دهند.

بنابراین، نقشه‌های چگالی گسل‌های روند NE و EW و تقاطع‌های آنها به عنوان شواهدی برای نمایش کنترل‌های ساختاری بر کانی‌سازی مورد استفاده قرار گرفت (شکل 5.(b,c آنومالی‌های ژئوفیزیکی می‌توانند اطلاعاتی در مورد اجسام زیرسطحی مانند سنگ‌های نفوذی در منطقه ارائه دهند. بنابراین، داده‌های ژئوفیزیکی، از جمله گرانش و مغناطیسی، برای تشخیص وقوع سنگ‌های نفوذی مرتبط با سنگ معدن در عمق مورد استفاده قرار گرفتند (شکل 5). d,e آنومالی‌های ژئوشیمیایی عناصر معدنی، نشانه‌های جهت کانسارهای مورد نظر هستند.

از آنجایی که W، منگنز و آهن مهم‌ترین اجزای تشکیل‌دهنده ولفرامیت (((Fe,Mn)WO4) هستند که بر کانسنگ‌های این ناحیه غالب هستند، آنومالی‌های ژئوشیمیایی در این عناصر استخراج‌شده از داده‌های ژئوشیمیایی رسوب رودخانه‌ای محدوده Nanling ، نشان داده شد که به عنوان نقشه‌های شواهدی استفاده می‌شود (شکل 5) f-h .داده‌ها از پروژه ملی نقشه‌برداری ژئوشیمیایی چین با تراکم نمونه‌برداری یک نمونه در هر کیلومتر مربع به دست آمد. W با روش قطب نگاری و منگنز و آهن با روش فلورسانس اشعه ایکس تجزیه و تحلیل شدند.

شکل 5. ویژگی‌های شواهدی که به عنوان متغیرهای پیش بینی کننده برای مدل سازی آینده نگری استفاده می‌شوند: (الف) فاصله تا توده نفوذی. (ب) چگالی گسل‌های امتدادی NE-EW. ج) تراکم تقاطع‌های گسل‌های امتدادی NE-EW. د) آنومالی ثقلی؛ ه) آنومالی مغناطیسی؛ (و) آنومالیW ز) آنومالی آهن. و (ح) آنومالی منگنز.

پس از تهیه نقشه‌های شواهد، آنها به نقشه‌های شطرنجی تبدیل شدند که در آن هر سلول یک نمایش عددی از ویژگی‌های شواهدی دارد. اندازه سلول بر اساس یک سناریوی عینی پیشنهاد شده توسط کارانزا تعیین شد. با در نظر گرفتن کمبود مواد معدنی، شبکه سلولی باید اطمینان حاصل کند که هر سلول منفرد حاوی تنها یک رخداد معدنی باشد. تجزیه و تحلیل فاصله همسایه می‌تواند به ارائه یک محدوده مرجع از اندازه سلول کمک کند. فواصل بین هر رخداد شناخته شده و نزدیکترین رخداد همسایه آن محاسبه و به صورت آماری ترسیم شد (شکل 6). می‌توان مشاهده کرد که حداقل فاصله هر دو نزدیکترین رخداد 490 متر است. این یک حد بالایی از اندازه سلول را تعیین می‌کند. حد پایین Rs اندازه سلول را می‌توان با یک فرمول تجربی محاسبه کرد:

$R_{s} = M_{s} \times 0.00025$

جایی که نشان دهنده مقیاس نقشه است. بزرگ ترین مقیاس نقشه‌های شواهد به کار رفته در این تحقیق 1:300000 است. این نشان می‌دهد که حد پایین اندازه سلول باید 75 متر باشد. اندازه سلول 450 متر برای تولید یک نوار شطرنجی حاوی 195174 سلول انتخاب شد. هر سلول دارای ترکیبی از هشت مقدار ویژگی است که نشان دهنده شواهد زمین‌شناسی، ژئوفیزیک و ژئوشیمیایی است.

Predictive Modelling of Mineral 07 — شکل 6. نمودار فواصل و احتمالات مربوطه که یک رخداد W در کنار یک رخداد W شناخته شده دیگر قرار دارد.

2) متغیر هدف

متغیرهای هدف، از جمله وقوع مواد معدنی و مکان‌های غیرقابل وقوع، به عنوان نمونه‌های آموزشی و اعتبارسنجی برای یک مدل‌سازی پیش‌بینی نظارت شده استفاده می‌شوند. وقوع مواد معدنی از پایگاه داده آنلاین سازمان زمین شناسی چین مشتق شده است. مکان‌های عدم وقوع بر اساس سناریوی پیشنهادی Carranza و Zuo انتخاب شدند:

(1) مقدار نمونه‌های غیرقابل رخ دادن باید برابر با موارد معدنی باشد، به طوری که نسبت نمونه‌های مثبت و منفی باشد. در مجموعه داده‌های آموزشی و اعتبارسنجی متعادل خواهد بود.

(2) مکان‌های غیرقابل وقوع باید به اندازه کافی دور از هر رویداد شناخته شده باشند. مناطق نزدیک به رخدادهای معدنی موجود احتمالاً شرایط سنگ‌سازی مشابهی دارند.

تجزیه و تحلیل فاصله همسایه رخدادهای معدنی را می‌توان برای تعیین فاصله ای که فراتر از آن مکان‌های غیر وقوع باید انتخاب شوند استفاده کرد (شکل 6). می‌توان مشاهده کرد که حداکثر فاصله بین هر دو رخداد 26302 متر است. احتمال 100% یافتن رخداد دیگری در فاصله 26302 متری هر رخداد وجود دارد. مکان‌های غیرقابل وقوع باید فراتر از محدوده 26302 متری رخدادهای معدنی انتخاب شوند.

با این حال، مکان‌های کمی را می‌توان در این محدوده انتخاب کرد. در عوض، 7271 متر به عنوان یک محدوده محفوظ انتخاب شد که در آن 85٪ احتمال یافتن یک رخداد همسایه در کنار هر رخداد موجود وجود دارد، و نمونه‌های غیرقابل رخ دادن باید خارج از مناطق تحت کنترل انتخاب شوند (شکل 7).

(3) رخدادهای معدنی در یک منطقه خاص عموماً دارای توزیع فضایی خوشه ای هستند (شکل 7)، زیرا آنها محصول رویدادهای نادر و فرآیندهای غیرتصادفی تشکیل سنگ هستند. در مقابل، مکان‌های غیرقابل اتفاق باید به‌طور تصادفی توزیع شوند، زیرا ناشی از فرآیندهای زمین‌شناسی مشترک هستند.

Predictive Modelling of Mineral 08 — شکل 7. محل وقوع مواد معدنی شناخته شده و منتخب رویداد رخ نداده.

اگرچه معیارهای بالا که برای انتخاب مکان‌های غیر تصادفی، استفاده می‌شوند، بر اساس داده‌های آماری و توزیع رخدادهای معدنی، عینی هستند، انتخاب دستی ممکن است با توجه به ترکیبی از برخی از رخدادهای کانی پنهان، همچنان در مجموعه‌های داده‌های غیرقابل‌تصادفی به عدم قطعیت منجر شود. این امر به میزان زیادی بر قابلیت اطمینان نتایج مدلسازی تأثیر می‌گذارد. برای کاهش اثر نمونه‌های منفی کاذب، سه مجموعه داده غیرقابل وقوع تولید شد.

هر یک شامل 118 نمونه غیر تصادفی است که بر اساس سناریوی تصادفی ذکر شده در بالا (شکل 7) انتخاب شدند و در نتیجه سه مجموعه داده از متغیرهای هدف به دست آمد. سپس سه مجموعه داده برچسب‌گذاری‌شده به‌طور تصادفی به دو بخش تقسیم شدند، از جمله 70٪ نمونه‌های برچسب‌گذاری‌شده که به عنوان مجموعه داده آموزشی خدمت می‌کنند و نمونه‌های برچسب‌گذاری‌شده دیگر سپس به عنوان مجموعه داده اعتبار استفاده می‌شوند.

3) آموزش مدل

پس از آماده‌سازی داده‌های ورودی، مدل‌های ML توسط فرآیندهای آموزشی تولید شدند. اینها عمدتاً شامل تعیین پارامترهای کلیدی مورد استفاده برای مدل‌های ML بودند. تعیین تغییرات مناسب پیشینی پارامترها در مدل‌سازی مبتنی بر داده دشوار است. پارامترهای بهینه برای مدل‌های ML منفرد با مجموعه داده‌های ورودی خاص و پس‌زمینه‌های کاربردی مختلف متفاوت است. هیچ قاعده تجربی عمومی برای تعیین این پارامترها وجود ندارد. در این راستا، برای به دست آوردن پارامترهای بهینه، یک روش آزمون و خطا بسیار عینی همیشه مورد نیاز است.

برای انجام این روش از روش جستجوی شبکه ای استفاده شد. جدول 1 پارامترهای کلیدی ML و محدوده مرجع آنها را که توسط مطالعات قبلی پیشنهاد شده است، فهرست می‌کند. ترکیب احتمالی پارامترهای مورد استفاده برای آموزش مدل‌های ML فردی با جستجو در محدوده مرجع مقادیر با طول گام مشخص به‌دست آمد. سپس یک روش اعتبارسنجی متقاطع 10 برابری برای ارزیابی عملکرد طبقه‌بندی مدل‌های ML آموزش‌دیده با استفاده از ترکیب احتمالی پارامترها اجرا شد.

در این روش، مجموعه داده‌های آموزشی ورودی به‌طور تصادفی به 10 زیرمجموعه با اندازه مساوی تقسیم شدند، 9 زیرمجموعه برای آموزش مدل‌های پیش‌بینی و بقیه به عنوان مجموعه داده آزمایشی برای محاسبه خطاهای طبقه‌بندی استفاده شد. این روش 10 بار تکرار شد تا اینکه هر زیر مجموعه یک بار به عنوان مجموعه داده آزمایشی استفاده شد. میانگین مربعات خطا (MSE) برای ارزیابی عملکرد طبقه بندی مدل‌های آموزش دیده استفاده شد. این را می‌توان با فرمول زیر محاسبه کرد:

$M S E = \frac{1}{N} \sum_{i = 1}^{N} {(\hat{y_{i}} - y_{i})}^{2}$

که در آن N تعداد نمونه‌ها در مجموعه داده آزمایشی است. yˆi نتیجه پیش‌بینی‌شده هر نمونه را نشان می‌دهد (یعنی 1 برای وقوع معدنی و 0 برای عدم وقوع). yi مقدار واقعی هر نمونه را نشان می‌دهد. ترکیبی از پارامترهایی که بهترین مدل را با کمترین MSE آموزش می‌دهد به عنوان تغییرات مدل بهینه تعیین شد.

جدول 1. پارامترهای مورد استفاده برای آموزش مدل‌های یادگیری ماشینی.

4) ارزیابی مدل

عملکرد جامع مدل‌های ML ترن شده (داده‌های آموزشی)، از جمله دقت طبقه‌بندی، قابلیت پیش‌بینی و تفسیرپذیری زمین‌شناختی، توسط یک سری اندازه‌گیری‌های کمی ارزیابی شد. دقت طبقه‌بندی یک مدل پیش‌بینی‌کننده را می‌توان با ماتریس درهم ریختگی ارزیابی کرد، که در آن، نتیجه طبقه‌بندی یک نمونه را می‌توان در چهار موقعیت زیر طبقه‌بندی کرد:

(i) یک واقعه معدنی به درستی به عنوان یک واقعه طبقه بندی می‌شود که به عنوان نمونه مثبت واقعی یا TP نامیده می‌شود.
(ii) یک واقعه معدنی به اشتباه به عنوان غیررخدادی طبقه‌بندی شده است که به آن نمونه منفی کاذب یا FN گفته می‌شود.
(iii) یک نمونه غیر رخدادی به درستی در کلاس غیر رخدادی طبقه بندی می‌شود که به آن نمونه منفی واقعی یا TN گفته می‌شود.
(IV) یک نمونه بدون وقوع به اشتباه به عنوان یک رخداد معدنی طبقه بندی شده است که به عنوان نمونه مثبت کاذب یا FP نامیده می‌شود.

بر اساس ماتریس درهم ریختگی، مجموعه‌ای از شاخص‌های آماری را می‌توان برای ارزیابی عملکرد طبقه‌بندی مدل‌های ML محاسبه کرد که می‌تواند به صورت زیر فرموله شود:

$S e n s i t i v i t y = \frac{T P}{T P + F N}$

$S p e c i f i c i t y = \frac{T N}{T N + F P}$

$P o s i t i v e p r e d i c t i v e v a l u e = \frac{T P}{T P + F P}$

$N e g a t i v e p r e d i c t i v e v a l u e = \frac{T N}{T N + F N}$

$A c c u r a c y = \frac{T P + T N}{T P + T N + F P + F N}$

عملکرد کلی پیش‌بینی مدل‌های ML توسط منحنی مشخصه عملکرد گیرنده (ROC) و منحنی نرخ موفقیت ارزیابی شد. این منحنی‌ها نمایش‌های گرافیکی دقت مدل با توجه به تنوع آستانه‌های تمایز هستند که نتایج پیش بینی یک سیستم طبقه بندی باینری را تعریف می‌کنند. به طور خاص، سلولی با مقدار احتمال بیشتر یا کمتر از آستانه تمایز به عنوان “رویداد معدنی” یا “عدم وقوع” پیش‌بینی شد که بر اساس آن حساسیت و ویژگی محاسبه شد. مناطق آینده پژوهی با آن سلول‌هایی که به عنوان وقوع معدنی طبقه بندی شده بودند، مشخص شدند.

با کاهش تدریجی آستانه‌های تمایز، منحنی ROC با رسم نرخ مثبت واقعی متناظر (همچنین به عنوان حساسیت که نشان دهنده نسبت نمونه‌های مثبت طبقه بندی شده صحیح است) در محور y در برابر نرخ مثبت کاذب (نسبت نمونه‌های منفی طبقه بندی نادرست) ایجاد شد، با (1-ویژگی)) روی محور x ارائه می‌شود، در حالی که منحنی میزان موفقیت با ترسیم درصد وقوع مواد معدنی موجود در مناطق آینده پژوه در برابر درصد مساحت مناطق آینده پژوهی ایجاد شد. علاوه بر این، سطح زیر منحنی ROC (AUC) به عنوان اندازه‌گیری کمی از عملکرد پیش‌بینی مدل‌های ML استفاده شد.

بهره اطلاعاتی (IG) در این مشارکت برای تخمین تأثیر متغیرهای پیش‌بین ورودی بر روی مدل‌های پیش‌بینی مورد استفاده قرار گرفت. این به تفسیر اهمیت نسبی ویژگی‌های زمین‌شناسی مرتبط کمک می‌کند و بنابراین می‌تواند قابلیت اطمینان پیش‌بینی‌ها را تأیید کند. به دست آوردن اطلاعات برای یک متغیر پیش‌بینی‌کننده خاص مربوط به نتیجه طبقه‌بندی خروجی Y را می‌توان به‌صورت زیر بدست آورد:

$I G (Y, F_{i}) = H (Y) - H (Y | F_{i})$

که در آن H(Y) مقدار آنتروپی Y است که برای توصیف غیرقابل پیش‌بینی بودن طبقه‌بندی به Y استفاده می‌شود، و H(Y|Fi) مقدار آنتروپی تغییر یافته Y پس از مرتبط شدن با یک ویژگی شواهد مشخص Fi است.

نتایج و بحث

پیکربندی مدل و تأثیر آن بر دقت طبقه‌بندی

برای یک مدل‌سازی پیش‌بینی مبتنی بر داده، پیکربندی مدل تا حد زیادی بر دقت پیش‌بینی‌ها تأثیر می‌گذارد. MSE به‌دست‌آمده از اعتبارسنجی متقاطع 10 برابری در این مطالعه برای ارزیابی دقت طبقه‌بندی در فرآیند آموزش استفاده می‌شود. شکل 8 تغییرات MSE را با ترکیب‌های متغیر پارامترهای ML و مجموعه داده‌های مختلف نشان می‌دهد.

اگرچه مدل‌های ML فردی آموزش‌دیده‌شده توسط سه مجموعه داده به سطوح مختلفی از دقت طبقه‌بندی دست می‌یابند، آنها الگوهای تغییرات مشابهی از MSE را با توجه به تغییرات پارامتر خاص نشان می‌دهند. به طور کلی، مدل‌های RF و CNN عملکرد دقیق‌تر و پایدارتری نسبت به دو مدل دیگر ارائه می‌کنند و پیش‌بینی‌هایی با MSE کمتر از 0.19 ارائه می‌دهند و حساسیت کمتری به تغییرات پارامتر نشان می‌دهند.

Predictive Modelling of Mineral 09 — شکل 8. نتایج تحلیل‌های حساسیت که خطاهای طبقه‌بندی (MSE) را برای ترکیب‌های احتمالی پارامترها برای آموزش هر مدل یادگیری ماشین نشان می‌دهد: تعداد درخت‌ها و تعداد ویژگی‌های مورد استفاده برای آموزش مدل‌های RF بر اساس مجموعه داده 1 (a)، مجموعه داده 2 (b) ، و مجموعه داده 3 (c); گاما و هزینه مورد استفاده برای آموزش مدل‌های SVM بر اساس مجموعه داده 1 (d)، مجموعه داده 2 (e) و مجموعه داده 3 (f). تعداد نورون‌ها و نرخ یادگیری مورد استفاده برای آموزش مدل‌های ANN بر اساس مجموعه داده 1 (g)، مجموعه داده 2 (h) و مجموعه داده 3 (i). تعداد نقشه‌های ویژگی و تعداد نورون‌های مورد استفاده برای آموزش مدل‌های CNN بر اساس مجموعه داده 1 (j)، مجموعه داده 2 (k) و مجموعه داده 3 (l)

مدل‌های SVM نتایج طبقه‌بندی ضعیفی را با ارزش هزینه کم (<2.5) تولید می‌کنند، و مدل‌های ANN پیچیده‌ترین و نادرست‌ترین پیش‌بینی‌ها را در فرآیند آموزش با توجه به الگوهای تغییرات MSE، به ویژه زمانی که نرخ یادگیری بیشتر از 0.2 باشد، ارائه می‌دهند. در میان تمام پارامترهای ML، برخی از پارامترهای مربوط به معماری مدل، از جمله تعداد درخت‌ها در RF، تعداد نورون‌ها در ANN و همچنین تعداد نقشه‌های ویژگی و تعداد نورون‌ها در CNN، پیچیدگی مدل‌های مربوطه را تعریف می‌کنند.

معمولاً در بسیاری از زمینه‌های تحقیقاتی به رسمیت شناخته شده است که مدل‌های پیچیده ML تمایل به پیش بینی‌های دقیق تری دارند. با این حال، در این مطالعه با توجه به مدل‌سازی آینده پژوهی، یک تحلیل آماری از نتایج MSE با افزایش پارامترهای مرتبط با معماری انجام شد. نتایج نشان می‌دهد که معماری پیچیده مدل‌ها منجر به عملکرد بهتر در مدل‌سازی آینده پژوه منطقه مورد مطالعه نمی‌شود، همانطور که در شکل 9 نشان داده شده است. با افزایش پارامترهای مربوطه، تمامی شاخص‌های آماری، به ویژه کمترین MSE و میانگین MSE مورد استفاده برای ارزیابی خطای طبقه ‌ندی، روند کاهشی آشکاری را نشان نمی‌دهند.

برعکس، افزایش تعداد درخت‌ها، نورون‌ها و نقشه‌های ویژگی به طور قابل‌توجهی هزینه محاسبات را افزایش می‌دهد. به طور ضمنی مشخص می‌شود که معماری‌های دقیق مدل‌های ML لزوماً در فرآیندهای مدل سازی ارائه شده در اینجا مورد نیاز نیستند. این مفهوم با برخی از مطالعات قبلی مطابقت دارد که نشان می‌دهند مدل‌های پیچیده لزوماً به پیش‌بینی‌های دقیق‌تری منجر نمی‌شوند. این نتایج ممکن است به اندازه کوچک مجموعه داده‌های آموزشی نسبت داده شود که معمولاً از ده‌ها مکان معدنی و غیر کانسار تشکیل می‌شود. مدل‌های آموزشی با چنین مجموعه داده‌های محدودی ممکن است به راحتی به دقت مطلوب دست یابند، در حالی که معماری‌های پیچیده و آموزش بیش از حد ممکن است خطاهای بیش از حد برازش ایجاد کنند.

Predictive Modelling of Mineral 10 — شکل 9. نمودار جعبه ای که نتایج آماری MSE را در برابر تغییرات پارامترهای مربوط به پیچیدگی مدل نشان می‌دهد: (الف) تعداد درختان به کار رفته در RF. (ب) تعداد نورون‌های به کار گرفته شده در ANN. (ج) تعداد نقشه‌های ویژگی به کار گرفته شده در CNN. و (د) تعداد نورون‌های به کار گرفته شده در CNN.

ارزیابی مدل و انتخاب نقشه چشم انداز

مدل‌های ML که با ترکیب بهینه پارامترها آموزش داده شده‌اند، پیش‌بینی را در هر سلول به‌دست می‌آورند که با یک مقدار احتمال شناور از 0 تا 1 نشان داده می‌شود (شکل 10). الگوریتم‌های ML آن سلول‌هایی را با مقادیر احتمالی بیشتر از 0.5 به‌عنوان مناطق احتمالی که به طور بالقوه حاوی یک رخداد معدنی هستند برچسب‌گذاری می‌کنند. سلول‌های دیگر به عنوان مناطق بایر بدون پتانسیل اکتشاف کافی مشخص می‌شوند.

طبق چنین سناریوی طبقه‌بندی، ماتریس‌های سردرگمی مجموعه داده‌های اعتبارسنجی برای چهار روش ML تولید و در جدول 2 فهرست شده‌اند، که بر اساس آن، دقت طبقه‌بندی باینری به صورت کمی توسط شاخص‌های آماری مختلف اندازه‌گیری می‌شود، همانطور که در جدول 3 فهرست شده است. مشاهده می‌شود که مدل‌های فردی عملکردهای متفاوتی را در مجموعه داده‌های مختلف و در شاخص‌های متفاوت نشان می‌دهند. به طور کلی، مدل CNN هم در دقت کلی و هم در پیش‌بینی نمونه‌های مثبت و منفی، به دنبال مدل‌های RF و SVM، بیشترین عملکرد را به دست می‌آورد، در حالی که مدل ANN پیش‌بینی‌های نسبتاً بدتری را تولید می‌کند.

به طور خاص، مدل CNN حساس ترین است که به درستی 87.62٪ از مکان‌های ذخیره را در هر سه مجموعه داده شناسایی می‌کند و پس از آن مدل RF (82.86٪) قرار دارد. مقادیر حساسیت مدل‌های SVM و ANN هر دو کمتر از 80 درصد است. مدل CNN دارای ویژگی 97.14٪ است که نشان می‌دهد 97.14٪ از سلول‌های غیرقابل رخ دادن به درستی به عنوان مناطق بایر طبقه بندی می‌شوند. بقیه مدل‌ها نیز به ارزش‌های بسیار بالایی از ویژگی دست می‌یابند: 93.34٪، 92.38٪، و 92.38٪ برای مدل‌های SVM، RF و ANN به ترتیب. هر چهار مدل دارای مقادیر پیش‌بینی مثبت بالای بیش از 91 درصد هستند، به این معنی که بیش از 91 درصد سلول‌های آینده پژوهی پیش‌بینی‌شده در واقع حاوی ووکورنس هستند.

مدل ANN کمترین نرخ پیش‌بینی منفی (80.85 درصد) را به دست می‌دهد، که نشان می‌دهد 80.85 درصد از سلول‌های غیرقابل پیش‌بینی مکان‌های غیر وقوع واقعی هستند. در مقابل، مدل CNN به بالاترین نرخ پیش بینی منفی (88.72٪) دست می‌یابد و پس از آن مدل‌های RF (84.40٪) و SVM (81.04٪) قرار دارند. مدل CNN بالاترین دقت کلی 92.38 درصد را به دست می‌آورد که نشان می‌دهد 92.38 درصد از همه نمونه‌ها به درستی طبقه‌بندی شده‌اند، پس از آن مدل RF (87.62 درصد)، در حالی که مدل‌های SVM (85.71 درصد) و ANN (85.24 درصد) مقادیر نسبتاً پایینی از دقت طبقه‌بندی تولید می‌کنند.

Predictive Modelling of Mineral 11 — شکل 10. نقشه‌های پیش‌بینی کننده میانگین خروجی احتمال توسط مدل‌های یادگیری ماشین بر اساس سه مجموعه داده ورودی را نشان می‌دهد: (الف) RF. (ب) SVM; (ج) ANN; و (د) مدل‌های CNN.

جدول 2. ماتریس‌های سردرگمی مدل‌های یادگیری ماشین در مجموعه داده‌های اعتبارسنجی مختلف

جدول 3. عملکرد طبقه‌بندی مدل‌های یادگیری ماشین

همه مدل‌های ML می‌توانند به درستی بیشتر رخدادهای شناخته شده (بیش از 78٪) را در مناطق احتمالی تعریف شده توسط سناریوی طبقه‌بندی پیش‌فرض (یعنی احتمال > 0.5) شناسایی کنند. بنابراین، مناطق هدف در حالت ایده آل دارای بالاترین اطمینان نسبت به کوچکترین منطقه هستند. ترسیم مناطق با اطمینان بالا و کارایی پیش‌بینی مدل‌ها برای کاربردهای اکتشاف ضروری است و بنابراین باید به طور مؤثر ارزیابی شود.

عملکرد پیش‌بینی مناطق با احتمال بالا را می‌توان توسط منحنی ROC ارزیابی کرد. نتایج طبقه‌بندی پیش‌بینی‌ها با آستانه‌های متمایز متفاوت از مقادیر احتمال بالا تا پایین مورد قضاوت قرار می‌گیرند. در شرایط ایده‌آل که همه نمونه‌های وقوع احتمال بیشتری نسبت به نمونه‌های غیر رخدادی دارند، منحنی ROC یک خط مستقیم y = 1 با بالاترین AUC 1 است. یک سلول غیر رخدادی با احتمال زیاد یا یک سلول رخدادی با احتمال کم باعث می‌شود که منحنی ROC از منحنی y = 1 منحرف شود و مقدار AUC کاهش یابد.

منحنی‌های ROC چهار مدل ML آموزش داده شده توسط مجموعه داده‌های ورودی متفاوت در شکل 11 نشان داده شده است. پیشنهاد می‌شود که هرچه یک منحنی ROC به گوشه سمت چپ بالا نزدیک‌تر باشد، به منحنی y = 1 نزدیک‌تر است و مدل بهتر عمل می‌کند. منحنی ROC مدل RF در تمام موارد به گوشه بالا سمت چپ نزدیک‌ترین است و بالاترین مقادیر AUC را دارد که بیشتر از 0.95 است. مدل‌های SVM و CNN عملکرد قابل مقایسه با بالاترین مقادیر AUC ثانویه را نشان می‌دهند، در حالی که مدل ANN ضعیف‌ترین قابلیت پیش‌بینی را در ارزیابی منحنی‌های ROC انجام می‌دهد.

Predictive Modelling of Mineral 12 — شکل 11. منحنی‌های ROC و AUC‌های مدل‌های ML آموزش داده شده توسط مجموعه داده 1 (a)، مجموعه داده 2 (b)، و مجموعه داده 3 (c)

منحنی نرخ موفقیت در آشکار کردن کارایی پیش‌بینی مدل‌ها ساده است. همانطور که در شکل 12 نشان داده شده است، منحنی نرخ موفقیت هر مدل را می‌توان با سه خط رگرسیون با شیب‌های مختلف برازش داد. شیب تندتر نشان دهنده راندمان پیش بینی بالاتر است. مناطق آینده پژوه شناسایی شده، رخدادهای شناخته شده بیشتری را در مناطق مشخص شده کوچکتر ثبت می‌کنند.

از این نظر، منطقه‌بندی آینده پژوه را می‌توان بر اساس آستانه‌های شناسایی شده توسط تقاطع خطوط رگرسیون همسایه انجام داد که پتانسیل بالا، متوسط و پایین را برای کشف رخدادهای W جدید نشان می‌دهند.(شکل 13). شایان ذکر است که تنها مناطق با پتانسیل بالا، معمولاً با شیب منحنی نرخ موفقیت بیشتر از 5، مناطق آینده پژوه مناسب برای اکتشاف بیشتر هستند. سایر نواحی دارای شیب مساوی یا کمتر از 1، معادل یا کمتر از چگالی پراکنده طبیعی هستند (یعنی هر 1٪ از منطقه شامل 1٪ از موارد معدنی است).

بنابراین، کارایی پیش‌بینی مدل‌های ML به شیب بخش اول منحنی میزان موفقیت بستگی دارد. مدل RF کارآمدترین عملکرد پیش‌بینی را با بیشترین شیب 6.7797 به دست می‌آورد، که مناطق با پتانسیل بالا را مشخص می‌کند که تنها 9٪ از کل منطقه را پوشش می‌دهد، اما 66.95٪ از رخدادهای موجود را ثبت می‌کند. مدل‌های SVM (6.4241)، CNN (5.3232)، و ANN (5.1835) با توجه به شیب‌های پایین‌تر خود کارایی کمتری دارند. رتبه اولویت مدل‌های نشان داده شده توسط منحنی‌های میزان موفقیت، رتبه بندی ثابت بر اساس منحنی‌های ROC است (شکل‌های 12 و 13).

Predictive Modelling of Mineral 13 — شکل 12. منحنی‌های میزان موفقیت پیش‌بینی (a) RF. (ب) SVMc؛) (ج) ANN; و (د) مدل‌های CNN.

Predictive Modelling of Mineral 14 — شکل 13. نقشه‌های آینده (الف) RF، (ب) SVM، (ج) ANN، و (د) مدل‌های CNN که مناطق پتانسیل دار مختلف را نشان می‌دهد که توسط آستانه‌های مشخص‌شده در شکل 12 مشخص شده‌اند.

با توجه به دقت طبقه‌بندی و قابلیت پیش‌بینی، می‌توان نتیجه گرفت که مدل CNN بهترین موتور تشخیص است، اما پیش بینی خوبی برای کاربرد MPM منطقه مورد مطالعه نیست، در حالی که مدل RF یک موتور تشخیص خوب و بهترین پیش بینی کننده است. مدل RF به‌عنوان مدل بهینه برای هدف‌یابی اکتشاف انتخاب می‌شود، زیرا راندمان پیش‌بینی‌کننده باید در فرآیند تصمیم‌گیری اکتشافات بیشتر مواد معدنی رتبه اول را داشته باشد. بنابراین، نقشه پیش‌بینی تولید شده توسط مدل RF به عنوان نقشه آینده پژوهی نهایی مورد استفاده قرار می‌گیرد (شکل 13a).

تفسیر زمین‌شناسی مدل‌های پیش‌بینی‌کننده و پیامدهای اکتشافات معدنی آینده

تفسیر نتایج مدل‌سازی با کمی کردن اهمیت نسبی هر یک از ویژگی‌های شواهدی که به مدل‌های پیش‌بینی نهایی کمک می‌کنند انجام شد (شکل 14). انومالی W مهم‌ترین سهم را در چهار مدل پیش‌بینی می‌کند، به دنبال آن انومالی منگنز، نزدیکی به توده‌های نفودی یانشانی و تراکم تقاطع‌های گسلی قرار دارند. سایر ویژگی‌ها به‌عنوان متغیرهای پیش‌بینی‌کننده در مدل‌سازی MPM سهم قابل‌توجهی ندارد. در میان متغیرهای پیش‌بینی‌کننده مهم، Wanomaly نشانه مستقیم کانی‌سازی هدف‌گذاری شده در منطقه مورد مطالعه است، بنابراین بیشترین تأثیر را بر مدل‌سازی پیش‌بینی‌کننده دارد. شایان ذکر است که انومالی منگنز تأثیر قابل توجهی بر مدل‌های پیش بینی کننده دارد.

چنین تأثیری حتی بیشتر از تأثیرات اعمال شده توسط نزدیکی به توده‌های نفودی یانشانی و ساختارهای منطقه ای است که عوامل کنترل کننده سنگ معدن به خوبی شناخته شده هستند.اگرچه W، منگنز، و آهن اجزای حیاتی ولفرامیت هستند که بر تنگستات سنگ معدن در منطقه مورد مطالعه غالب است، و انومالی ژئوشیمیایی مدت‌هاست که در اکتشافات معدنی عملی مورد تاکید قرار گرفته‌اند. آنومالی منگنز و آهن قبلاً نادیده گرفته می‌شد، زیرا فرض می‌شد همه عناصر تشکیل‌دهنده سنگ ولفرمیت از مایعات ماگمایی منشأ می‌گیرند.

با این حال، یک مطالعه اخیر نشان می‌دهد که آهن و منگنز حاصل از سنگ‌های میزبان، کنترل قاطعی بر بارش ولفرامیت در منطقه Panasqueira (پرتغال) اعمال می‌کند. و استنباط می‌کند که غنی سازی آهن در سنگ‌های میزبان منجر به غلبه فربریت (FeWO4) در سنگ معدن ولفرامیت می‌شود. برهمکنش سیال-سنگ ممکن است نقش مهمی در تشکیل ولفرامیت در استان جیانگشی جنوبی داشته باشد و غنی‌سازی منگنز/آهن در سنگ‌های دیواره ممکن است پیش‌نیاز تشکیل ولفرامیت باشد. برخی از شواهد در زیر به طور خلاصه آورده شده است.

(i) در یک کار اخیر انجام شده بر روی کانسار Xihuashan در منطقه مورد مطالعه، تجزیه و تحلیل LA-ICP-MS از ادخال سیال نشان می‌دهد که مایع معدنی در آهن و منگنز تخلیه شده است. وجود سیدریت و پیروفانیت در سنگ‌های دیواره شاهد رها شدن آهن و منگنز در هنگام دگرسانی سنگ دیواره است.

(ii) در یک کار منتشر نشده توسط Wu (یکی از نویسندگان همکار این مقاله)، دگرسانی شدیدی در سنگ‌های دیواره مجاور رگه‌های سنگی حاوی ولفرامیت در کانسار Piaotang در منطقه مورد مطالعه مشاهده شد. کلریت و بیوتیت با مسکوویت و پیروفانیت جایگزین شدند. پیروفانیت و کلریت باقیمانده که به طور گسترده در سنگ‌های دیواره توزیع شده‌اند، منطقه‌ای غنی شده از منگنز / آهن را تشکیل می‌دهند.

سنگ‌های دیواره نزدیک می‌توانند منبع منگنز/آهن کافی برای بارش ولفرامیت در هنگام برخورد سیالات غنی شده با W به این سنگ‌ها فراهم کنند. منبع فلزی منگنز/آهن از سنگ‌های دیوار می‌تواند توضیح دهد که چرا انومالی‌های منگنز تأثیر قابل‌توجهی بر مدل‌سازی آینده پژوه در این مطالعه دارند. همبستگی فضایی انومالی‌های منگنز و کانی‌سازی در منطقه مورد مطالعه نیز با تجزیه و تحلیل وزن شواهد آشکار می‌شود.

همچنین اشاره شده است که انومالی آهن اطلاعات شواهد کمی برای پیش‌بینی کانی‌سازی فراهم می‌کند، که ممکن است به (الف) اکثر هوبنریت (MnWO4) در سنگ‌های ولفرامیت از نهشته‌های W-Sn که بر کانی‌سازی چند فلزی W در منطقه مورد مطالعه غالب هستند، نسبت داده شود. (ب) تداخل بسترهای قرمز کرتاسه غنی شده با آهن که پس از کانی سازی W در منطقه مورد مطالعه تشکیل شده است. مواد کانه‌ساز سنگ‌های دیواره نقش مهمی در تشکیل سنگ‌های ولفرامیت ایفا می‌کنند و آنومالی منگنز باید به عنوان یک معیار مهم اکتشاف در نظر گرفته شود. این معیار ممکن است اکتشاف تنگستن آینده را تسهیل کند و بینش‌هایی را در مورد مدل ژنتیکی کانی‌سازی تنگستن در این منطقه ارائه دهد.

Predictive Modelling of Mineral 15 — شکل 14. وزن‌های به دست آمده توسط اطلاعات حاصله، نشان دهنده سهم هر یک از ویژگی‌های شواهد در پیش بینی‌ها است.

نتیجه‌گیری و کار آینده

مدل‌سازی پیش بینی آینده پژوهی مواد معدنی در استان جیانگشی جنوبی انجام شد. بر اساس داده‌های اکتشافی فراوان و اطلاعات جغرافیایی چندمنبعی در دسترس عموم، سه مجموعه داده ورودی شامل 118 رخداد شناخته شده، 118 مورد غیرقابل انتخاب به‌طور تصادفی و هشت ویژگی شواهد مرتبط با کانی‌سازی W تهیه شد. مجموعه ای از مدل‌های ML شامل RF، SVM و ANN، و همچنین مدل CNN یادگیری عمیق با استفاده از مجموعه داده‌های ورودی مختلف آموزش داده شد و عملکرد مدل‌های حاصل با ماتریس درهم ریختگی، منحنی ROC و منحنی نرخ موفقیت ارزیابی شد.

در فرآیند آموزش، مدل‌های CNN و RF دقت و پایداری زیادی در برابر تغییرات پارامترهای مدل ارائه می‌دهند. تحلیل حساسیت نشان می‌دهد که مدل‌های پیچیده با معماری پیچیده لزوماً عملکرد پیش‌بینی‌کننده را در MPM منطقه مورد مطالعه بهبود نمی‌بخشند. عملکرد پیش‌بینی مدل‌های آموزش‌دیده به‌منظور انتخاب بهینه برای تولید نقشه آینده‌پژوهی، به‌طور جامع مورد ارزیابی و مقایسه قرار گرفت. با توجه به دقت طبقه‌بندی، مدل CNN دقیق‌ترین عملکرد را به دست می‌آورد که 92.38 درصد از نمونه‌های برچسب‌گذاری شده را به درستی طبقه‌بندی می‌کند و به سایر شاخص‌های آماری مشتق‌شده از ماتریس‌های درهم امیختگی منجر می‌شود و به دنبال آن‌ها مدل‌های RF، SVM و ANN قرار می‌گیرند.

عملکرد کلی پیش‌بینی مدل‌های ML توسط منحنی‌های ROC ارزیابی شد، که نشان می‌دهد مدل RF از بقیه مدل‌های ML بهتر عمل می‌کند. منحنی‌های نرخ موفقیت نشان می‌دهند که مناطق آینده‌نگر شناسایی‌شده توسط مدل RF، رخدادهای W شناخته‌شده‌تر را در مناطق مشخص‌شده کوچک‌تر ثبت می‌کنند، که کارآمدترین عملکرد پیش‌بینی‌کننده را نشان می‌دهد. با توجه به اندازه‌گیری‌های فوق از ارزیابی مدل، مدل RF به عنوان بهترین مدل برای تولید مدل آینده‌نگر برای اکتشاف بیشتر در منطقه مورد مطالعه انتخاب شد.

مناطق با پتانسیل بالا 95/66 درصد از رخدادهای موجود را در 9 درصد از کل مساحت این منطقه به خود اختصاص می‌دهند. نتایج مدل‌سازی اهمیت نسبی ویژگی‌های شواهدی را که به پیش‌بینی‌ها کمک می‌کنند رتبه‌بندی می‌کند. مشخص شد که انومالی W، انومالی‌های منگنز، نزدیکی به توده‌های نفوذی یانشانی و تراکم تقاطع‌های گسلی مهم‌ترین ویژگی‌ها برای پیش‌بینی کانی‌سازی W هستند. انومالی‌های منگنز در سنگ‌های میزبان نشان‌دهنده یک معیار اکتشافی نوآورانه است که مدت‌ها در اکتشاف معدنی عملی در منطقه مورد مطالعه نادیده گرفته شده است و می‌تواند بینشی در مورد مدل ژنتیکی کانی‌سازی W در این منطقه ارائه دهد.

محدودیت‌هایی در MPM این مطالعه وجود دارد و کارهای بیشتری باید در آینده انجام شود. اولاً، اگرچه ارتباط فضایی و ژنتیکی انومالی‌های منگنز و کانی‌سازی W در این مطالعه نشان داده شده است، شایان ذکر است که منگنز در رسوبات بخار همزمان رسوب می‌کند و به واکنش اکسیداسیون – کاهش در آب حساس است. داده‌های قابل اعتمادتر، مانند داده‌های ژئوشیمیایی سنگ و خاک، باید هنگام استفاده از مدل آینده پژوه و هدف قرار دادن انومالی‌های منگنز به عنوان شاخص کانی‌سازی W در کار اکتشاف آینده جمع‌آوری و تجزیه و تحلیل شوند.

ثانیا، کاربرد مدل‌های ML را می‌توان افزایش داد. دو عامل اصلی وجود دارد که عملکرد سودمند مدل‌های هوش مصنوعی را در زمینه MPM تضعیف می‌کند: 1) موارد معدنی مورد استفاده برای آموزش مدل‌های ML در مقایسه با هزاران نمونه بکار رفته در زمینه تشخیص تصویر، کمیاب است. و 2) الگوی کانی‌سازی تحت شناسایی آنقدر پیچیده است که نمی‌توان آن را با داده‌های آموزشی محدود به‌طور مؤثر ثبت کرد. زیرا کانی‌سازی محصول نهایی فعل و انفعالات پیچیده فرآیندهای تشکیل سنگ است که نشانه‌هایی از الگوهای خود را در قالب ویژگی‌های مختلف زمین‌شناسی غیرخطی همبسته به جا می‌گذارد. در این راستا، تلاش‌های بیشتری از جمله مهندسی دانش محور و استفاده از بیان موثر لایه‌های قابل اطمینان ، با توجه به اینکه مشکل داده‌های ورودی کمیاب در این مرحله قابل حل نیست، باید به مدل‌های ML کمک کرد تا سیستم‌های معدنی پیچیده را در کار آینده یاد بگیرند.

دانلود منابع استفاده شده در مطلب

گفت‌وگوی تخصصی و تجربه کاربران

دیدگاه‌ها و تجربه‌های کاربران

پرسش، تجربه یا نکته تخصصی‌تان را بنویسید؛ پاسخ‌های مفیدتر با رأی کاربران برجسته می‌شوند.

۰ دیدگاه

۴,۴/ ۵

بر پایه ۷ رأی واقعی

تجربه یا پرسش خود را بنویسید لغو پاسخ

شفاف، محترمانه و تا حد ممکن کاربردی بنویسید تا گفت‌وگو برای دیگران هم مفید باشد.

امتیاز شما به این محتوا اختیاری

هنوز امتیازی انتخاب نشده است.

۰ / ۵۰۰۰

بعد از ارسال، کدام اعلان‌ها فعال شوند؟

پاسخ‌های این دیدگاهوقتی کسی به دیدگاه شما پاسخ داد، ایمیل دریافت کنید.دیدگاه‌های تازه این صفحهبا ثبت هر دیدگاه تازه در این صفحه باخبر شوید.

هر دو گزینه مستقل‌اند؛ انتخاب اعلان همه دیدگاه‌ها، پاسخ‌ها را هم پوشش می‌دهد. لغو اشتراک همیشه از داخل ایمیل ممکن است.

با ارسال دیدگاه، قوانین گفت‌وگوی محترمانه و انتشار عمومی متن را می‌پذیرید.

نام شما

ایمیل ایمیل شما منتشر نمی‌شود.

در این فیلتر هنوز دیدگاهی پیدا نشد

فیلتر دیگری را امتحان کنید یا اولین تجربه مفید را شما بنویسید.

رفتن به دیدگاه‌ها

مدلسازی پیش‌بینی‌کننده داده‌محور اینده نگری موادمعدنی با استفاده از یادگیری ماشین و روش‌های یادگیری عمیق

https://www.mining-eng.ir/?p=10750

فهرست مطالب

مدل‌سازی پیش‌بینی‌کننده داده‌محور اینده نگری مواد معدنی با استفاده از یادگیری ماشین و روش‌های یادگیری عمیق: مطالعه موردی از استان جیانگشی جنوبی، چین

چکیده

مقدمه

زمین‌شناسی منطقه‌ای و کانی‌سازی تنگستن

روش‌ها

1- جنگل تصادفی (RF)

2- ماشین بردار پشتیبانی (SVM)

3- شبکه عصبی مصنوعی (ANN)

4- شبکه عصبی پیچشی (CNN)

مجموعه داده‌ها و برنامه

1) متغیرهای پیش‌بینی کننده

2) متغیر هدف

3) آموزش مدل

4) ارزیابی مدل

نتایج و بحث

پیکربندی مدل و تأثیر آن بر دقت طبقه‌بندی

ارزیابی مدل و انتخاب نقشه چشم انداز

تفسیر زمین‌شناسی مدل‌های پیش‌بینی‌کننده و پیامدهای اکتشافات معدنی آینده

نتیجه‌گیری و کار آینده

جدیدترین مطالب رو در ایمیل خود دریافت کنید

این مطلب را با دوستان خود به اشتراک بگذارید

تجربه یا پرسش خود را بنویسید لغو پاسخ

اکتشاف معدن

استخراج معدن

فرآوری موادمعدنی

بازسازی معدن

بخش مهندسی معدن

بخش نرم افزارهای تخصصی

بخش معدنکاری دیجیتال و R&D

فرم گزارش

راهنمای دانلود