فی موو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

فی موو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

دانلود پروژه وب کاوی و کاربرد های وب کاوی (فرمت word و باقابلیت ویرایش)تعداد صفحات 61

اختصاصی از فی موو دانلود پروژه وب کاوی و کاربرد های وب کاوی (فرمت word و باقابلیت ویرایش)تعداد صفحات 61 دانلود با لینک مستقیم و پر سرعت .

دانلود پروژه وب کاوی و کاربرد های وب کاوی (فرمت word و باقابلیت ویرایش)تعداد صفحات 61


دانلود پروژه وب کاوی  و کاربرد های وب کاوی (فرمت word و باقابلیت ویرایش)تعداد صفحات 61

عنوان پایان نامه : وب کاوی 

قالب بندی : Word

 

شرح مختصر : با افزایش چشمگیر حجم اطلاعات و توسعه وب، نیاز به روش ها و تکنیک هایی که بتوانند امکان دستیابی کارا به داده‌ها و استخراج اطلاعات از آنها را فراهم کنند، بیش از پیش احساس می شود. وب کاوی یکی از زمینه های تحقیقاتی است که با به کارگیری تکنیک های داده کاوی به کشف و استخراج خودکار اطلاعات از اسناد و سرویس‌های وب می پردازد. در واقع وب کاوی، فرآیند کشف اطلاعات و دانش ناشناخته و مفید از داده های وب می باشد. روش های وب کاوی بر اساس آن که چه نوع داده ای را مورد کاوش قرار می دهند، به سه دسته کاوش محتوای وب، کاوش ساختار وب و کاوش استفاده از وب تقسیم می شوند. طی این گزارش پس از معرفی وب کاوی و بررسی مراحل آن، ارتباط وب کاوی با سایر زمینه های تحقیقاتی بررسی شده و به چالش ها، مشکلات و کاربردهای این زمینه تحقیقاتی اشاره می شود. همچنین هر یک از انواع وب کاوی به تفصیل مورد بررسی قرار می گیرند که در این پروژه بیشتر به وب کاوی در صنعت می پردازم. برای این منظور مدل ها، الگوریتم ها و کاربردهای هر طبقه معرفی می شوند.

فهرست :

مقدمه

فصل دوم: داده کاوی

مقدمه ای بر داده کاوی

چه چیزی سبب پیدایش داده کاوی شده است؟

مراحل کشف دانش

جایگاه داده کاوی در میان علوم مختلف

داده کاوی چه کارهایی نمی تواند انجام دهد؟

داده کاوی و انبار داده ها

داده کاوی و OLAP

کاربرد یادگیری ماشین و آمار در داده کاوی

توصیف داده ها در داده کاوی

خلاصه سازی و به تصویر در آوردن داده ها

خوشه بندی

تحلیل لینک

مدل های پیش بینی داده ها

دسته بندی

رگرسیون

سری های زمانی

مدل ها و الگوریتم های داده کاوی

شبکه های عصبی

درخت تصمیم

Multivariate Adaptive Regression Splines(MARS)

Rule induction

Knearest neibour and memorybased reansoning(MBR)

رگرسیون منطقی

تحلیل تفکیکی

مدل افزودنی کلی (GAM)

Boosting

سلسله مراتب انتخابها

داده کاوی و مدیریت بهینه وب سایت ها

داده‌کاوی و مدیریت دانش

فصل سوم: وب کاوی

تعریف وب کاوی

مراحل وب کاوی

وب کاوی و زمینه های تحقیقاتی مرتبط

وب کاوی و داده کاوی

وب کاوی و بازیابی اطلاعات

وب کاوی و استخراج اطلاعات

وب کاوی و یادگیری ماشین

انواع وب کاوی

چالش های وب کاوی

مشکلات ومحدودیت های وب کاوی در سایت های فارسی زبان

محتوا کاوی وب

فصل چهارم: وب کاوی در صنعت

انواع وب کاوی در صنعت

وب کاوی در صنعت نفت، گاز و پتروشیمی

مهندسی مخازن/ اکتشاف

مهندسی بهره برداری

مهندسی حفاری

بخشهای مدیریتی

کاربرد های دانش داده کاوی در صنعت بیمه

کاربردهای دانش داده کاوی در مدیریت شهری

کاربردهای داده کاوی در صنعت بانکداری

بخش بندی مشتریان

پژوهش های کاربردی

نتیجه گیری

منابع و ماخذ فارسی

مراجع و ماخذ لاتین و سایتهای اینترنتی


دانلود با لینک مستقیم


دانلود پروژه وب کاوی و کاربرد های وب کاوی (فرمت word و باقابلیت ویرایش)تعداد صفحات 61

دانلود جزوه آزمایشگاه مقاومت و مصالح(فرمت word و باقابلیت ویرایش)تعداد صفحات 19

اختصاصی از فی موو دانلود جزوه آزمایشگاه مقاومت و مصالح(فرمت word و باقابلیت ویرایش)تعداد صفحات 19 دانلود با لینک مستقیم و پر سرعت .

دانلود جزوه آزمایشگاه مقاومت و مصالح(فرمت word و باقابلیت ویرایش)تعداد صفحات 19


دانلود جزوه آزمایشگاه مقاومت و مصالح(فرمت word و باقابلیت ویرایش)تعداد صفحات 19

عنوان جزوه :  آزمایشگاه مقاومت و مصالح ‎

قالب بندی :  word

قیمت :   4000

شرح مختصر :  کلیه قطعاتی که در ماشینها و دستگاههای صنعتی بکار برده می شود دارای مقاومت و سختی های مربوط به خود هستند که مهندسین بعد از طرح ریزی یک ماشین یا دستگاه صنعتی و کلیة محاسبات مربوط به نیروهای وارد بر هر قطعه از این دستگاهها می بایست که قطعات فوق را با قطعه ای با جنس همان از نظر سختی و مقاومتشان مورد آزمایش قرار می دهند تا متوجه شوند آیا قطعه مزبور تحمل نیروها و یا تنش های وارد بر خود را دارد یا نه؟ این سختی ها توسط ماشین ها و دستگاههای مختلف انجام می شود.

مقاومت مصالح چیست ؟  وقتی جسمی تحت تاثیر نیروی خارجی قرار می گیرد بر حسب مقدار و نحوة تاثیر نیرو از خود مقاومتهای مختلفی نشان می دهد . علمی که نحوة اثر نیرو به اجسام و عکس العمل را که آنها از خود نشان می دهد را بررسی می کند را مقاومت مصالح می گویند . مقاومت مصالح از روابط و نسبت بین نیروهای خارجی و قوای داخلی اجسام ( قوای به هم چسبندگی) ذرات جسم بحث می کند . این روابط به جنس جسم و ابعاد جسم و نحوة وارد آمدن نیرو بستگی دارد.

فهرست : 

هدف از آزمایشگاه مقاومت مصالح

مقاومت مصالح چیست ؟

اصطلاحات رایج در مقاومت مصالح

آزمایش کشش

تست پیچش

تست ضربه

سختی سنجی برینل

آزمایش خمش یا خیز


دانلود با لینک مستقیم


دانلود جزوه آزمایشگاه مقاومت و مصالح(فرمت word و باقابلیت ویرایش)تعداد صفحات 19

دانلود پاورپوینت نانومکاترونیک (فرمت ppt پاورپوینت با قابلیت ویرایش)تعداد صفحات 22 اسلاید

اختصاصی از فی موو دانلود پاورپوینت نانومکاترونیک (فرمت ppt پاورپوینت با قابلیت ویرایش)تعداد صفحات 22 اسلاید دانلود با لینک مستقیم و پر سرعت .

دانلود پاورپوینت نانومکاترونیک (فرمت ppt پاورپوینت با قابلیت ویرایش)تعداد صفحات 22 اسلاید


 دانلود پاورپوینت نانومکاترونیک (فرمت ppt پاورپوینت با قابلیت ویرایش)تعداد صفحات 22 اسلاید

دانلود پاورپوینت پیرامون نانومکاترونیک(با قابلیت ویرایش)تعداد صفحات 22 اسلاید

عنوان مقاله : نانومکاترونیک

قالب بندی : پاورپوینت

قیمت : 8000 تومان

شرح مختصر : – تا سال ۱۹۷۴ از لغت نانوتکنولوژی استفاده نشده بود تا اینکه یکی از محققین ژاپنی بنام نوریو تانیگوچی این لغت را در ارتباط با مهندسی مواد دراندازه های نانومتری مورد استفاده قرار داد. با تولید ساختارهایی در مقیاس نانومتر ، امکان کنترل خواص ذاتی مواد ازجمله دمای ذوب ، خواص مغناطیسی ، ظرفیت بار و حتی رنگ مواد بدون تغییر در ترکیب شیمیایی بوجود می ‌آید. امروزه مهندسین مکانیک در کنار فعالیت بر روی ابرسازه ها و ابرماشین ها بر روی سیستم های الکترو مکانیکی که در ابعاد میکرومتری ساخته میشوند نیز فعالیت بسیار وسیعی دارند. -میکرومترهایی که از کنار هم قرار گرفتن ساختارهای نانو ایجاد شده اند. هدف نانومکاترونیک ، ساخت دستگاه ها در ابعاد نانو می باشد. به مجموع مهندسی مکانیک , کنترل ,الکترونیک و کامپیوتر مهندسی مکاترونیک میگویند. ساختمان محصولات نانومکاترونکی از محصولات نانوالکترونیکی و نانومکانیکی یا به عبارتی دیگر نانوالکترومکانیکی ساخته شده است, که به صورت یک پارچه در کنار هم قرار گرفته و هوشمندانه ایفای نقش میکنند.

فهرست :

تعریف مکاترونیک

میدان تنوع مکاترونیک

نانو چیست؟

نانو

فناوری

یک نانومتر چقدر است؟

تاریخچه نانو و مکاترونیک

چرا کوچک سازی؟

اثر افزایش سطح

ساخت ساختار نانو مقیاس

نانوالکترونیک

نانومکانیک

نانومکاترونیک

نانورباتها در پزشکی

نحوه عملکرد نانو رباتها

منابع انرژی نانو رباتها

معایب نانورباتها

نانو جراحی

نانوربات رباتهای خود تخریب

منابع


دانلود با لینک مستقیم


دانلود پاورپوینت نانومکاترونیک (فرمت ppt پاورپوینت با قابلیت ویرایش)تعداد صفحات 22 اسلاید

دانلود پاورپوینت موتورهای هیدروژنی (فرمت پاورپوینت ppt با قابلیت ویرایش)تعداد صفحات 41

اختصاصی از فی موو دانلود پاورپوینت موتورهای هیدروژنی (فرمت پاورپوینت ppt با قابلیت ویرایش)تعداد صفحات 41 دانلود با لینک مستقیم و پر سرعت .

دانلود پاورپوینت موتورهای هیدروژنی (فرمت پاورپوینت ppt با قابلیت ویرایش)تعداد صفحات 41


 دانلود پاورپوینت موتورهای هیدروژنی (فرمت پاورپوینت ppt با قابلیت ویرایش)تعداد صفحات 41

عنوان پاورپوینت : موتورهای هیدروژنی

قالب بندی : پاورپوینت

قیمت : 8000 تومان

شرح مختصر : تلاش و تحقیق روزافزون برای رفع معایب و مسائل سیستم انرژی هیدروژنی وزن هیدروژن در مقایسه با سوختهای فسیلی برای به دست آوردن مقدار معینی انرژی تقریبا یک سوم، اما حجیم تر است. برای مقداری معین از انرژی، هیدروژن به شکل مایع ۸/۳برابر بنزین و در حالت گازی ۶/۳ برابر گاز طبیعی حجم را اشغال می کند البته در عمل این اضافه حجم ۲۰ تا ۲۵ درصد کمتر است، زیرا هیدروژن بسیار موثرتر از سوختهای فسیلی به سایر شکلهای انرژِی مصرفی، تبدیل می شود سرعت زیاد شعله و محدوده وسیع احتراق، هیدروژن،آنرا به سوختی مناسب برای موتورهای درون سوز، توربینهای گازی و موتورهای جت تبدیل کرده است هیدروژن در موتورهای درون سوز می تواند با بازدهی ۱۲ تا ۲۰ درصد بیش از سوختهای فسیلی به انرژی مکانیکی تبدیل می شود. همچنین، سبکی بیشتر هیدروژن در مقایسه با سوخت جت بویژه هیدروژن مایع نسبت به واحد وزن در مقایسه با سوخت جت همراه با محتوای انرژی بیشتری است. همین مسئله به هنگام استفاده از هیدروژن به عنوان سوخت در هواپیما، وزن نشستن هواپیما و در نتیجه مصرف سوخت را کاهش می دهد و استفاده از آن برای هواپیماهای مسافربری برتری دارد. از نتایج پژوهش ها چنین برمی آید که استفاده از هیدروژن مایع در موتورهواپیماهای مسافربری معمولی،۱۹درصد مصرف انرژی را نسبت به سوخت جت با پایه فسیلی، کاهش میدهد. در هواپیماهای مافوق صوت، این برتری به ۳۸در صد و در خودروهای درونسوز به ۲۰تا ۶۰ در صد می رسد.

فهرست :

منابع انرژی های نو و تجدید پذیر در جهان

میزان مصرف انرژی

میزان مصرف انرژی در بعضی از کشور های خاورمیانه

میزان مقبولیت سوخت هیدروژن

استفاده از سیستم انرژی هیدروژنی در مصارف روزمره

مزایای استفاده از سوخت هیدروژنی

برتری نسبی خواص هیدروژن در مقایسه با سوختهای فسیلی

طراحان بهترین موتور هیدروژنی

ذخیره سازی هیدروژن

زمان ذخیره سازی

مشکلات سرمایه گذاری

تفاوت احتراق بنزین و هیدروژن

سوخت‌رسانی فوق مدرن


دانلود با لینک مستقیم


دانلود پاورپوینت موتورهای هیدروژنی (فرمت پاورپوینت ppt با قابلیت ویرایش)تعداد صفحات 41

دانلود پاورپوینت طراحی صفحات وب

اختصاصی از فی موو دانلود پاورپوینت طراحی صفحات وب دانلود با لینک مستقیم و پر سرعت .

دانلود پاورپوینت طراحی صفحات وب


دانلود پاورپوینت طراحی صفحات وب

دسته‌بندی صفحات وب

دسته‌بندی صفحات وب در بسیاری از وظیفه‌های مدیریتی در وب نقش ضروری‌ای دارد. طبیعت غبرقابل کنترل محتوای وب چالش‌های جدیدی را برای این دسته بندی ایجاد می کند اما طبیعت متصل صفحات وب و همچنین حالت نیمه ساخت‌یافته آنها قابلیتهایی را فراهم می کند که به کمک این دسته‌بندی می‌آید. امروزه توسعه زیادی در زمینه دسته‌بندی هوشمند صفحات صورت گرفته است بطوری‌که بسیاری از محققین تمرکز خود را بر روی این قصیه قرار داده اند. در این مقاله ما رویکردهای دسته‌بندی صفحات وب را بررسی  می‌کنیم تا چشم انداز های جدیدی را برای تحقیات بیابیم. همچنین در ابتدا برخی از کاربردهای دسته‌بندی صفحات وب را بیان خواهیم نمود. همچنین خصوصیتها و الگوریتمهایی را که برای دسته‌بندی مفید هستند توضیح خواهیم داد.

کلمات کلیدی

دسته‌بندی صفحات وب، دسته‌کننده، درخت تصمیم‌گیری، دسته‌کننده بیزی، ماشین بردار پشتیبان، خصوصیات درون صفحه، خصوصیات مجاورین، انتخاب قابلیت

دسته‌بندی در بسیاری از وظایف مدیریت وبازیابی اطلاعات یک نقش حیاتی ایفا می کند.  در وب دسته‌بندی محتوی صفحات وب برای تمرکز خزیدن[1]، کمک به توسعه راهنماهای وب[2]، تحلیل بر اساس موضوع[3] لینکهای وب و برای تحلیل ساختار موضوعی وب ضروری است. دسته‌بندی صفحات وب همچنین می تواند به بهبود شرایط جستجوی وب نیز کمک نماید[1].

دسته‌بندی صفحات وب که به گروه بندی صفحات وب نیز معروف است عبارتست از فرایند نسبت دادن یک صفحه وب به یک یا چند گروه از پیش تعیین شده. دسته‌بندی اغلب بعنوان یک مسئله یادگیری مطرح می شود که در آن از یکسری داده های برچسب گذاری شده برای آموزش و تمرین دسته‌کننده استفاده می شود تا بر اساس آن دسته‌کننده بتواند داده ها را برچسب گذاری کند.

2- کاربردهای دسته‌بندی صفحات وب

2-1- ایجاد ، پشتیبانی یا توسعه راهنماهای وب

برخی از سایتها مانند Yahoo! و dmoz ODP یکسری راهنمای وب دارند که بر اساس آن می توان یکسری جستجو در گروههای از پیش تعیین شده انجام داد که در حال حاضر این راهنماها توسط انسان ایجاد می شوند. در جولای 2006 در dmoz ODP، 73354 ادیتور راهنما وجود داشت. با گسترش روزافزون صفحات وب دیدگاه سنتی به این قضیه دیگر نمی تواند موثر باشد . اما با استفاده از دسته‌بندی صفحات وب می توان این راهنماها را براحتی ایجاد کرد و توسعه داد[1].

2-2- بهبود کیفیت نتایج جستجو

گنگ بودن پرس و جوها[1] یکی از مشکلات اساسی برای نتایج جستجو می باشد. بعنوان مثال کلمه bank هم به معنی ساحل و هم به معنی بانک است. رویکردهای مختلفی برای بازیابی اطلاعات در اینگونه موارد مطرح گردیده است. Chekuri و گروهش دسته‌بندی اتوماتیک صفحات وب به منظور افزایش دقت جستجو در وب را مورد مطالعه قرار دادند. به یک دسته‌کننده آماری با استفاده از یکسری صفحات موجود آموزش داده شد، سپس این دسته‌کننده بر روی یکسری صفحات جدید بکار گرفته شد که یک لیست مرتب از گروهها را ایجاد کرد که صفحات وب می توانند در آن قرار گیرند. در زمان پرس و جو[2] از کاربر خواسته می شود تا یک یا چند گروه را انتخاب نماید بطوریکه فقط اطلاعات مربوط به آن گروه‌ها برگردانده می شوند یا اینکه موتور جستجو فقط یک لیست از گروه‌هایی را نشان می دهد که اطلاعات مورد نظر در آنها وجود دارد. اما این رویکرد فقط زمانی ثمربخش است که کاربر به دنبال یک چیز معلوم و مشخص بگردد

نتایج جستجو معمولاً بر اساس رتبه بندی نمایش داده می شوند. یک رویکرد ارائه شده توسط Chen and Damais نتایج جستجو را در یک ساختار سیسله مراتبی از پیش تعیین شده دسته‌بندی می کند و نتایج گروهبندی شده را نشان می دهد[4]. مطالعه کاربران آنها نشان می‌دهد که نمایش گروهی برای کاربران خوشایندتر از نتایج لیست شده است و برای کاربران جهت یافتن اطلاعاتشان موثرتر است. در مقایسه با روش قبل این روش در زمان پرس و جو اثر کمتری دارد زیرا گروه بندی صفحات در آن بصورت در جا[1] ایجاد می شود. در هر حال لازم نیست که کاربر گروه‌های مورد نظر خود برای جستجو را انتخاب نماید بنابراین این روش زمانی که کاربر مورد جستجو را دقیقاً نمی‌شناسد بسیار سودمند است.

متشابهاً Kaki نیز نمایش گروهی را برای نتایج جستجوی کاربران پیشنهاد داده است. آزمایشات وی نشان می دهد که نمایش گروهی برای کاربران بسیار مفید است مخصوصاً زمانی که رتبه بندی نتایج راضی کننده نیست[5].

Page and Brin الگوریتم رتبه بندی بر اساس لینک[2] را توسعه دادند که Pagerank نامیده شد. در این روش میزان معتبر بودن یک صفحه بر اساس یک گراف ایجاد شده از صفحات وب و لینکهایش و بدون در نظر گرفتن موضوع هر صفحه محاسبه می شود . Haveliwala رتبه‌بندی بر اساس موضوع را ارائه کرد که باعث محاسبه رتبه بندی چندگانه می شود بطوریکه رتبه بندی برای هر موضوع جداگانه خواهد بود . این روش نیاز به یکسری صفحات دارد که از قبل و با دقت دسته‌بندی شده باشند[1].

-3- کمک به سیستم‌های پاسخ به سوال[1]

یک سیستم پاسخ به سوال ممکن است تکنیکهای دسته‌بندی را برای بهبود کیفیت پاسخهایش بکار ببرد.

یک سوال جالب که در نوشته های سابق پاسخ داده نشده این است که چطور دسته‌بندی موضوعی صفحات وب در سیستمهای پاسخ به سؤال مفید است. در قسمت قبلی یک تعداد رویکرد در مورد استفاده از اطلاعات موضوعی صفحات وب برا ی بهبود کارایی جستجوی وب را دیدیم. بطور مشابه توسط تعیین گروه مورد انتظار پاسخ یک سوال و دسته‌بندی صفحاتی وبی که ممکن است شامل یک پاسخ کاندید باشند، یک سیستم پاسخ یه سوال می تواند در هر دو زمینه دقت و کارایی مفید واقع شود[1].

2-4- کاربردهای دیگر

در کنار کاربردهای ذکر شده، دسته‌بندی صفحات وب در فیلترینگ محتوای وب، کمک به مرور وب و ساختمان بر پایه دانش نیز می‌تواند مفید واقع شود.

3- تکنیک های دسته‌بندی صفحات وب

همانطور که اشاره شد دسته‌بندی صفحات وب شامل نسبت دادن اسناد وب به یکی از چند گروه از پیش تعیین شده است. برای نایل شدن به این هدف اسناد ورودی توسط یک مجموعه از مشخصات[2] که معمولاً خصوصیات[3] نامیده می شود توصیف می شوند. برخلاف خوشه‌بندی[4] اسناد وب که شامل آموزش بدون نظارت است، در دسته‌بندی یک مجموعه آموزشی از داده‌ها با برچسب‌گذاری قبلی نیاز است (یادگیری ماشین نظارتی). هدف دسته‌بندی تحلیل داده های ورودی و ایجاد یک مدل دقیق برای هر دسته با استفاده از این خصوصیات است. اسناد جدید در داخل یکی از این دسته ها دسته‌بندی می شوند.

در مسأله دسته‌بندی متن، مشخصات کلماتی هستند که درون اسناد متنی قرار دارند. انتخاب خصوصیت[1] در بسیاری از موارد قبل از یادگیری ماشین صورت می گیرد تا فضای خصوصیات[2] را کاهش دهد.

عموماً ما بین دسته‌کننده های بر پایه قانون[3] (قوانین بصورت دستی ساخته می شوند، و مجموعه حاصل از قوانین مکمل است که اصلاح شوند) و دسته‌کننده های با یادگیری استقرایی[4] تمایز قائل می شویم. دسته‌کننده های بر پایه یادگیری استقرایی توسط داده های آموزشی برچسب گذاری شده ساخته می شوند که برای ایجاد و به روزرسانی سهل و آسان هستند و به مهارتهای نوشتن قوانین[5] نیاز ندارند[3].

-1- دسته‌کننده‌های درخت تصمیم گیری[1]

دسته‌کننده درخت تصمیم گیری یکی از پر استفاده ترین روشهای یادگیری با نظارت است که برای کاوش[2] داده‌ها مورد استفاده قرار می گیرد. این دسته‌کننده برای تفسیر آسان است و می‌تواند بصورت قوانین if-then-else بازنمایی گردد. در این دسته‌کننده تابعی توسط مناطق ثابت تکه های تقریب زده می شود و به هیچ دانش قبلی از توزیع داده‌ها نیاز ندارد. این دسته‌کننده بر روی داده‌های پارازیت دار به خوبی کار می کند. یک دسته‌کننده درخت تصمیم گیری در اکتشاف داده ها به روش زیر کمک می کند:

•کاهش حجم زیادی از داده‌ها توسط تبدیل آن به یک نوع فشرده تر که خصوصیات ذاتی و اساسی را حفظ می کند و یک خلاصه دقیق را فراهم می کند.
•کشف می کند که آیا داده‌ها شامل دسته های به خوبی جدا شده[3] از اشیا هستند، بطوری که دسته ها بتوانند در متن یک تئوری حقیقی[4] بطور با معنی تفسیر شوند.
•داده ها را به شکل یک درخت نگاشت می کند بطوری‌که مقادیر پیش بینی بتوانند عقب گرد از برگ‌ها به ریشه تولید شوند. که ممکن است پیش بینی نتایج  برای یک داده یا پرس و جوی جدید استفاده شود.

الگوریتم‌های درخت تصمیم‌گیری اصلی در دو گروه زیر دسته‌بندی شده اند:

•دسته‌کننده‌ها از نوع یادگیری ماشین مانند ID3،  C4.5وCART.
•دسته‌کننده‌ها برای پایگاه داده‌ای بزرگ مانند SLIQ، SPRINT، SONARوRainForest.

شکل (2) : درخت تصمیم گیری برای ریسک رانندگی

یک دسته‌کننده درخت تصمیم گیری با استفاده از یک آستانه معین بر روی مقادیر ویژگیها یک مجموعه داده را بر اساس تصمیمات گسسته جدا می کند. یک گره ریشه در بالای ساختار درخت وجود دارد که خصوصیت را مشخص می کند که در ابتدا بر اساس بیشترین تفاوت(تبعیض) شکسته می شود. گره های داخلی درخت قوانین تصمیم گیری ساده ای را روی یک یا چند ویژگی نشان می دهد، بطوریکه گره های برگ برچسب دسته های پیش بینی شده هستند. مثلا در شکل شماره (2) که ریسک در رانندگی را مشخص می کند ابتدا درخت توسط خصوصیت سن تقسیم بندی شده است و سپس در مرحله بعد بر اساس نوع ماشین. همانطور که در شکل می بینید برگها دسته‌های تعیین شده بر اساس خصوصیات هستند.

فرایند ساخت درخت با یک درخت خالی شروع می شود و سپس مجموعه آموزشی وارد می شود و فرایند طبق روال زیر پیش می رود تا هیچ تقسیم دیگری در درخت ممکن نباشد:

.1اگر تمام نمونه های آموزشی در گره فعلی t به گروه Ci متعلق باشند یک گره برگ با دسته Ci بساز.
.2در غیر این صورت با استفاده از یک معیار مناسب به هر یک از مجموعه های تقسیم شونده S یک نمره بده.
.3بهترین تقسیم S* را بعنوان آزمایش در گره فعلی انتخاب کن.
.4فرزندان ایجاد شده بر اساس تقسیم S* را ایجاد کن و داده‌های آزمایشی را بر اساس S* به گره‌های فرزند تقسیم کن(افراز کن).
.5به یک فرزند پالایش شده[1] می گویند اگر تمام نمونه‌های آموزشی در t متعلق به همان دسته باشند. مراحل قبل را برای هر یک از فرزندان پالایش نشده[2] تکرار کن.

ساخت درخت می‌تواند توسط ماکزیمم ساختن اطلاعات متقابل[1] عمومی از کل درخت، یا توسط بهینه سازی محلی بهره اطلاعات[2] انجام گیرد. گاهی اوقات معیارهای فاصله ای مثل شاخص جینی[3] تنوع نیز استفاده می شود. هم بهینه‌سازی محلی بهره اطلاعات و هم معیار تقسیم بندی بر اساس فاصله درختهای کوچک، کم عمق و دقیق تولید می کنند.

به منظور جداسازی در یک گره الگوریتم بصورت زیر پیش می رود:

•یک ویژگی را که بهترین نمونه جداسازی از کلاسهای مختلف است را بر می دارد.

کمی کردن فاکتور شهودی برای اندازه گیری جداپذیری. یک I(S) پالایش نشده از یک مجموعه قراردادی S شامل   دسته را مشخص می کند، که می تواند بصورت زیر باشد:

اطلاعات بی نظمی بصورت زیر سنجیده می‌شود:(Entropy(S=

Entropy(S)=  (1)

بطوریکه Pi فراوانی نسبی دسته i در S است(یک احتمال قیاسی) که مقدار آن وقتی همه الگوها فقط متعلق به یک دسته باشند صفر است و مقدرا آن  زمانی که همه دسته‌ها به تعداد برابری هستند یک است.

نشانه گذاری جینی که بصورت زیر بیان می‌شود:

           Gini(S) = 1 -     (2)

محاسبه بهره اطلاعات در تقسیم S به r زیر مجموعه. این بعنوان ناخالصی S کمترین مجموع ناخالصی وزن دار هر زیر مجموعه شمرده می شود. برای مثال:

Gain(S,S1,…,Sr) = I(S) -

بطوریکه |S| کاردینالیتی S و I(S) فاکتور شهودی مشخص شده بعنوان هر Entropy(S) یا Gini(S).

•ویژگیهایی که بیشترین بهره اطلاعاتی را فراهم می کنند برای تقسیم بندی گره استفاده می شوند. بهر حال اول لازم است که تمام نقاط جداسازی ممکن برای هر ویژگی محاسبه شود[2].

ID3

 یک رویکرد نظری اطلاعاتی را بکار می برد. روند کار به این صورت است که در هر نقطه خصوصیتی را که بیشترین بهره اطلاعاتی یا بطور معادل بزرگترین کاهش در بی نظمی را دارد مورد آزمایش قرار می‌گیرد.

 بطوریکه  مجموع تعداد الگوهای برچسب دار است.

.1انتخاب خصوصیتی که منجربه حداکثر کاهش در بی نظمی یا بهره اطلاعاتی بر اساس معادله (3) می‌شود، برای استفاده بعنوان گره ریشه در درخت تصمیم گیری.
.2ایجاد سطح بعدی از درخت تصمیم‌گیری با فراهم کردن بیشترین کاهش در بی نظمی.
.3تکرار مرحله 1 تا 3. روند را ادامه دهید تا تمام زیر‌جمعیتهایی که از یک کلاس واحد هستند بهمراه بی‌نظمی سیستم صفر شود.

در این مرحله هر جایی که الگوها از یک دسته واحد باشند یک مجموعه از گره های برگ(زیر جمعیت) از درخت تصمیم‌گیری بدست می آید. توجه کنید که آنجا می تواند تعدادی گره باشد که نمی تواند بیشتر از این در مورد آنها تصمیم گیری گردد[2].

را فراهم کند برای شکستن گره انتخاب می شود.(2)

SPRINT 1

SPRINT یک دسته‌کننده درخت تصمیم گیری برای داده کاوی است که قادر است تا با مجموعه‌های آموزشی بزرگ بر روی دیسک کار کند بدون محدودیت بر روی اندازه مجموعه آموزشی، و به آسانی قابل موازی سازی است. برای هر ویژگی در مجموعه داده ها یک لیست نگهداری می شود. ورودیها در یک لیست ویژگی شامل مقادیر ویژگی، مقادیر دسته و شناسه رکورد(RID) است. الگوریتم این دسته‌کننده یک درخت درهم[2] مناسب با اندازه مجموعه آموزشی استفاده می‌کند تا RIDها را ذخیره کند.

روش کار: روش کار بصورت زیر خلاصه شده است:

•هر گره از دسته‌کننده درخت تصمیم‌گیری نیاز دارد تا بطور کارا تمام شکست‌های آن روی هر مقدار از هر ویژگی آن آزمایش گردد.
•بعد از انتخاب یک ویژگی برای تقسیم، نیاز است تا تمام داده‌ها درون زیرمجموعه بخش‌بندی شوند.
•مادامی که تقسیم روی ویژگی های عددی ارزیابی شود، داده ها بر اساس مقدار ویژگی مرتب شده و بصورت افزایشی شاخص گذاری جینی محاسبه می گردد.
•مادامی که تقسیم روی ویژگی های قطعی(بی شرط) صورت گیرد، شاخص گذاری جینی برای هر زیر مجموعه یافت می‌شود و بهترین انتخاب می گردد. برای مجموعه داده‌های بزرگ یک روش حریصانه به کار می رود[2]

جنگل بارانی[1]

مطالعات نشان می دهد الگوریتمی که بطور یکنواخت در سراسر مجموعه داده ها  دارای دقت  باشد وجود ندارد. از اینرو چارچوب عمومی متحد جنگل بارانی برای ایجاد درخت دسته‌بندی گسترش پیدا کرد که منجر به ایجاد نسخه مقیاس پذیری از یک بازه وسیعی از الگوریتمهای دسته‌کننده که با عرضه نمودن بهبود کارایی بالا، سریعترین الگوریتم دسته‌بندی مقیاس پذیر موجود گردید. بر خلاف SPRINT جنگل بارانی به یک حجم کمینه معین از حافظه اصلی متناسب با مجموعه مقادیر مجزا در یک ستون از رابطه های ورودی نیاز دارد. این الگوریتم عمومی می تواند به منظور فراهم کردن نسخه های مقیاس پذیر بیشتر دسته‌بندی‌ها و الگوریتم‌های موجود ساخت درخت رگرسیون در نوشته‌ها خاص گردد[2].

استخراج[2] قوانین دسته‌بندی از روی درختها

دانش رمز شده[3] توسط درخت‌های تصمیم‌گیری می‌تواند بصورت قوانین if-then استخراج گردد. برای هر مسیر از ریشه به سمت برگ یک قانون ساخته می شود و با جفت شدن هر مقدار ویژگی در طول یک مسیر یک ترکیب عطفی ایجاد می شود. گره برگ دسته پیش‌بینی شده را نگهداری می‌کند. درک قوانین برای انسان آسانتر است و سودمندی این قوانین در بهبود قابلیت فهم و قوانین بعدی(متعاقب) به منظور بهتر شدن تعامل انسان و ماشین نمی تواند نادیده گرفته شود.

دسته‌کننده بیزی نامقید[1]

برخلاف دسته‌کننده بیز ساده در این مورد فرض مستقل بودن کلمات در نظر گرفته نمی شود. این نوع یک نوع مشتق شده بصورت دسته‌کننده بیزی نیمه ساده است که متناوباً یک جفت از ویژگی‌ها را بهم متصل می کند تا فرضیات مستقل قوی را کاهش دهد. پیاده سازی آن ساده است و نتایج آن نیز براحتی قابل تفسیرند. از طرف دیگر بخاطر فرض استقلال شروط کلمات محاسبات آن پیچیدگی نمایی دارد[3].

یادگیرنده‌های برپایه نمونه

قوانین نزدیکترین مجاور بر پایه مفهوم کمترین فاصله دسته‌ها از نمونه‌هاست و می‌تواند هر یک از یک نمونه اولیه یا چندین نمونه اولیه را درگیر کند. وقتی الگوی یک کلاس به یک قالب محکم مربوط به یک الگوی معرف نوعی برای تمام دسته ها تمایل داشته باشد، ما یک نمونه اولیه تکی از آنها را استفاده می کنیم تا کمترین فاصله را محاسبه کنیم. اجازه دهید  نمونه اولیه برای دسته‌های  باشد، بطوری‌که فاصله بین نمونه‌ی قراردادی بردار  و امین نمونه اولیه داده شده توسط  بیان می‌شود.

وقتی یک اندازه گیری غیر اقلیدسی شبیه فاصله Mahalanobis استفاده شود، مشابه دسته‌کننده کمترین فاصله دسته‌کننده Mahalanobis نامیده می شود. داریم:

INSTANCE-BASED LEARNERS  typical representative

دسته‌کننده های فاصله کمینه

در این گروه از قوانین تصمیم‌گیری، فرضیه‌سازی از یک توزیع احتمال صورت نمی گیرد. دسته‌کننده فاصله کمینه، فاصله یک نمونه  را از الگوی اولیه هر دسته محاسبه می کند و نمونه را به دسته ای که نزدیکتر از بقیه است نسبت می دهد. Minimum distance classifiers

شامل29 اسلایدPOWERPOINT


دانلود با لینک مستقیم


دانلود پاورپوینت طراحی صفحات وب