فی موو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

فی موو

مرجع دانلود فایل ,تحقیق , پروژه , پایان نامه , فایل فلش گوشی

پروژه بررسی الگوریتم های رتبه بندی صفحات وب. doc

اختصاصی از فی موو پروژه بررسی الگوریتم های رتبه بندی صفحات وب. doc دانلود با لینک مستقیم و پر سرعت .

پروژه بررسی الگوریتم های رتبه بندی صفحات وب. doc


پروژه بررسی الگوریتم های رتبه بندی صفحات وب. doc

 

 

 

 

نوع فایل: word

قابل ویرایش 160 صفحه

 

مقدمه:

رتبه‌بندی بخش کاملی از سیستم بازیابی اطلاعات می‌باشد. در مورد query وب، به علت اندازه وب و ماهیت ویژه کاربران وب، نقش رتبه‌بندی اهمیت پیدا می‌کند. داشتن هزاران میلیون نتیجه برای جستجوی تحقیق وب متداول می‌باشد. از طرفی کاربران وب زمان لازم را برای یافتن چنین مواردی ندارند. اثبات شده است که بیشتر کاربران وب فراتر از اولین صفحه نتایج عمل نمی‌کنند. بنابراین حصول نتایج مطلوب در صفحات مهم نیست در غیر این صورت عامل تحقیقاتی بی‌فایده خواهد بود.

بنابراین نیازهای کاربران به موقع جستجوی وب از بازیابی اطلاعات سنتی متفاوت هستند. به عنوان مثال، کاربری که جستجوی «میکروسافت» را به عامل تحقیقاتی وب مطرح می‌سازد، به احتمال قوی صفحة مخصوص شرکت میکروسافت را به جای صفحه کاربر تصادفی درباره محصولات میکروسافت جستجو می‌کند. در مفهوم بازیابی اطلاعات سنتی، صفحه کاربر تصادفی ممکن است با این جستجو در ارتباط باشد. اما کاربران وب به صفحات اختیاری علاقمند هستند یعنی منابع اطلاعاتی درست که دارای «حضوری قوی» در وب می‌باشند. در تحقیق وب، از «ارتباط» به «اختیار» تغییر شکل می‌دهیم. نقش رتبه‌بندی، شناسایی و درجه بندی مدارک اختیاری در مجموعه صفحات وب می‌باشد. بالاخره، وب بافتی غنی از اطلاعات را ارائه می‌نماید که به واسطه فوق پیوندها نشان داده می‌شود. فوق پیوندها  بافتی را ممکن است تعریف کنند که در آن صفحه وب پدیدار می‌گردد. بطور استنتاجی، پیوند صفحه p به q ، کیفیت صفحه q را تأیید می‌کند.

می‌توانیم به وب به عنوان شبکه‌ای از توصیه‌هایی فکر کنیم که حاوی اطلاعاتی درباره اعتبار صفحات می‌باشند.

بوسیله تابع رتبه‌بندی چنین اطلاعاتی حاصل گردیده و اختیار نسبی صفحات وب را منعکس می‌سازند. بر اساس این ایده، مقاله‌های اصلی Kleinberg «رتبه‌بندی تحلیل پیوندی» را معرفی نمودند که در آن از ساختارهای فوق پیوندی برای رتبه‌بندی صفحات وب استفاده می‌گردد.

در این مقاله در چارچوب هاب‌های تعریف شده توسط Kleinberg (1998) عمل شده است که دارای سه نقش زیر می‌باشند:

1) برخی از نقاط ضعف بالقوه الگوریتم HITS ارائه شده توسط Kleinberg (1998) را شناسایی کرده و الگوریتم‌های جدیدی ارائه شده اند که در آنها از روشهای متناوب برای محاسبه هاب و وزن‌های اختیار استفاده می‌گردد. دو الگوریتم از الگوریتم‌های جدید ما به روش آماری بیزی مبتنی هستند.

2) برای مطالعه الگوریتم‌های رتبه‌بندی تحلیل پیوند چارچوبی تئوریکی مشخص شده است. در این چارچوب ویژگیهایی مانند یکنواختی، پایداری، محل و برچسب مستقل مشخص شده است. همچنین ایده‌های مختلف شباهت موجود بین الگوریتم‌های رتبه‌بندی تحلیل پیوندی تعریف شده است. این ویژگیها به ما امکان می‌دهند یک شاخص اصولی از الگوریتم INDEGREE مشخص سازیم که گره‌ها را مطابق تعداد پیوندهای وارده رتبه‌بندی می‌سازند.

3) یک ارزیابی آزمایش وسیعی از الگوریتم‌ها را در مورد جستجوهای متعدد به عمل آورده شده است. ملاحظه می‌کنیم که هیچ روشی از «طرح موضوعی» کاملاً مصون نیست اما به نظر می‌رسد که برخی از این روشها نسبت به روشهای دیگر مقاوم‌تر هستند. برای درک بهتر رفتار الگوریتم‌ها، ساختارهای نموداری مورد مطالعه قرار خواهد گرفت. این تحقیق دیدگاه ارزشمندی در قالب دلایلی ارائه می‌نماید که مسایل جالب توجهی برای تحقیق آتی را مطرح می‌سازد.

 

فهرست مطالب:

فصل اول: مقدمه                                                                                                                       

فصل دوم: زمینه و تحقیق قبلی

2-1)پیشگفتار                                  

2-2)الگوریتم های قبلی                   

2-2-1)الگوریتم indegree                 

2-2-2)الگوریتم page rank                

2-2-3)الگوریتم hits                    

2-2-4)الگوریتم salsa                       

2-2-5)تحقیقات دیگر                    

فصل سوم: الگوریتم های رتبه بندی تحلیل رابط جدید                                   

3-1)الگوریتم میانگین هاب(hub avg)     

3-2)خانواده AT(K) آستانه مرجع الگوریتمها

3-3)الگوریتم max                     

3-4)الگوریتم جستجوی پهنایی(BFS)

3-5)الگوریتم Basian

6-3)الگوریتم Basian ساده سازی شده

فصل چهارم: چارچوب تئوریکی برای مطالعه الگوریتم های رتبه بندی تحلیل رابط

4-1)الگوریتم های رتبه بندی تحلیل پیوند      

 4-2)سنجش فاصله بین بردارهای LAR       

4-2-1)سنجش های فاصله هندسی            

4-2-2)سنجش فاصله مرتبه بندی           

4-3)شباهت الگوریتم های LAR              

4-3-1)نتایج شباهت                     

4-3-2)نتایج دیگر                        

4-4)پایداری                           

4-5)حالت موضوعی                       

4-6)یکنواختی                          

4-7)استقلال نشانه                      

4-8)ویژگی موضوعی الگوریتم INDEGREE    

فصل پنجم: ارزیابی آزمایش                  

5-1)مجموعه آزمایش                      

5-2)ارزیابی الگوریتم های LAR         

5-3)اثرات مجموعه ای                   

5-4)تفاوت نتیجه گیری برای تحقیقات آزمایش                                                                                                                                                   فصل ششم: رتبه بندی صفحات به صورت ارزش گذاری شده                                  

6-1)قائده رتبه بندی صفحات به صورت ارزش گذاری شده                            

6-2)الگوریتم رتبه بندی صفحات         

6-3)توصیف  page rank به صورت ساده شده    

6-4)رتبه بندی صفحات به صورت ارزش گذاری شده                                                                                 

6-5)تحقیقات                           

6-6)ارزیابی                          

6-7)تعیین ارتباط صفحات با پرسش ارائه شده

6-8)محاسبه و ارزیابی فهرست صفحات مرتبط با سئوال ارائه شده                      

6-9)تمرکز بر روی موضوع یا عنوان سئوالات ارائه شده                            

فصل هفتم: نتایج کلی                                            

 

فهرست شکلها:

شکل 1)الگوریتم hits                    

شکل 2)یک مثال نادرست برای الگوریتم hits

شکل 3)الگوریتم hub avg                 

شکل 4)یک مثال نادرست برای الگوریتم hub avg

شکل 5)الگوریتم at(k)                   

شکل 6)شباهت indegree,hits                  

شکل 7)شباهت hubavg,hits                   

شکل 8)مقایسه indegree,hub avg               

شکل 9)مقایسه hits_salsa و  hub avg_indegree                              

شکل 10)غیر یکنواختی authority avg          

شکل 11-a)گراف G                       

شکل 11-b)گراف G1                      

شکل 11-c)گراف G2                      

شکل 12-a)hub                           

شکل 12-b)ماتریس نقطه ای با 10 نتیجه   hub

شکل 13)نتیجه TCKبرای الگوریتم hits    

شکل 14)پرس وجوی سقط جنین             

شکل 15)hits,hub avg برای پرسش دستورالعمل ها

شکل 16)الگوریتمat-med,at-avg              

شکل 17)پرس و جوی پارک های سرگرمی     

شکل 18)ضابطه جسم شناور برای page rank  

شکل 19)hub,authorities                     

شکل 20)یک مثال از عملیات hits         

شکل 21)یک مثال از پیوند پیشین        

شکل 22)نسخه ساده شده  page rank         

شکل 23)پیوندها به یک وب سایت         

شکل 24)معماری مولفه های سیستم مورد استفاده برای طراحی و ارزیابی الگوریتم W

شکل 25)ارزش رابطه در برابر اندازه مجموعه صفحات پرس و جوی عامل مسافرتی برای WPR,page rank                                  

شکل 26)ارزش رابطه در مقابل اندازه مجموعه

 

فهرست جداول:

جدول 1                                                                    

جدول 2                               

جدول 3                               

جدول 4)ارزش رابطه برای پرس و جوی عامل مسافرتی page rank,WPR                  

جدول 5)ارزش رابطه برای پرس و جوی "تحقیق" تولید شده به وسیله page rank,WPR


دانلود با لینک مستقیم


پروژه بررسی الگوریتم های رتبه بندی صفحات وب. doc