چکیده:
ویژگی اندازه، اولین و تنها بعدی است که در هر زمان در اشاره به دادههای بزرگ، مورد توجه قرار میگیرد. این مقاله در تلاش برای ارائة تعریف گستردهتری از دادههای بزرگ است که دیگر ویژگیهای منحصربهفرد و تعریفشدة خود را کسب میکند. تکامل سریع و پذیرش دادههای بزرگ توسط صنعت، بحث را به سمت خروجیهای مورد پسندی میکشاند که مطبوعات علمی را مجبور به نائل آمدن به آن مینماید. مجلات علمی در بسیاری از رشتههای علمی، که از بحث مربوط به دادههای بزرگ سود میبرند، هنوز به بررسی کامل این موضوع نپرداختهاند. این مقاله به توصیفی تلفیقی از دادههای بزرگ، یکپارچهسازی تعاریف ارائهشده از مشاغل پزشکی و دانشگاهیان میپردازد. توجه اصلی این مقاله به روشهای تحلیلی مورد استفاده برای دادههای بزرگ است. ویژگی متمایز این مقاله، توجه به تجزیه و تحلیلهای مرتبط با دادههای بدون ساختار است که ۹۵% از دادههای بزرگ را تشکیل میدهند. در این مقاله بر نیاز به توسعة روشهای تحلیلی مناسب و مؤثر برای نفوذ و استفاده در حجمهای بزرگی از دادههای ناهمگن در زمینههای متنی، صوتی و ویدئویی بدون ساختار تأکید میشود. همچنین به اهمیت نیاز به تعبیة ابزارهای جدید برای تجزیه و تحلیلهای پیشگویانه برای دادههای بزرگ ساختاریافته پرداخته میشود. در عمل، روشهای آماری برای استنتاج از دادههای نمونه طراحی شدهاند. ناهمگنی، صدا (نویز)، و اندازة حجیم دادههای بزرگ ساختاریافته نیازمند توسعة الگوریتمهای محاسباتی کارا میباشد که ممکن است از بروز مشکلات دادههای بزرگ نظیر همبستگی کاذب اجتناب نماید.
کلیدواژهها: تحلیل دادههای بزرگ، تعریف دادههای بزرگ، تحلیل دادههای بدون ساختار، تحلیل پیشگویانه
فراتر از اغراق: مفاهیم دادههای بزرگ، روشها و تجزیه و تحلیل (مقاله لاتین + ترجمه 2014)