آشنایی با موضوع
«کلان داده یا طبق مصوبه فرهنگستان مه داده داراییهای دادهایاند بسیار انبوه، پرشتاب و/یا گوناگون که نیاز به روشهای پردازشی تازهای دارند تا تصمیمگیری، بینش تازه و بهینگی پردازش پیشرفته را فراهم آورند». کلان داده یا بزرگ دادهها مسیر حرکت کسب و کار و فرآیند چرخش کار در سازمانها را مشخص میکنند. در بزرگداده با دادههای متمایز و بزرگ که دائماً از لحاظ حجم، نرخ تولید داده و تنوع در حال تغییر هستند سروکار داریم.
در اینجا، دادههای پرشتاب دادههاییاند که با شتاب بالایی تولید میشوند. کلانداده از چند ۱۰ ترابایت به چندین پتابایت در یک مجموعهٔ داده دارد میگسترد. نمونههایی از کلانداده چنیناند: گزارشهای وبی، سامانههای بازشناسی با موجهای رادیویی، شبکههای حسگر، شبکههای اجتماعی، متنها و سندهای اینترنتی، نمایههای جستجوهای اینترنتی، اخترشناسی، مدرکهای پزشکی، بایگانی عکس، بایگانی ویدئو، پژوهشهای زمینشناسی و بازرگانی در اندازههای بزرگ.
کلانداده یا Big Data به حجمهایی از داده گفته میشود که در مقایسه با دادههای نسل قبلی با روشهای متداول قابل مدیریت و پردازش نباشند. مشکلات به وجود آمده در مدیریت و پردازش حجمهای عظیم اطلاعات شامل جمعآوری، آنالیز، نگهداری، انتقال، جستجو و به روزرسانی میشوند.
به عنوان نمونه یک کلاندادهی شناختهشده، اطلاعات موجود در پایگاه دادهی گوگل است که در هنگام جستجو میبایست در کسری از ثانیه مورد جستجو قرار گیرد. برآورد شده بیش از یک میلیارد سایت اینترنتی وجود دارند که در واحد زمان دهها سایت جدید و هزاران مطلب جدید به آن افزوده میشوند.
مدیریت و پردازش کلانداده
در شکل سنتی، تمامی فعالیتهای لازم برای مدیریت، پردازش و نتیجهگیری از دادههای خام توسط یک ماشین مرکزی یا یک نرمافزار DBMS قابل انجام بوده است. در هنگام مواجهه با حجم کلان دادهها، پردازش موازی توسط دهها، صدها و هزاران پردازشگر به صورت موازی تنها راه حل موجود است. زیرا توان سختافزارها و نرمافزارهای موجود برای انجام انفرادی این پردازشها بسیار ناچیز است.
چالش اصلی در پردازش کلانداده، شیوهی موازی سازی و تجمیع نتایج است. برای مثال سیستم جستجوگر گوگل در هنگام جستجوی یک کلمه توسط یک کاربر، میبایست کلمهی درخواستی را به دهها سرور ارسال کند تا هر یک بخشی از اطلاعات موجود در اینترنت را برای آن کلمه جستجو کنند. سپس یک هستهی مرکزی، نتایج دریافت شده از دهها سرور را در قالب یک صفحهی جستجو تجمیع کند و به کاربر نمایش دهد.
امنیت کلانداده
یکی از چالشهای پیش رو برای مدیریت کلانداده، حفظ امنیت آن است. تعیین دسترسی و مدیریت امنیتی دادهها شامل کدگذاری، اعتبارسنجی و دیگر جوانب امنیتی در حجمهای بزرگ چالشساز خواهد بود. حفظ امنیت در پردازشهای موازی به دلیل متمرکز نبودن سختافزار نیز از دیگر موارد است که حفظ امنیت کلاندادهها را با دشواری همراه میکند.
رویکرد
آناکاوی مجموع دادهها میتواند همبستگیهای جدید را پیدا کند، که مربوط به روندهای بازرگانی نقطهای، جلوگیری از بیماری، جُرمهای جنگی و. . . است. دانشمندان، بازرگانی، کارورزان صدا و سیما، تبلیغات و دولت، همانند مقررات، باعث مشکلاتی برای کلانداده در حوزههای مانند جستجوی اینترنتی، مالی و اطلاعات بازرگانی میشوند. دانشمندان با محدودیتهایی در کارهای علوم مواجهند که دربردارندهی هواشناسی، ژنتیک و اطلاعات، شبیهسازی فیزیکی پیچیده، و پژوهشهای محیط زیستی و زیستشناختی میباشد.
اندازه مجموعه اطلاعات در بخشی افزایش مییابد، به دلیل اینکه آنها از طریق ابزار موبایل که ارزان و بیش شمارند، آنتن هوایی (دریافت از راه دور)، وقفه نرمافزاری، دوربینها، میکروفنها، خواننده فرکانس رادیویی مشخص، و شبکههای دریافت بیسیم، جمعآوری میشوند. ظرفیت جهانی فناوری در هر واحد سرمایه، به منظور جمعآوری اطلاعات از دهه ۱۹۸۰ هر ۴۰ ماه دو برابر میشود. از سال ۲۰۱۲ هر روزه ۲٫۵ اگزابایت (۲٫۵×۱۰۱۸) اطلاعات ایجاد شده است. چالش موسسات بزرگ این است تعیین کنند که چه کسی ابتکار عملیات کلانداده را دارا میباشد که کل سازمان را در بر میگیرد. کارکردن با کلانداده به طور ضروری نادر میباشد؛ بیشتر آناکاویها در مورد اطلاعات سایز PC، مربوط به صفحه نمایش PC یا نوت بوک است، که میتواند مربوط به مجموعه اطلاعات قابل دسترسی باشد.
سیستمهای مدیریت پایگاه داده رابطهای، و وضعیت صفحه نمایش و بسته تصویری بیشتر با مشکلاتی در رابطه با دستکاری در کلانداده مواجهند. در عوض اینکار به اجرای نرمافزاری به طور همزمان در حجم گسترده و با دهها، صدها، و حتی هزاران سرور، نیاز دارد. آن چیزی که به عنوان کلانداده در نظر گرفته میشود، بر مبنای تواناییهای استفاده کنندگان از وسایل تفاوت دارد و گسترش تواناییها برای ایجاد کلانداده یک هدف میباشد؛ بنابراین، هر آنچه که کلان در نظر گرفته میشود یک سال بعد عادی میشود. برای برخی سازمانها، که با صدها گیگابایت اطلاعات برای اولین بار مواجهند، ممکن به در نظر گرفتن دوباره اختیارات مدیریت اطلاعات نیاز احساس شود. برای دیگران، ممکن است دهها یا صدها ترابایت باید حجم اطلاعات افزایش یابد تا به عنوان قابل توجه در نظر گرفته شود.
در این صفحه تعداد 1281 مقاله تخصصی درباره کلان داده که در نشریه های معتبر علمی و پایگاه ساینس دایرکت (Science Direct) منتشر شده، نمایش داده شده است. برخی از این مقالات، پیش تر به زبان فارسی ترجمه شده اند که با مراجعه به هر یک از آنها، می توانید متن کامل مقاله انگلیسی همراه با ترجمه فارسی آن را دریافت فرمایید.
در صورتی که مقاله مورد نظر شما هنوز به فارسی ترجمه نشده باشد، مترجمان با تجربه ما آمادگی دارند آن را در اسرع وقت برای شما ترجمه نمایند.
در صورتی که مقاله مورد نظر شما هنوز به فارسی ترجمه نشده باشد، مترجمان با تجربه ما آمادگی دارند آن را در اسرع وقت برای شما ترجمه نمایند.