لان داده یا بیگ دیتا (Big Data)
لان داده یا بیگ دیتا (Big Data) را میتوان یکی از اصطلاحات پُرتکرار در حوزه فناوری اطلاعات دانست که به کاربرد کلان داده در پزشکی، اقتصاد، بانکداری ، حسابداری و حسابرسی نیز میتوان اشاره کرد.
همهی ما با شنیدن بیگ دیتا یا کلان داده تا حدی میتوانیم معنای آن را حدس بزنیم: ظاهراً به زبان ساده میتوان گفت موضوع بیگ دیتا، به حجم زیاد دادهها مربوط است؛ حجمی که هر روز نیز رو به افزایش است و هر یک از ما، در هر مقیاسی که فعال باشیم، جلوههایی از آن را مشاهده و تجربه کردهایم.
تعریف کلان داده (گارتنر)
بیگ دیتا (Big Data) به معنای داراییهای اطلاعاتی [یک مجموعه یا سازمان] است که:
حجم بالا دارند
با سرعت زیاد تولید میشوند و / یا تنوع گسترده دارند
و نیازمند شیوههای پردازش نوآورانه با هزینهی مناسب هستند تا بتوان از آن برای اتوماسیون فرایندها، تصمیم گیری و بهبود شهود و بینش [در سازمان] بهره گرفت.
مدل ۳V بیگ دیتا (Big 3V Model)
در اغلب تعریف های کلان داده، سه اصطلاح حجم (Volume) و سرعت (Velocity) و تنوع (Variety) را میبینید. در حدی که گاهی برای تعریف بیگ دیتا از اصطلاح ۳V استفاده می شود.
اکثر مقالات کتابِ راهنمای کاربردهای بیگ دیتا هم همین تعریف ۳V را مبنای بحث خود قرار دادهاند .
قاعدتاً با این توضیحات، باید قانع شده باشید که الگوی ۳V (یا ۴V) مدل رایج و شناختهشدهای برای تعریف بیگ دیتا است و اکنون میتوانیم به سراغ تعریف دقیقتر این هر یک از این مولفهها برویم.
کاربردهای کلان داده چیست؟
وقتی از بیگ دیتا صحبت میکنیم، بیشتر از یک وضعیت حرف میزنیم؛ وضعیتی که در آن حجم زیادی از دادهها، با سرعت زیاد و تنوع گسترده تولید میشوند.
اما اینکه از چنین وضعیتی چگونه میتوان استفاده کرد، نیازمند دانشهای دیگری است. دانشمندان علوم دادهها (Data Scientists)، متخصصان هوش مصنوعی (Artificial Intelligence) و فعالان داده کاوی (Data-mining) از جمله کسانی هستند که میتوانند کاربردهای Big Data را در حوزههای مختلف بیابند و توسعه دهند.
بنابراین با وجودی که اصطلاح کاربردهای کلان داده (Big Data Applications) در فارسی و انگلیسی رایج است و ما هم آن را بهکار میبریم، همواره بهخاطر داشته باشید که منظور، کاربردهای تحلیل کلان دادههاست؛ وگرنه حجم و تنوع دادهها، به خودی خود کاربردی ندارد و اگر تحلیل و پردازش مناسب روی داده های حجیم انجام نشود، این دادهها از منظر مدیریت منابع، با سایر منابع هرز سازمانی تفاوتی نخواهند داشت.
قاعدتاً پرداختن به جزئیات این کاربردها، بحثی تخصصی بوده و فراتر از حوزهی تعریف شده برای درس سواد دیجیتال است. اما شاید نکات زیر بتواند سرنخی برای جستجوهای بیشتر و مطالعات کاملتر شما باشد:
کاربرد Big Data چیست؟ بررسی چند نمونه ساده
از جمله کاربردهای بیگ دیتا در زندگی روزمره میتوان به سرویس های مسیریابی مانند Waze و بخش Navigation در Google Maps اشاره کرد. حجم قابل توجهی از دادههای مربوط به وسایل نقلیهی در حال حرکت (در واقع: موبایلهای در حال حرکت) به صورت پیوسته و در لحظه، پردازش میشوند و مسیرهای مناسب بر اساس مقصد تعیین شده و ترجیحات کاربران به آنها پیشنهاد میشود.
در بحث مدیریت ارتباط با مشتری هم، CRM تحلیلی یکی از حوزههایی است که کاربرد کلان داده در آن کاملاً مشخص است و مرور درس CRM تحلیلی میتواند در این زمینه کمی به شما دید بدهد.
اگر با بخش بندی بازار و بررسی رفتار مشتریان هم آشنا باشید، بیتردید میتوانید تصور کنید که تحلیل بیگ دیتا چقدر میتواند مفید باشد و در این زمینه به کمک تصمیمگیران بیاید.
اگر با بحث شخصی سازی (Personalization) هم آشنا باشید، میتوانید حدس بزنید که تحلیل دادهها در حجم بالا، چگونه میتواند به برنامه ریزی برای شخصی سازی خدمات کمک کند.
البته شخصی سازی خدمات، حتی بدون تحلیل کلان داده هم امکانپذیر است. اما وقتی گزینههای پیش روی شما زیاد و منابعتان محدود باشد، طبیعی است که شخصی سازی بر اساس تحلیل بیگ دیتا میتواند اثربخشترین گزینهها را (در مقایسه با هزینهی هر گزینه) برای شما تخمین زده و برآورد کند.
سیستم های توصیه گر (Recommendation Engines) هم از جمله کاربردهای کلان داده ها در کسب و کارهای دیجیتال هستند و استفاده از Big Data در این زمینه، نتایج محسوس و ملموسی به همراه داشته است.
یکی از حوزههایی که همواره در بحث بیگ دیتا مورد توجه بوده، حوزه پزشکی است. علل مختلفی را برای این مسئله میتوان ذکر کرد:
اطلاعات عددی گسترده و متنوعی که میتوان از بیماران به دست آورد (در مقایسه با حوزههای کیفی)
میل انسانها به همکاری در حوزهی سلامت (با این فرض که میتواند برایشان دستاوردهای مفید داشته باشد)
اپلیکیشنها و ابزارهای متعددی که امروزه در حوزهی سلامت استفاده میشوند و دادههای فراوانی که تولید میکنند (فقط کافی است به سنسور شتابسنج موبایل خود فکر کنید که در بخش زیادی از روز، حرکتهای شما را ثبت میکند)
اما در بررسی کاربرد بیگ دیتا در پزشکی، مهم است که حوزههای مختلف را از یکدیگر تفکیک کنیم. مثلاً شاخهی پیش بینی از جمله حوزههایی است که امید نسبتاً بیشتری به آن وجود دارد و پیشرفتهای جالبتوجهی هم داشته است (شاید پروژهی Google Flu را بشناسید که هدف آن، پیشبینی آمار و روند شیوع آنفولانزا در نقاط مختلف، بر اساس میزان جستجوی کاربران بود).
شاخهی عارضهیابی و Diagnose، دومین حوزهای است که رشد محسوسی داشته است و امکان پردازش حجم زیاد تصاویری که از بیماران ثبت میشود، این امید را ایجاد کرده که بتوان در آینده فرصتهای ارزشمندی برای عارضهیابی خلق کرد.
حوزهی درمان و تصمیم گیریهای مربوط به آن، دشوارترین شاخه است و هنوز، باید زمان زیادی منتظر بمانیم تا دستاوردهای محسوس آن را مشاهده و تجربه کنیم.
اگر علاقهمند به مطالعهی بیشتر در زمینه کاربرد کلان داده در پزشکی و بهطور کلی حوزهی سلامت هستید، دو مقالهی زیر میتوانند نقطهی شروع مناسبی باشند:
Big Data Revolution in Healthcare (PDF)
Big Data Analytics in Healthcare (PDF)
فایل اول توسط مک کنزی تهیه شده و کمی عمومیتر است. فایل دوم، بیشتر از نظر منابعی که معرفی کرده مفید است. اغلب رفرنسهای معرفی شده، مطالب مفید و آموزنده و سادهای دارند. البته طبیعی است هر دو فایل با در نظر گرفتن مخاطب مبتدی معرفی کردهایم و اگر قصد داشته باشید به شکل تخصصی در این حوزه مطالعه کنید، باید به سراغ ژورنالهای تخصصی بروید.
سئو هم حوزهی دیگری است که به صورت گسترده از تحلیل Big Data استفاده کرده و نتایج آن را نیز همهی ما تجربه کردهایم.
طبیعتاً کاربرد کلان داده در حوزههای مختلف، بسیار فراتر از چند مورد محدودی است که در اینجا اشاره شد و در هر مورد، حتی کتابهای اختصاصی هم تألیف و منتشر شده است.
اما به طور کلی، باید به خاطر داشته باشید که Big Data هنوز بسیار جوان است و راهی بسیار طولانی در پیش است تا کاربردهای آن را به شکل تجاری و گسترده، در همهی زندگی خود ببینیم و تجربه کنیم.
میتوانید معرفی کتاب همه دروغ می گویند را هم بخوانید. این کتاب، میتواند برای کسانی که هیچ نوع آشنایی با بیگ دیتا و کاربردهای کلان داده ندارند مفید باشد.