دیتا ساینتیست کیست و چه کاری انجام می دهد؟
یکی از شغلهایی که بهواسطه گسترش اینترنت ایجاد شده، دانشمند دادهها یا دیتا ساینتیست (Data Scientist) است. امروزه شرکتها در دنیا دادههای بسیار زیادی از کاربران خود دارند که دوست دارند از آنها استفاده کنند تا خدمات بهتری به مشتری بدهند و سود بیشتری هم بکنند.
در این میان دیتا ساینتیستها افرادی هستند که میتوانند از لابهلای این حجم از دادههای متنوع، تصاویر دقیق و عمیق درباره فاکتورها مختلف از رفتارهای مشتری بگیر تا شرایط آینده را استخراج کنند. به همین دلیل هم دیتا ساینتیست در حال تبدیل به شغلی بسیار مهم است. شغلی که البته درآمد خوبی هم دارد.
دیتا ساینتیست، قهرمان عصر داده
عصر ما عصر دادهها و اقتصاد دادهها است. در حال حاضر روزانه ۲٫۵ میلیون ترابایت داده در اینترنت تولید میشود. همه اینها یا دادههای کاربرانی هستند که صرفا محتوا مصرف میکنند یا اینکه دادههای هستند که تولیدکنندگان در سایتهای گوناگون اینترنتی بارگذاری میکنند.
۲٫۵ میلیون ترابایت داده عدد بسیار بزرگی است؛ یعنی شما برای ذخیرهسازی دادههایی که هر روز در اینترنت تولید میشود ۲٫۵ میلیون هارد یک ترابایت لازم دارید. بخشی از این دادهها، دادههایی هستند که شرکتها از کاربران جمع میکنند و کاربران خواسته یا ناخواسته در اختیار شرکتها قرار میدهد، دادههایی مثل جنسیت، سابقه خرید اینترنتی، سابقه جستجو، موقعیت مکانی و سابقه وبسایتهای بازدید شده. این دادهها ساختار (structured) دارند و خواندنشان راحت است.
بقیه دادهها مثل پستهای وبلاگ، فیلم، عکس و کامنت دادههای بدونساختار (Unstructured) نام دارند. این دادهها هم حجمشان زیاد است (Volume)، هم تنوع زیادی دارند (Variety) و هم با سرعت بسیار زیادی تولید میشوند (Velocity). سه فاکتور حجم، سرعت و تنوع چیزهایی هستند که حوزه بیگ دیتا (Big Data) را تعریف میکنند. نکته اینجاست که مدیریت و ذخیرهسازی این حجم از دادهها چالش بسیار بزرگی است. چالشی که بیگ دیتا و فناوریهای آن سعی در حل آن دارند.
استخدام دیتا ساینتیست
فناوریهای بیگ دیتا به دو حوزه قابلتقسیم هستند. حوزه ذخیرهسازی و مدیریت دادهها و حوزه پردازش و تحلیل آنها. مشخص است که برای مدیریت این حجم از دادهها با ابزارهای بیگ دیتا یا باید کسی را استخدام کنیم یا مسئولیت نگهداری آن را به شرکتهای دیگر بدهیم.
وقتی شما حجم عظیمی از دادههای ساختاردار دارید که بیشتر آنها شبیه فایلهای اکسل با هزاران یا میلیونها داده هستند، ما برای اینکه بتوانیم واقعا از این دادهها استفاده کنیم و مثلا بفهمیم که بر اساس آنها چگونه استراتژیهای بازاریابی را تغییر دهیم، نیازمند این هستیم که این دادهها را تحلیل کنیم و از آنها سر دربیاوریم. تحلیلکردن این حجم از دادهها و فهمیدن اینکه چگونه از آن نتیجهای بگیریم، کار هر کسی نیست. استفاده از این دادههای نیازمند دانش دادههاست و کسی که این دانش را دارد و میتواند این دادهها را تحلیل کند، دانشمند دادهها یا دیتا ساینتیست است.
دیتا ساینتیست کسی است که مهارتهای متنوعی در حوزه نرمافزارها، برنامهنویسی در زبانهای گوناگون، هوش مصنوعی، مدیریت دادهها و دانش زیادی از بازارها، رفتارهای کاربران و روانشناسی آنها دارد و میتواند با تحلیل دادهها، تصاویر دقیقی از آنچه لازم است، ارائه دهد. او میتواند دادهها را مصورسازی کند و از آنها نمودارها و اینفوگرافیک تهیه کند و یا الگوهایی در دادهها بیابد که احتمالا پیش از آن قابلتصور نبوده است.
دیتا ساینتیست کارمندی پردرآمد
از آنجایی که اهمیت دادهها هر روز در دنیای ما بیشتر میشود، چندین سال است که شرکتها دیتا ساینتیست استخدام میکنند. این شغل در حال حاضر یکی از پردرآمدترین شغلهای دنیاست. تعداد کمی از شرکتهای ایرانی نیز در سالهای اخیر شروع به استخدام دیتا ساینتیست کردهاند اما با توجه به درصد بالای بیکاری در ایران، صرفا فارغالتحصیلان دکترا میتوانند در این شغلها استخدام شوند.
زیرا مثل دیگر شغلهای بازار کار آیتی در ایران، شرکتها در این حوزه هم دوست دارند یک نوبل فیزیک را با حقوق ۳ میلیون تومان استخدام کنند. یکی از دلایلی هم که بسیاری از شرکتهای ایرانی هنوز اقدام به استخدام دیتا ساینتیست نمیکنند، این است که دادههای آنها کم است.
این شرکتها یا دادههای چندانی از کاربران ندارند زیرا در بهترین حالت سیستمهای روابط عمومی ضعیف یا وبسایتهایی صرفا با ظاهر خوب دارند (البته اگر خوشبین باشیم!) و ابزارهایی برای جمعآوری دادهها ندارند و در بدترین حالت کلا اقدامی برای جمعآوری چنین دادههایی نکردهاند. همچنین بهدلیل نبود و یا محدودیت شدید ارتباط مالی با دنیا، این امکان که شرکتهای ایرانی بتوانند از گوگل داده دریافت کنند، سخت است. به همین دلیل هم ممکن است داده چندانی نداشته باشند که بخواهند دیتا ساینتیست استخدام کنند.
اما همه اینها در حال تغییر است. ما در دهه و شاید قرن اطلاعات زندگی میکنیم که بیگ دیتا یکی از مهمترین ترندها و مگاترندهای آن است. به همین دلیل دیر یا زود، شرکتهای ایرانی هم دیتا ساینتیست نیاز خواهند داشت. مطمئن هم باشید که اگر شما دیتا ساینتیست باشید، شغل خوبی با درآمد بالا خواهید داشت. به همین دلیل شاید بد نباشد بدانید چگونه میتوان دیتا ساینتیست شد.