K1inUSA
دیتا ساینس

چطور دیتا ساینس را شروع کنیم؟

شغل‌های حوزه‌ی تکنولوژی

شغل‌های حوزه‌ی تکنولوژی با توجه به تاثیر شگرفی که در زندگی ما گذاشته، برای افراد بسیار زیادی جذاب به نظر می‌رسد، به‌خصوص برای افرادی که قصد ورود به بازار کار دارند، البته Data Science به دلیل تِرِند بودن خواهان بیشتری دارد.
اگر با دیتا و کارکردن با آن لذت می‌برید و به آمار و احتمال علاقه‌مند هستید، Data Science می‌تواند در لیست شغل‌های مورد علاقه‌ی شما قرار بگیرد اما بهتر است، ویژگی‌های فردی خودتان را بهتر بشناسید و کمی با خود رو راست باشید و برای انتخاب درست‌تر، قسمت ابتدایی سری اول مجموعه مقالات RoadMap CMD را بخونید تا مثل بیشتر افراد شاغل وقتی مشغول کار هستید، عذاب نکشید

این مقاله به کمک: علی شاهد حق قدم (Principal Data Scientist at Freedom Financial Network)، علی موسوی (AI Resident at Google Brain)، کیوان ابراهیمی (Senior Data Scientist at View Inc)، مجید ابوالقاسمی (Data Scientist at Digikala.com) و امیر واهب (Data Scientist & Machine Learning Engineer at SabaIdea) نوشته شده و از زحمات‌شون متشکرم.

دیتا ساینس؟ Data Science؟ دانشمند داده؟

در حال حاضر در ایران بیشتر فعالیت دانشمندان داده (Data Scientists) استخراج و کار با داده‌هایی است
که از یک وب‌سایت یا اپلیکیشن استخراج می‌شود، درحالی که داده می‌تواند از سنسور‌ها، سیستم‌های صنعتی، پژوهش‌های اجتماعی یا … استخراج شود، همچنین می‌تواند عددی یا غیرعددی باشد.
شرکتی که کیوان ابراهیمی مشغول به کار هست، بیشتر بروی دیتاهایی که از سیستم‌های صنعتی جمع‌آوری می‌شود، کار می‌کند.

دیتا ساینس باعث بصیرت‌افزایی از داده‌ها می‌شود ،
یعنی با کشف روابط و معانی بین آن‌ها اطلاعات مفید و قابل فهمی استخراج می‌کند
که در نهایت به تحلیل و تصمیم‌گیری درست منجر می‌شود.

دیتا ساینس یک ترکیب چند رشته‌ای است،
از جمله رشته‌های آمار و احتمال و آنالیز عددی، که با جمع آوری داده‌ها، پیش پردازش داده‌ها، آماده سازی داده‌‌ها، تحلیل ویژگی‌ها، ماشین‌لرنینگ و کار با الگوریتم‌ها، منجر به کشف روابط و معانی بین داده‌ها می‌شود.

آنچه از Data Science تصور می‌شود

آنچه از Data Science تصور می‌شود
کار با الگوریتم و ماشین‌لرنینگ است درحالی که بیشتر زمان یک Data Scientist صرف جمع آوری و پردازش داده‌ها می‌شود
به همین دلیل مهم است که عاشق دیتا و کار با آن باشید.در حال حاضر Data Science مورد تهدید است یا بیشتر یک فرصت به‌ حساب می‌آید؟

باتوجه به وفور داده‌ها، فرصت‌های شغلی بسیاری در این حوزه وجود دارد که ممکن است باعث سردرگمی شود.
ممکن است پروژه‌های ترند جذاب به‌ نظر برسند
اما بعد ورود، از پروژه خسته بشوید و دل و دماغ کار کردن نداشته باشید.

کاربردهای دیتا ساینس

وجود دوره‌های کوتاه مدتی که وعده‌ی متخصص شدن در کوتاه مدت را می‌دهند،
انتظار شما را بالا می‌برند درحالی که Data Science از چند رشته تشکیل شده
و نیاز به یادگیری پیوسته در طولانی‌مدت دارد
و صرفاً به دانستن الگوریتم‌های ماشین‌لرنینگ و قدرت برنامه‌نویسی ختم نمی‌شود،
به همین دلیل نیازمند مطالعه و تلاش مداوم است.

برای هر کسب و کاری، رقبایی وجود دارد که باعث می‌شود مدیران کسب و کارها تصمیم‌هایی بر پایه‌ی داده‌های دقیق بگیرند،
از این رو نیاز به Data Science در کسب و کارها به شدت احساس می‌شود
اما انتظارهای غیر واقعی شرکت‌ها، اعتماد به این حوزه را کم‌رنگ‌تر می‌کند.

دیتا ساینس یکی از موضوعات ترند جامعه‌ی تکنولوژی به‌حساب می‌آید
و به سرعت در حال بروز رسانی و پیش‌روی است به‌ همین دلیل نیازمند مطالعه و یادگیری مداوم است
(از مقالاتی که در کنفرانس‌ها ارائه می‌شود، غافل نشوید)

دانشگاه از پایه‌های اصلی است؟

صحبتی که درحال حاضر درباره‌ی دانشگاه و خواندن رشته‌‌ی تحصیلی مرتبط مطرح است،
به مهم نبودن مدرک تحصیلی اشاره می‌کند.
این موضوع در صحبت‌های بیشتر افرادی که در دنیای تکنولوژی فعال و معروف هستند،
وجود دارد و همواره به گفته‌های این افراد استناد می‌شود؛
همچنین در فیلم‌هایی که موضوع استارت‌آپ‌ و تکنولوژی در آن‌ها مطرح است (مثل سریال سیلیکون‌ولی)

نمی‌توان گفت مرتبط بودن رشته‌ی تحصیلی مهم نیست اما ضروری هم نیست.
در صورتی که رشته‌ی تحصیلی مرتبط داشته باشید،
پیش‌نیازهایی مانند آمار و احتمال، جبر خطی، تئوری تخمین و اکتشاف (Estimation and detection theory)، مهارت حل مسئله، ساختمان داده و الگوریتم، پروسه‌های اتفاقی و برنامه‌نویسی را درصورتی که در دانشگاه به‌خوبی گذرانده باشید،
مسیر پیش‌رو، مسیر آسان‌تری است اما در صورت مرتبط نبودن رشته‌ی تحصیلی هم می‌توانید با تلاش بیشتر کاستی‌ها را جبران کنید.

دیتا ساینتیست چه مهارت‌هایی باید داشته باشد؟

یکی از مهارت‌هایی که کمتر مورد توجه است، فرایند مطرح کردن سوال و پاسخ دادن به سوال با استفاده از ابزارهاست اما مهم‌تر از این‌ها، توضیح ساده و قابل فهم پاسخ سوال به سایر افراد است.

از جمله مهارت‌هایی که دیتا ساینتیست باید داشته باشد:

قدرت برنامه‌نویسی (آشنایی با یکی از زبان‌های Python یا R)
آشنایی با الگوریتم‌ها و تئوری‌های ماشین‌لرنینگ
آشنایی با پایگاه‌های داده‌
تسلط نسبی بر آمار و احتمال
آشنایی با ابزارهایی مانند:
numpy ,pandas ,tensorflow، keras ,scikit-learn ,matplotlib
آشنایی با ابزارهای بیگ‌دیتا مانند spark و hadoop
مهارت حل مسئله
مصورسازی داده‌ها

ویژگی‌های فردی یک دیتا ساینتیست

مهم بودن خروجی داده‌ها و تاثیری که در تصمیم‌گیری‌های مدیران در کسب و کار دارد، نیازمند دقت فراوان، جزئی‌‌نگری و داشتن یک تصویر کلی از مسئله است. ممکن است برای بدست آوردن پاسخ یک مسئله، مدت زمان زیادی روی یک مسئله تمرکز کنید. به همین دلیل، صبر و پشتکار می‌طلبد و حل آن مسئله نیاز به خلاقیت و جسارت دارد؛ همچنین پس از حل مسئله به اولین جواب نیز اکتفا نکنید. شاید هم باید عاشق دیتا باشید که در کنار آن، حس کنجکاوی و اکتشاف برانگیخته شود.

برای شروع چه مهارت‌هایی یاد بگیریم؟

برای یادگیری Python می‌تونید در دوره‌های مقدماتی و پیشرفته‌ی جادی یا دوره‌ی Coursera, Udemy یا edx شرکت کنید. همچنین این مقاله از جادی، برای شروع Python را هم مطالعه کنید.

دوره‌ها و بوت کمپ‌های متعددی برای یادگیری مهارت‌های دیتا ساینس وجود دارد که در بین آن‌ها می‌توان به این بوت‌کمپ‌ها اشاره کرد:
Kaggle
Coursera
Udemy
دوره‌های آنلاین دانشگاه‌های Stanford و MIT در یوتیوب هم مفید هستند.
اگر امکان پرداخت هزینه‌ی دوره‌های Kaggle برایتان وجود دارد، حتماً شرکت کنید.

همواره مطالعه کنید و بروز باشید:

– مقالات arxiv منبع خوبی است.
– مقالاتی که در کنفرانس‌های معتبر ارائه می‌شود می‌تواند کمک کند، مثل کنفرانس ICEFR و ICML.
– مقالاتی که در Medium منتشر می‌شوند.
– مقالات towards.
– مقالات analyticsvidhya.
– همچنین می‌تونید از سرویس scholar.google.com استفاده کنید تا مقالات به‌روز برایتان ارسال شود.
در این کانال یوتیوب هم چندتا از دوره‌های دانشگاه MIT منتشر می‌شود.
کانال یوتیوب Deep Mind هم که از شرکت‌های زیر مجموعه گوگل است، ویدئوهای آموزشی منتشر می‌کند.

سایت analyticsvidhya یک مقاله درباره‌ی مسیر یادگیری Data Science در سال ۲۰۱۹ منتشر کرده و درباره‌ی مهارت‌هایی که باید یاد بگیرید توضیح داده اما Road map گرافیکی که در کنار این مقاله منتشر شده، مسیر یادگیری را پله پله ترسیم کرده و خیلی مفید است.

در این Repository توضیح کامل و خیلی جامعی در مورد Data Science داده شده، از پادکست، کتاب، اکانت توییتر گرفته تا کانال تلگرام و یوتیوب و مجله، اما بهتر است تصمیم نهایی‌تان را بگیرید و شروع کنید و پله پله پیشرفت کنید. فراموش نکنید که از انجام پروژه غافل نشوید و خیلی هم غرق در آموزش و ویدئو دیدن نشوید چون بخشی از یادگیری از انجام پروژه حاصل می‌شود.

توصیه‌ی علی: مثل هر کار دیگه، اگر قصد دارید در دیتا ساینس پیشرفت کنید باید وقت بذارید. راه میان بر نداره، هر کی گفت داره، یا کلاهبرداره یا نمی‌دونه چی داره میگه.

این مطلب ششمین مطلب از سری مطالب Road Map CMD است که هر یک درباره‌ی یک حرفه است. این مطالب برای کمک به افرادی است که شغلی را دوست دارند اما نمی‌دانند چگونه مسیر را شروع کنند.

توییت ایلان ماسک درمورد استخدام در تیم هوش مصنوعی شرکت تسلا

 توییت ایلان ماسک درمورد استخدام در تیم هوش مصنوعی شرکت تسلا

محمدرضا عبدلی (صفحه‌ی لینکداین)
مهندس نرم‌افزار در دیجی‌کالا

Avatar

محمدرضاعبدلی

ثبت نظر

کانال یوتیوب K1inUSA

عضویت در خبرنامه K1inUSA

    نوامبر 2024
    ش ی د س چ پ ج
     1
    2345678
    9101112131415
    16171819202122
    23242526272829
    30  
    مشاهدات بی واسطه ایرانیان از امریکا

    کانال یوتیوب K1inUSA را دنبال کنید.

    برنده ایرپادز پرو اپل شوید!
    اینجا کلیک کنید
    close-link
    برنده خوش شانس ایرپادز پرو اپل به ارزش 249 دلار باش!
    شرکت در قرعه کشی
    close-image