سعی کردیم که در محتوای اول با بیان تعریف اولیهای از آمار و علم داده، به صورت بصری زمینۀ آشنایی با این مفاهیم را فراهم کنیم. آنچه در این محتوا مورد بررسی قرار میگیرد، ارتباط میان این دو علم است. علم آمار به عنوان یک حوزۀ علمی، به سال ۱۷۴۹ میلادی برمیگردد؛ اما علم داده تنها چند سال است که شناخته میشود. حوزۀ علم داده و آمار شباهتهای زیادی دارند و هر دو بر استخراج داده و استفاده از آن برای تجزیه، تحلیل و حل مشکلات تمرکز دارند؛ اما متخصص علم داده علاوه بر آشنایی با علم آمار، باید با برنامه نویسی، علوم کامپیوتر، یادگیری ماشین و ایجاد الگوریتم نیز آشنا باشد. با شناخت مفهوم این دو حوزه، میتوانیم شباهتها و تفاوتهای آنها را بهتر درک کنیم.
علم داده
دانشمندان در حوزۀ علم داده با هدف رسیدگی به مشکلات خاص یا پاسخ به سؤالاتْ دادههای منبع را سازماندهی، استخراج، تجزیه و تحلیل میکنند. آنها بر ایجاد سیستمهایی تمرکز میکنند که این تحلیلها را انجام داده و نتایج مفیدی تولید کنند. دانشمندانِ داده با کلاندادهها سروکار دارند و از حجم عظیمی از اطلاعات بهره میبرند. نقش آنها یافتن راههایی برای استخراج دادههای مرتبط از انبارهای اطلاعاتی است. دانشمندان این حوزه با شرکتهای مختلف کار میکنند و برخی دادهها را مورد تجزیه و تحلیل قرار میدهند تا بینشی ارائه دهند که به کسب و کارها در تصمیمگیری کمک کند. آنها همچنین میتوانند سازوکارهایی ایجاد کنند که تصمیمگیری را خودکار میکند؛ به عنوان مثال، یک دانشمند داده سیستمی را طراحی کرده که دادهها را از سابقۀ مشاهدۀ ویدیویی شما جمعآوری و از آن برای ارائه توصیههای شخصی در نتفلیکس استفاده میکند. بنابراین، دانشمندانِ داده بیشتر از آمارشناسان بر علومی مانند یادگیری ماشین و علوم کامپیوتر تمرکز دارند؛ آنها در ایجاد و استفاده از سیستمهای داده تسلط داشته، در حالی که آماردانان بیشتر بر معادلات و مدلهای ریاضیای که برای تجزیه و تحلیل خود به کار میبرند، تمرکز دارند. به دلیل تمرکز علم داده بر رایانهها و پایگاههای داده، بسیاری از مردم علم داده را شاخهای از علوم رایانه میدانند.
آمار
تمرکز اصلی آماردانان استفاده از مدلهای ریاضی و آماری برای تجزیه و تحلیل دادههاست. مانند علم داده، آمار نیز کاربردهای وسیعی دارد؛ همچون دانشمندان داده، آماردانان نیز اطلاعات را جمع آوری میکنند و از آن برای انجام تجزیه و تحلیل بهره میبرند. تمرکز آنها بر تجزیه و تحلیل دادهها، برای ارائه پاسخهایی است که میتواند به تصمیمگیری کمک کند. آماردانان از معادلات ریاضی و مدلهای آماری برای تجزیه و تحلیل دادهها و رسیدن به نتیجه استفاده میکنند. اگرچه ممکن است آنها روی موضوعات مختلف و مجموعۀ متفاوتی از دادهها کار کنند اما، آماردانان از ریاضیات برای انجام تجزیه و تحلیلْ کمی بهره میبرند. یکی از اهداف مشترک علم داده و آمار، کمک و راهنمایی در تصمیمگیری میباشد. همچنین تفاوت بین این دو، در روشی است که با استفاده از آن، اطلاعات را برای تصمیمگیری مورد تجزیه و تحلیل قرار میدهند.
تهیه کنندگان: امیرحسین اشتری، زینب پورسعیدی، فاطمه رضوی، زهرا آقابابایی، احسان سلمانی، عاطفه خیرالهی