مقدمهای بر ترسیم گراف با پکیج ggplot2 و سایت های رسم شبکه های زیستی
تجسم نقش مهمی در فرآیند تصمیم گیری پس از تجزیه و تحلیل داده های مربوطه دارد. نمایش گرافیکی که وابستگی متقابل عناصر کلیدی مؤثر بر عملکرد را برجسته می کند در فرآیند فوق مهم است. کتابخانههای زیادی در پایتون و R وجود دارد که گزینههای مختلفی را ارائه میدهند که انواع تجسمهای هندسی و تصویری را نشان میدهند که میتواند جذاب و آموزنده باشد.
R از انواع توابع و بسته های تجسم داده برای ساخت تصاویر تعاملی برای تجزیه و تحلیل داده های اکتشافی پشتیبانی می کند. یکی از این کتابخانه های موجود در R، ggplot2 می باشد. این راهنما بر روی قابلیت های تجسم ggplot2 در R تمرکز خواهد داشت. شما یاد خواهید گرفت که چند طرح محبوب ایجاد کنید و آنها را با استفاده از ggplot2 در R سفارشی کنید.
ggplot2 چیست؟
ggplot2 در R آخرین نسخه معروف ابزار تجسم داده منبع باز ggplot برای زبان برنامه نویسی آماری R است. اصطلاح ggplot2 به نام پکیج مربوط می شود. ما از تابع ggplot() برای تولید نمودارها هنگام استفاده از بسته استفاده می کنیم. بنابراین، ggplot() فرمان است و کل پکیج ggplot2 نامیده می شود. این پکیج پرکاربردترین جایگزین برای گرافیک های پایه R است که بر اساس گرافیک است و بسیار انعطاف پذیر است. این به ما اجازه می دهد تا با افزودن لایه های بیشتر، گرافیک بسازیم و سفارشی کنیم.
این کتابخانه ایجاد نمودارهای آماده برای انتشار را ساده می کند. پکیج ggplot2 در R شامل تم هایی برای شخصی سازی نمودارها است. با اجرای تابع تم، رنگ ها، انواع خطوط، حروف چاپی و تراز طرح، از جمله موارد دیگر، قابل تغییر هستند. گزینههای مختلف به شما امکان میدهند نمودار را با افزودن عنوان، زیرنویس، فلش، متن یا خطوط شخصیسازی کنید.
Grammar of Graphics به ما کمک می کند تا نمایش های گرافیکی را از عناصر بصری مختلف بسازیم. این دستور زبان به ما اجازه می دهد تا در مورد اجزای طرح ارتباط برقرار کنیم. Grammar of Graphics توسط Leland Wilkinson ساخته شد و توسط Hadley Wickham اقتباس شد.
یک ggplot از چند جزء اساسی تشکیل شده است:
- داده: داده های خامی که می خواهید رسم کنید.
- Geometries geom: اشکال هندسی مورد استفاده برای تجسم داده ها.
- Aesthetics (): زیبایی شناسی مربوط به اشیاء هندسی و آماری، مانند رنگ، اندازه، شکل، مکان و شفافیت.
- Scales: شامل مجموعه ای از مقادیر برای هر نگاشت زیبایی شناختی در طرح است.
- تبدیل های آماری stat: مقادیر مختلف داده های مورد استفاده در نمودار را محاسبه می کند.
- سیستم مختصات coord: برای سازماندهی اجسام هندسی با نگاشت مختصات داده استفاده می شود.
- Facets: شبکه ای از نمودارها برای گروه های داده نمایش داده می شود.
- تم تصویری: عناصر بصری کلی یک طرح، مانند شبکهها و محورها، پسزمینه، فونتها و رنگها.
- برای استفاده از ggplot2، بایستی قبل از نصب ggplot2، R و R Studio را یاد بگیرید. از طرف دیگر، می توانید برای ggplot2 به سراغ Kaggle یا Google Colab بروید.
نصب ggplot2
برای نصب ggplot2 ابتدا با استفاده از تابع R “install.packages()” این پکیج را نصب می کنیم.
install.packages (‘ggplot2’)
توجه به این نکته مهم است که ggplot2 دارای چندین مجموعه داده از پیش نصب شده است. برای مشاهده کل لیست مجموعه داده های از پیش نصب شده، دستور زیر را اجرا کنید:
data ()
گرافیک با ggplot2
پکیج ggplot2 که توسط Hadley Wickham ایجاد شده است، یک زبان گرافیکی قدرتمند برای ایجاد طرح های ظریف و پیچیده ارائه می دهد. محبوبیت آن در جامعه R در سال های اخیر بسیار زیاد می باشد.
ggplot2 یک پکیج ترسیمی است که دستورات مفیدی را برای ایجاد نمودارهای پیچیده از داده ها در یک قاب داده ارائه می دهد. این یک رابط برنامهریزی برای تعیین اینکه چه متغیرهایی باید رسم شوند، چگونه نمایش داده میشوند و ویژگیهای بصری کلی را فراهم میکند و به ایجاد طرحهای با کیفیت انتشار با حداقل تنظیمات و تغییرات کمک میکند.
Ggplot2 به نام خود پکیج اشاره دارد. هنگام استفاده از پکیج، از تابع ggplot() برای تولید نمودارها استفاده می کنیم، بنابراین به ارجاعات استفاده از تابع به عنوان ggplot() و پکیج به عنوان یک کل به عنوان ggplot2 اشاره می شود.
همچنین بخوانید:
نویسنده: مریم آقازاده