استفاده از کتابخانه pandas در پایتون برای کار با داده‌ها

مقدمه:
pandas یک کتابخانه پرکاربرد و قدرتمند در زبان برنامه‌نویسی پایتون است که برای کار با داده‌های دسته‌ای و تجزیه و تحلیل داده‌ها به کار می‌رود. در این پست وبلاگ، ما به بررسی برخی از کاربردهای pandas در پایتون می‌پردازیم.

نصب کتابخانه pandas:
ابتدا برای نصب pandas، دستور زیر را در خط فرمان وارد کنید:

 

pip install pandas

ایجاد یک DataFrame: داده‌ها در pandas به صورت ساختار DataFrame ذخیره می‌شوند. برای ایجاد یک DataFrame، ابتدا pandas را به پروژه‌ی خود اضافه کنید:

 
import pandas as pd

data = {
'نام': ['علی', 'سارا', 'رضا', 'نرگس'],
'سن': [25, 30, 35, 40],
'شهر': ['تهران', 'مشهد', 'اصفهان', 'شیراز']
}

df = pd.DataFrame(data)
print(df)

خواندن داده‌ها از فایل CSV: pandas قابلیت خواندن داده‌ها از فایل‌های مختلفی را دارد. برای مثال، برای خواندن داده‌ها از یک فایل CSV می‌توانید از کد زیر استفاده کنید:

 
import pandas as pd

df = pd.read_csv('data.csv')
print(df)

انتخاب داده‌ها: برای انتخاب ستون‌های خاصی از داده‌ها، می‌توانید از کد زیر استفاده کنید:

 
selected_columns = df[['نام', 'شهر']]
print(selected_columns)

شرطی انتخاب کردن داده‌ها: گاهی اوقات ممکن است بخواهید داده‌هایی را که بر اساس شرط خاصی انتخاب شده‌اند، استخراج کنید. برای این کار می‌توانید از کد زیر استفاده کنید:

 
older_than_30 = df[df['سن'] > 30]
print(older_than_30)

تغییر نام ستون‌ها: گاهی اوقات ممکن است بخواهید نام ستون‌های DataFrame را تغییر دهید. در این صورت می‌توانید از کد زیر استفاده کنید:

 

df.rename(columns={'نام': 'نام‌کاربری', 'سن': 'عمر', 'شهر': 'محل‌سکونت'}, inplace=True)
print(df)

 

مرتب‌سازی داده‌ها: برای مرتب‌سازی داده‌ها بر اساس ستون خاصی، می‌توانید از کد زیر استفاده کنید:

 

sorted_df = df.sort_values(by='عمر', ascending=False)
print(sorted_df)

 

گروه‌بندی داده‌ها: pandas امکان گروه‌بندی داده‌ها بر اساس ستون خاصی را فراهم می‌کند. برای مثال، برای گروه‌بندی داده‌ها بر اساس شهر و محاسبه‌ی میانگین سن افراد، کد زیر را استفاده کنید:

 

grouped = df.groupby('محل‌سکونت')['عمر'].mean()
print(grouped)

خلاصه: در این پست وبلاگ، ما به بررسی برخی از کاربردهای کتابخانه pandas در پایتون پرداختیم. از جمله ایجاد DataFrame، خواندن داده‌ها از فایل CSV، انتخاب داده‌ها، انتخاب داده‌ها بر اساس شرط، تغییر نام ستون‌ها، مرتب‌سازی داده‌ها و گروه‌بندی داده‌ها بودند. این فقط بخشی از قابلیت‌های pandas است و این کتابخانه هنوز قابلیت‌های بیشتری برای کار با داده‌ها دارد.

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *