مقدمه:
pandas یک کتابخانه پرکاربرد و قدرتمند در زبان برنامهنویسی پایتون است که برای کار با دادههای دستهای و تجزیه و تحلیل دادهها به کار میرود. در این پست وبلاگ، ما به بررسی برخی از کاربردهای pandas در پایتون میپردازیم.
نصب کتابخانه pandas:
ابتدا برای نصب pandas، دستور زیر را در خط فرمان وارد کنید:
pip install pandas
ایجاد یک DataFrame: دادهها در pandas به صورت ساختار DataFrame ذخیره میشوند. برای ایجاد یک DataFrame، ابتدا pandas را به پروژهی خود اضافه کنید:
import pandas as pd data = { 'نام': ['علی', 'سارا', 'رضا', 'نرگس'], 'سن': [25, 30, 35, 40], 'شهر': ['تهران', 'مشهد', 'اصفهان', 'شیراز'] } df = pd.DataFrame(data) print(df)
خواندن دادهها از فایل CSV: pandas قابلیت خواندن دادهها از فایلهای مختلفی را دارد. برای مثال، برای خواندن دادهها از یک فایل CSV میتوانید از کد زیر استفاده کنید:
import pandas as pd df = pd.read_csv('data.csv') print(df)
انتخاب دادهها: برای انتخاب ستونهای خاصی از دادهها، میتوانید از کد زیر استفاده کنید:
selected_columns = df[['نام', 'شهر']] print(selected_columns)
شرطی انتخاب کردن دادهها: گاهی اوقات ممکن است بخواهید دادههایی را که بر اساس شرط خاصی انتخاب شدهاند، استخراج کنید. برای این کار میتوانید از کد زیر استفاده کنید:
older_than_30 = df[df['سن'] > 30] print(older_than_30)
تغییر نام ستونها: گاهی اوقات ممکن است بخواهید نام ستونهای DataFrame را تغییر دهید. در این صورت میتوانید از کد زیر استفاده کنید:
df.rename(columns={'نام': 'نامکاربری', 'سن': 'عمر', 'شهر': 'محلسکونت'}, inplace=True) print(df)
مرتبسازی دادهها: برای مرتبسازی دادهها بر اساس ستون خاصی، میتوانید از کد زیر استفاده کنید:
sorted_df = df.sort_values(by='عمر', ascending=False) print(sorted_df)
گروهبندی دادهها: pandas امکان گروهبندی دادهها بر اساس ستون خاصی را فراهم میکند. برای مثال، برای گروهبندی دادهها بر اساس شهر و محاسبهی میانگین سن افراد، کد زیر را استفاده کنید:
grouped = df.groupby('محلسکونت')['عمر'].mean() print(grouped)
خلاصه: در این پست وبلاگ، ما به بررسی برخی از کاربردهای کتابخانه pandas در پایتون پرداختیم. از جمله ایجاد DataFrame، خواندن دادهها از فایل CSV، انتخاب دادهها، انتخاب دادهها بر اساس شرط، تغییر نام ستونها، مرتبسازی دادهها و گروهبندی دادهها بودند. این فقط بخشی از قابلیتهای pandas است و این کتابخانه هنوز قابلیتهای بیشتری برای کار با دادهها دارد.