تعرف على كيفية دمج Dataframes في Python

تعرف على كيفية دمج Dataframes في Python

إذا كنت تستخدم Python ، حتى لأبسط المهام ، فمن المحتمل أنك تدرك أهمية مكتبات الطرف الثالث. مكتبة Pandas ، مع دعمها الممتاز لـ DataFrames ، هي واحدة من هذه المكتبات.





يمكنك استيراد أنواع متعددة من الملفات إلى Python DataFrames وإنشاء إصدارات مختلفة لتخزين مجموعات بيانات مختلفة. بمجرد استيراد بياناتك باستخدام DataFrames ، يمكنك دمجها لإجراء تحليل مفصل.





معالجة الأساسيات

قبل أن تبدأ في الدمج ، يجب أن يكون لديك DataFrames لدمجها. لأغراض التطوير ، يمكنك إنشاء بعض البيانات الوهمية لتجربتها.





كيفية استيراد الأغاني من ipod إلى itunes

قم بإنشاء إطارات البيانات في بايثون

كخطوة أولى ، قم باستيراد مكتبة Pandas إلى ملف Python الخاص بك. Pandas هي مكتبة تابعة لجهة خارجية تتعامل مع DataFrames في Python. يمكنك استخدام ال يستورد بيان لاستخدام المكتبة على النحو التالي:

import pandas as pd

يمكنك تعيين اسم مستعار لاسم المكتبة لاختصار مراجع التعليمات البرمجية الخاصة بك.



تحتاج إلى إنشاء قواميس يمكنك تحويلها إلى DataFrames. للحصول على أفضل النتائج ، أنشئ متغيرين من المتغيرات في القاموس - ديكت 1 و dict2— لتخزين أجزاء معينة من المعلومات:

dict1 = {"user_id": ["001", "002", "003", "004", "005"], 
"FName": ["John", "Brad", "Ron", "Roald", "Chris"],
"LName": ["Harley", "Cohen", "Dahl", "Harrington", "Kerr-Hislop"]}

dict2 = {"user_id": ["001", "002", "003", "004"], "Age": [15, 28, 34, 24]}

تذكر ، يجب أن يكون لديك عنصر مشترك في كلتا قيم القاموس ، لتعمل كمفتاح أساسي لدمج إطارات البيانات الخاصة بك لاحقًا.





تحويل القواميس الخاصة بك إلى DataFrames

لتحويل قيم قاموسك إلى DataFrames ، يمكنك استخدام الطريقة التالية:

df1 = pd.DataFrame(dict1) 
df2 = pd.DataFrame(dict2)

تتيح لك بعض IDEs التحقق من القيم داخل DataFrame من خلال الرجوع إلى وظيفة DataFrame والضغط على تشغيل / تنفيذ . هنالك الكثير IDEs المتوافقة مع Python ، حتى تتمكن من اختيار الخيار الأسهل بالنسبة لك لتعلمه.





  مقتطف رمز دفتر Jupyter

بمجرد أن تصبح راضيًا عن محتويات إطارات البيانات الخاصة بك ، يمكنك الانتقال إلى خطوة الدمج.

دمج الإطارات مع وظيفة الدمج

وظيفة الدمج هي أول دالة في Python يمكنك استخدامها لدمج إطارين من DataFrames. تأخذ هذه الوظيفة الوسيطات الافتراضية التالية:

pd.merge(DataFrame1, DataFrame2, how= type of merge)

أين:

كيفية إزالة غناء من جرأة الأغنية
  • pd هو اسم مستعار لمكتبة الباندا.
  • دمج هي الوظيفة التي تدمج DataFrames.
  • إطار البيانات 1 و إطار البيانات 2 هما إطارا DataFrames المراد دمجهما.
  • كيف يحدد نوع الدمج.

تتوفر بعض الوسائط الاختيارية الإضافية ، والتي يمكنك استخدامها عندما يكون لديك بنية بيانات معقدة.

يمكنك استخدام قيم مختلفة لمعلمة كيفية تحديد نوع الدمج المطلوب تنفيذه. ستكون هذه الأنواع من الدمج مألوفة إذا كنت تفعل ذلك تستخدم SQL للانضمام إلى جداول قاعدة البيانات .

دمج اليسار

يحافظ نوع الدمج الأيسر على قيم DataFrame الأولى كما هي ويسحب القيم المطابقة من DataFrame الثاني.

  مقتطف رمز دفتر Jupyter

الدمج الصحيح

يحافظ نوع الدمج الصحيح على قيم DataFrame الثانية سليمة ويسحب القيم المطابقة من DataFrame الأول.

  مقتطف رمز دفتر Jupyter

الدمج الداخلي

نوع الدمج الداخلي يحتفظ بالقيم المطابقة من كل من DataFrames ويزيل القيم غير المطابقة.

  مقتطف رمز دفتر Jupyter

الدمج الخارجي

نوع الدمج الخارجي يحتفظ بجميع القيم المتطابقة وغير المتطابقة ويدمج DataFrames معًا.

  مقتطف رمز دفتر Jupyter

كيفية استخدام وظيفة Concat

ال concat تعتبر الوظيفة خيارًا مرنًا مقارنة ببعض وظائف الدمج الأخرى في Python. باستخدام وظيفة concat ، يمكنك دمج إطارات البيانات عموديًا وأفقيًا.

ومع ذلك ، فإن عيب استخدام هذه الوظيفة هو أنها تتجاهل أي قيم غير متطابقة افتراضيًا. مثل بعض الوظائف الأخرى ذات الصلة ، تحتوي هذه الوظيفة على عدد قليل من الحجج ، والتي لا يُعد سوى عدد قليل منها ضروريًا لسلسلة ناجحة.

concat(dataframes, axis=0, join='outer'/inner)

أين:

  • concat هي الوظيفة التي تنضم إلى DataFrames.
  • أطر البيانات هي سلسلة من DataFrames للتسلسل.
  • محور يمثل اتجاه التسلسل ، 0 كونه أفقيًا ، و 1 عموديًا.
  • انضم تحدد صلة خارجية أو داخلية.

باستخدام اثنين من إطارات البيانات أعلاه ، يمكنك تجربة وظيفة concat على النحو التالي:

قم بتوصيل الهاتف بالتلفزيون باستخدام USB
# define the dataframes in a list format 
df_merged_concat = pd.concat([df1, df2])

# print the results of the Concat function
print(df_merged_concat)

يجمع غياب المحور ووسائط الانضمام في الكود أعلاه بين مجموعتي البيانات. يحتوي الناتج الناتج على جميع الإدخالات ، بغض النظر عن حالة المطابقة.

وبالمثل ، يمكنك استخدام وسيطات إضافية للتحكم في اتجاه وإخراج دالة concat.

للتحكم في الإخراج مع جميع الإدخالات المتطابقة:

# Concatenating all matching values between the two dataframes based on their columns 
df_merged_concat = pd.concat([df1, df2], axis=1, join = 'inner')

print(df_merged_concat)

تحتوي النتيجة على جميع القيم المطابقة بين إطاري البيانات فقط.

  مقتطف رمز دفتر Jupyter

دمج DataFrames مع Python

تعد DataFrames جزءًا لا يتجزأ من Python ، مع الأخذ في الاعتبار مرونتها ووظائفها. نظرًا لاستخداماتها متعددة الأوجه ، يمكنك استخدامها على نطاق واسع لأداء مجموعة متنوعة من المهام بسهولة قصوى.

إذا كنت لا تزال تتعلم المزيد عن Python DataFrames ، فحاول استيراد بعض ملفات Excel ، ثم ادمجها بطرق مختلفة.