ביצוע שאילתות בטבלה

Contents

שימו לב: על מנת להריץ את התאים ב-Live Code, יש לייבא תחילה את ספרית pandas ע”י הרצת השורת הראשונה בתא למטה.
בנוסף, נגביל את מספר השורות והעמודות שתופענה בהדפסת הטבלאות ע”י שורות הקוד השניה והשלישית:

import pandas as pd
pd.options.display.max_rows=5
pd.options.display.max_columns=5

ביצוע שאילתות בטבלה#

שאילתות לטבלה הן פקודות שמאפשרות לסנן, לבחור או לאתר נתונים מתוך הטבלה לפי תנאים מוגדרים מראש.

בחלק זה נתרגל את היכולת שלנו לבצע שאילתות מסוג אלה, באמצעות הכלים שלמדנו עד כה: Masking ו-sum.
בנוסף, ניעזר במתודה חדשה - ()count המבצעת ספירת ערכים. count, בדומה לsum, פועלת לפי הציר שהוגדר לה.

נטען תחילה את טבלת הציונים שלנו מחדש:

inputFileName = "files/StudentsGrades.csv"
df = pd.read_csv(inputFileName)  

כעת, נסחו שאילתות שמחלצות מהטבלה את הנתונים המבוקשים.

  1. מספר סטודנטים שנכשלו בכל אחד מהקורסים. יש לפתור בשתי שורות קוד.

# Write your code here
  1. כמה ציונים נכשלים יש בכל הטבלה. יש לפתור בשתי שורות קוד.

# Write your code here
  1. א. בכמה קורסים נכשל כל סטודנט - ללא שמות סטודנטים. יש לפתור בשתי שורות קוד.

# Write your code here
  1. ב. בכמה קורסים נכשל כל סטודנט - לפי שמות הסטודנטים. יש לפתור בשורת קוד אחת.

# Write your code here
  1. שמות כל הסטודנטים שנכשלו ב-Marine Biology או ב-Stellar Cartography. יש לפתור בשורת קוד אחת.

# Write your code here
  1. שמות כל הסטודנטים שקיבלו 90 ומעלה בArt וMath. יש לפתור בשורת קוד אחת.

# Write your code here
  1. שם הסטודנט בעל ממוצע הציונים הגבוה ביותר.

רמז

קראו בגוגל או שאלו את מודל השפה האהוב עליכם לגבי הפונקציות idxmin וidxmax של pandas.

# Write your code here

שימו לב

idxmax ו-idxmin מחזירים את שם השורה או העמודה (תלוי בaxis), ולכן בדרך כלל נשתמש בהם בשילוב עם loc.

ניתן להשתמש בidxmin או idxmax ללא שימוש בloc במקרים בהם לשמות השורות/העמודות עצמן יש את המשמעות הרצויה.

תרגיל#

איזה נתון חילצנו בקוד להלן?

print(df.drop('Name', axis=1).mean(axis=0).idxmax())
Art