אתחול מערכים ב-numpy

['orders_2_2024.csv', 'erosion.png', 'infile1.txt', 'countries-of-the-world.csv', 'monday.txt', 'StudentsGrades.csv', 'notebook_resources.zip', 'erosion_2.png', '__MACOSX', 'dog_noised.png', 'foods.txt', 'witcher_2.csv', 'dialation.png', 'evil_morty_change.png', 'ship.png', 'products2.csv', 'ex1.csv', 'evil_morty_change_3.png', 'evil_morty_1.png', 'baby.png', 'orders_3_2024.csv', 'koala.png', 'woman_noised.png', 'infile2.txt', 'orders_4_2024.csv', 'dog.png', 'witcher_1.csv', 'evil_morty_segmentation.png', 'out.txt', 'sunday.txt', 'ex2.csv', 'evil_morty_change_noised.png', 'dialation_2.png']

אתחול מערכים ב-`numpy`#

טקסט המופיע למטה בסגול מציין קטעים המופיעים בסרטון

ניתן להיעזר בו כדי לחזור על התכנים או לעיין בהם שוב.

האובייקט המרכזי בספריית numpy הוא מערך רב־ממדי (ndarray), או np.array.
המערך הוא מבנה נתונים הומוגני, כלומר כל האיברים שבו הם מאותו טיפוס. למשל, כולם מספרים שלמים או כולם שברים עשרוניים.
ניתן לחשוב על מערך גם כוקטור חד מימדי או כמטריצה של איברים (בדרך כלל מספרים).
ניתן לייצג במערכי numpy גם מבנים רב מימדיים כמו מטריצה תלת מימדית, אך לא נעסוק בכך במסגרת נושא זה.

בחלק זה נכיר דרכים שונות ליצור מערכים חדשים, ונלמד מעט פעולות אריתמתיות שניתן לבצע על מערכים כאלו.

יצירת מערך חדש#

באופן אינטואיטיבי, ניתן ליצור מערך על ידי המרה מרשימה (וקטור חד מימדי) או מרשימה מקוננת (מטריצה):

a = np.array([0, 1])
print('a is:' , a)
b = np.array([[1, 2 , 3], [4, 5, 6]])
print('b is: \n' , b)
c = np.array([[0.1, 0.2, 0.3], [0.4, 0.5, 0.6]])
print('c is: \n' , c)

a is: [0 1]
b is: 
 [[1 2 3]
 [4 5 6]]
c is: 
 [[0.1 0.2 0.3]
 [0.4 0.5 0.6]]

שימו לב

כדי ליצור ndarray שמייצג מטריצה, צריך לוודא שכל הרשימות המקוננות בעלות אורך זהה. אחרת, לא נקבל מטריצה.

פעולות אריתמטיות פשוטות#

בהנתן 2 מטריצות בעלות אותם מימדים, ניתן להפעיל עליהן פעולות אריתמטיות. לדוגמא, חיבור שתי מטריצות cell by cell מתבצע על-ידי פעולת החיבור.

b = np.array([[1, 2 , 3], [4, 5, 6]])
c = np.array([[0.1, 0.2, 0.3], [0.4, 0.5, 0.6]])
print(b+c)

[[1.1 2.2 3.3]
 [4.4 5.5 6.6]]

שימו לב! פעולת חיבור בין שתי מטריצות מוגדרת אך אם המימדים זהים.
אם ננסה לבצע חיבור על שתי מטריצות בעלות מימדים שונים, הפעולה תכשל:

a = np.array([0, 1])
b = np.array([[1, 2 , 3], [4, 5, 6]])
print(a+b)

---------------------------------------------------------------------------
ValueError                                Traceback (most recent call last)
Cell In[5], line 3
      1 a = np.array([0, 1])
      2 b = np.array([[1, 2 , 3], [4, 5, 6]])
----> 3 print(a+b)

ValueError: operands could not be broadcast together with shapes (2,) (2,3) 

יוצא דופן לכך הוא מקרה בו מחברים וקטור (חד מימדי) עם מטריצה שאורך שורותיה (כלומר, מס’ העמודות) זהה לאורך הוקטור: לפעולה כזו קוראים גם broadcasting.

b = np.array([[1, 2 , 3], [4, 5, 6]])
d = np.array([10,10,10])
print(b+d)

[[11 12 13]
 [14 15 16]]

דרכים נוספות ליצירת מערכים#

מעבר להמרה מרשימות, קיימות פונקציות שמסייעות לנו לאתחל מערך חדש בצורה פשוטה.
שתי פונקציות נפוצות המשמשות לצורך זה הן zeros ו-ones, המקבלות כארגומנט ראשון את מימדי הוקטור או המטריצה שרוצים לאתחל.

print(np.zeros(7))

[0. 0. 0. 0. 0. 0. 0.]

אם נרצה ליצור מטריצה, נעביר tuple של מימדי המטריצה (מספר השורות ומספר העמודות). שימו לב לסוגריים הנוספים עבור ה-tuple.

print(np.ones((2,5)))

[[1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1.]]

שימו לב!

הנקודות שמופיעות אחרי האפסים רומזות לנו שהערכים במטריצה הם מטיפוס float.

אם נרצה לשנות את איתחול המטריצה כך שתכיל ערכים מטיפוס אחר, נגדיר לפונקציה את הפרמטר dtype. לדוגמא, באתחול המטריצה להלן:

print(np.ones((2,3), dtype=int))

[[1 1 1]
 [1 1 1]]

עצרו וחישבו: מה אם נרצה לאתחל את המטריצה במספר קבוע, שאינו 0 או 1? הרי לא הגיוני לממש twos, threes וכן הלאה.

הדרך הכי אינטואיטיבית (למי שנושם אלגברה ליניארית), הוא להשתמש בכפל מטריצה במספר (סקלאר):

3.17*np.ones((3,2))

מערכים לא אחידים#

נניח שנרצה לייצר מערך שמייצג סדרה של מספרים.
היינו יכולים ליצור רשימה המכילה סדרה זו ולהעביר אותה לnp.array.

עצרו וחישבו: כיצד הייתם יוצרים סדרה של מספרים?

באמצעות range כמובן!
נזכיר כי הקלט לrange הוא אינדקס ההתחלה (כולל), אינדקס הסיום (לא כולל) והקפיצה של כל צעד בסדרה.

מסתבר ש-numpy מימשו עבורנו כבר פונקציה דומה בשם arange המבצעת פעולה דומה וחוסכת לנו את פעולת ההמרה:

print(np.arange(1, 10, 1))

[1 2 3 4 5 6 7 8 9]

לעומת range שראינו, באמצעות arange ניתן ליצור סדרות עם מספרים שבריים (float):

print(np.arange(1.5, 2.5, 0.1))

[1.5 1.6 1.7 1.8 1.9 2.  2.1 2.2 2.3 2.4]

מערכים עם מספרים אקראיים#

כעת נראה איתחול של וקטורים ומטריצות עם ערכים אקראיים.

באמצעות np.random.random, אשר מקבלת tuple המייצג את מימדי המטריצה, ניתן לאתחל ערכים אקראיים שבריים בין 0 ל-1.

rand_arr=np.random.random((2,5))
print(rand_arr)

[[0.13225601 0.25471896 0.7023657  0.95306447 0.57199155]
 [0.33567167 0.00642374 0.19916418 0.91582968 0.84576775]]

נסו בעצמכם

הריצו את התא למעלה בשנית. האם קיבלתם את אותם מספרים?

ואיך נוכל ליצור מערכים אקראיים בטווח מספרים אחר?#

באמצעות כפל בסקלאר ניתן “למתוח” או “לכווץ” את הטווח.

print(rand_arr*2)

[[0.26451202 0.50943792 1.40473141 1.90612893 1.14398311]
 [0.67134333 0.01284748 0.39832836 1.83165935 1.6915355 ]]

print(rand_arr*0.5) 

[[0.066128   0.12735948 0.35118285 0.47653223 0.28599578]
 [0.16783583 0.00321187 0.09958209 0.45791484 0.42288387]]

ובאמצעות הוספת סקלאר ניתן “להזיז” את טווח הערכים.

print(-4+rand_arr) 

[[-3.86774399 -3.74528104 -3.2976343  -3.04693553 -3.42800845]
 [-3.66432833 -3.99357626 -3.80083582 -3.08417032 -3.15423225]]

למעשה, ע”י הוספת והכפלה ניתן להגיע לכל טווח שנרצה. לדוגמא:

print(3+rand_arr*0.2)

[[3.0264512  3.05094379 3.14047314 3.19061289 3.11439831]
 [3.06713433 3.00128475 3.03983284 3.18316594 3.16915355]]

נסו בעצמכם! צרו מערך בעל 3 שורות ו2 עמודות המכיל ערכים אקראיים בטווח 10-12:

# Write your code here

לחצו כאן כדי לצפות בפתרון

rand_arr=np.random.random((3,2))
print(rand_arr*2 + 10)

ואם נרצה ערכים רנדומליים שלמים? לצורך כך, נוכל להשתמש np.random.randint. כאן, הערכים הראשונים שנעביר מייצגים את טווח המספרים השלמים מהם נרצה להגריל את המספר האקראי שלנו: המספר הראשון הוא תחילת הטווח (כולל), והשני סוף הטווח (לא כולל).
הפרמטר השלישי הוא טאפל המייצג את מימדי הוקטור/מטריצה.

print(np.random.randint(0,7,(5,2)))

[[0 4]
 [5 6]
 [0 5]
 [1 5]
 [5 2]]