[email protected]

מדריך מידג'רני למתחילים – חלק ב'

מאת: רויטל סלומון
נכתב ב-29 בנובמבר 2023

זהו החלק השני של מדריך מידג'רני, שנכתב על ידי רויטל סלומון – The Shark Lady.

בחלק הראשון למדנו מה זה מידג'רני, איך להירשם לדיסקורד, איך להירשם למידג'רני ואיך להזמין את הבוט לשרת פרטי. עכשיו מתחילים בתכל'ס.

החלק השני מסביר על הפרומפט – שורת הפקודה, וריאציות, שדרוג תמונה ופרמטרים. תמצאו כאן גם טיפים כלליים לעבודה כיפית ומעניינת עם מידג'רני.

המדריך עודכן ב-24 ביוני 2023, כדי לכלול את הפיצ'רים החדשים בגירסה 5.2 של מידג'רני.

מדריך מידג'רני – חלק ב'

תוכן עניינים:

הפרומפט

הגענו בעצם ללב-ליבה של העבודה עם מידג'רני – הפרומפט. כאן המקום שלכם להתבטא, להתנסות ולהשתגע, להיות יצירתיים ומופרעים, ברורים ומדויקים או מעורפלים. הכל הולך, ואני מציעה לא להינעל, לפתוח את הראש ולנסות כל מה שעולה על רוחכם. לפעמים התוצאות יהיו טיפשיות ולא מוצלחות, אבל הרבה פעמים תקבלו הפתעות מדהימות ומעוררות השראה.

אפשר לתת למידג'רני הוראות מאוד ברורות ומדויקות לגבי מה שצריך להיות בתמונה, והוא ימלא אותן במידה כזו או אחרת של הצלחה. אפשר גם לתת לו פרומפטים מוזרים ומעורפלים, או לתת לו חופש פעולה כמעט מוחלט, ולקבל יצירות ממוחו הקודח של AI. סביר להניח שאחרי מספר התנסויות, תבינו מה מתאים לכם יותר. כמובן, אם אתם רוצים להשתמש במידג'רני ככלי עבודה, תצטרכו לחדד את הפרומפטים שלכם כדי להגיע לתוצאות הרצויות. כתבתי גם מדריך ליצירת תמונות סטוק באמצעות מידג'רני, לשימושכם.

הערה, 9.5.2023: התחום של הבינה המלאכותית מתקדם במהירות מטורפת. כשכתבתי את המדריך הזה, בסוף ינואר 2023, היינו בגירסה 4 של מידג'רני כברירת מחדל (כל התוצרים במדריך הם של גירסה 4). מאז, קיבלנו כבר שתי גירסאות חדשות, וברירת המחדל של מידג'רני היא 5.1. אפשר לחזור לגירסאות קודמות באמצעות הפרמטרים (ראו בהמשך).

הפרומפט הבסיסי למידג'רני, זה שמייצר תמונה, מתחיל באמצעות לוכסן והמילה imagine, כך:

/imagine

הבוט מקבל פקודות נוספות, שאתם יכולים לראות ברגע שתקלידו לוכסן.

לאחר הפקודה הראשונית, הזינו את הפרומפט שלכם. אתם יכולים להיות מאוד מפורטים או קצרים וכלליים. לשם ההדגמה, נזין למידג'רני את הפרומפט: "a woman riding a horse". זה פרומפט מאוד גנרי ולא ספציפי, כך שאני בעצם נותנת למנוע בחירה די חופשית. זה מה שקיבלתי:

גריד ראשוני מידג'רני

כברירת מחדל, מידג'רני יפיק 4 תמונות קטנות בגריד. כדי לראות הגדלה של הגריד, המתינו שהבוט יסיים (יופיע 100% ליד שורת הטקסט) והקליקו על הגריד כדי לראות אותו בהגדלה. תופיע לכם גם אופציה Open in Browser, בצד שמאל למטה, וזה יראה לכם את הגריד באיכות הגבוהה ביותר הקיימת באותו רגע.

לכל ריבוע בגריד יש מספר, מ-1 עד 4. המספרים לא יופיעו בתמונות שהמנוע מפיק, הוספתי אותם לטובת המדריך. אבל, מתחת לתמונה יופיעו לכם ריבועים עם הצירופים U1-U4 וגם V1-V4.

בשלב זה, אתם יכולים להחליט אם אחת התמונות בגריד מצאה חן בעיניכם מספיק כדי שתרצו לשדרג אותה (Upscale). פקודת האפסקייל מגדילה את התמונה ומחדדת את הפרטים שלה. נניח שנבחר את תמונה מספר שתיים. נקליק כעת על הכפתור U2, ונקבל גירסה איכותית וגדולה יותר של התמונה ועוד אפשרויות לשחק איתה.

בשלב הזה, אפשר לבקש ממידג'רני לעשות זום אאוט לתמונה. כלומר, להתרחק מהאובייקט ולהשלים את הסביבה באופן אוטומטי. אפשר לבקש זום אאוט פי שניים או פי 1.5, או לבחור Custom Zoom ולתת מספר בין 1 ל-2.

נקליק על Zoom Out 2X ונקבל את התוצאה הבאה:

גריד תמונות אחרי זום אאוט

אפשר לראות שהתמונות די דומות. האישה והסוס נשארו אותו דבר, אבל הסביבה מעט שונה בכל תמונה לאחר ביצוע ה-Zoom out. מכאן אפשר לבחור שוב תמונה אחת להגדלה. ניקח את תמונה מס' 2.

קחו בחשבון שכל פעולה שאתם עושים – שדרוג, וריאציות, פרומפט – עולה לכם בקרדיטים. סביר להניח שתגלו מהר מאוד מה מתאים לכם יותר, ותוכלו לוותר על פעולות לא נחוצות, כדי להוציא את המקסימום מהמנוי.

עדכון, 29.11.2023

מידג'רני הוסיפו כמה אפשרויות של משחק עם התמונה לאחר ה-upscale. אפשר לראות בתמונה אחרת של אישה רוכבת על סוס, שהגדלתי:

מידג'רני עדכונים UPDCALE

אפשר לעשות וריאציות על אזור מסוים – Vary Region (זה לא עובד בצורה מושלמת, כתבתי על זה כאן).

מה שכן, האופציה לעשות Upscale פי 4 היא די מרהיבה, ונותנת תוצאות מרשימות מאוד. התמונה המתקבלת היא בנפח של כ-20 מגה, וברזולוציה של 4,096 פיקסל על 4.096 פיקסל. הנה היא כאן, כמובן בגירסה מוקטנת, ואחרי שגם עשיתי זום אאוט:

מידג'רני אפסקייל פי 4

וריאציות

כבר בגריד הראשוני, וגם אחרי שעשיתם Upscale, אפשר לבקש וריאציות לתמונה. אבל יש הבדל – אם אתם מבקשים וריאציות בשלב הגריד (על ידי הקלקה על V1-V4), תקבלו וריאציות עם הבדלים מאוד מינוריים. לעומת זאת, אם תעשו אפסקייל לתמונה, תוכלו לבקש Vary (Strong) – וריאציות חזקות.

בואו ננסה את הווריאציות החזקות, מכיוון שהווריאציות העדינות יוצרות תמונות מאוד דומות למקור, וזה פחות מוצלח בעיניי ולא שווה לבזבז על זה קרדיט. חזרתי לתמונה המקורית לפני הזום אאוט, והקלקתי על Vary (Strong). הווריאציות החזקות הן פיצ'ר חדש יחסית, מאז גירסה 5.2, ובניגוד לווריאציות רגילות – אפשר בהחלט לראות את ההבדלים.

מידג'רני וריאציות חזקות

 

 

פרומפטים מתקדמים ורעיונות לפרומפטים

אפשר לראות שכשנותנים למידג'רני פרומפט לא מפורט מספיק, התוצאות בדרך כלל לא מדהימות. מדובר בהחלט בתמונות שמישות, אבל אם אתם רוצים לבדוק את הצד היותר יצירתי של המנוע, אתם צריכים להיות ברורים יותר במה שאתם רוצים, או ללכת למחוזות המופשט ואפילו המופרך.

מה אפשר להוסיף לפרומפטים של מידג'רני?

האמת היא שהרבה מאוד – ואין שום מדריך בודד שיכסה את כל האפשרויות. תצטרכו לחקור, להסתכל על פרומפטים של אחרים, לנסות ולטעות ולגלות דברים מעניינים בעצמכם. הנה כמה אפשרויות בסיסיות:

שמות של אמנים מפורסמים: מידג'רני יודע לחקות סגנונות של ציירים ואמנים מפורסמים. אם תוסיפו את שם האמן לפרומפט, תקבלו תמונה בסגנון של אותו אמן. למשל, זה מה שקיבלתי כשביקשתי מחשב Apple ][ בסגנון רנה מגריט:

אפל 2 רנה מגריט

כאן יש רשימה עצומה ומצוינת של אמנים שמידג'רני יודע לחקות, ביחד עם הסגנון שלהם. באתר הזה יש גם כן רשימה מעולה עם דוגמאות.

אפשר כמובן להוסיף גם את סגנון הציור (למשל: ציור בצבעי מים), ולראות מה מקבלים. הנה אישה רוכבת על סוס בציור צבעי מים:

סגנון צבעי מים

לשם הדוגמה, נישאר עם האישה שרוכבת על הסוס. אבל בואו ננסה לייצר תמונה יותר מעניינת. לשם כך, אפשר להוסיף שמות תואר. התוצאה כאן לא מובטחת, ולפעמים מידג'רני בכלל מתעלם מהבקשות. צריך פשוט לנסות כל מיני אפשרויות עד שמקבלים תמונה שאוהבים.

הנה הפרומפט שנתתי והתוצר שלו:

a woman riding a horse, fantasy style, legendary, epic, digital art, powerful

והנה תוצאה של פרומפט אחר לגמרי:

a woman riding a horse, romantic, beautiful, quiet, natural

שמות של סרטים, סגנונות אנימציה וצילום: אפשר לבקש דמויות מסרטים, וגם לערבב אותן עם סרטים אחרים או לדמיין אותן בסיטואציות שלא היו בסרט המקורי. זה מה שקיבלתי כשביקשתי אישה רוכבת על סוס בסגנון "המטריקס".

והנה גנדאלף מ"שר הטבעות" משתמש במחשב.

ציטוטים משירים או מסרטים: אחד החביבים עליי. זרקו עליו את הציטוטים החביבים עליכם ותראו מה יוצא. לפעמים זה דבילי, לפעמים זה מהמם.

פרומפטים מופשטים ופנטזיות: נסו מושגים כמו אהבה, שיתוף פעולה, נשמות תאומות, שזירה קוונטית, מותה של הדמוקרטיה ועוד. תקבלו הפתעות מעניינות, מובטח.

שטויות וקשקושים: אחרי זמן מה, סביר להניח שתנסו לשעשע את עצמכם בפרומפטים שלא מחוברים למציאות, ג'יבריש או אפילו אותיות רנדומליות במקלדת. יודעי ח"ן מספרים שכשמידג'רני לא יודע מה לייצר, הוא יוצר תמונות של נשים. מה פרויד היה אומר על זה, והאם בעוד 20 שנה יהיו טיפולים פסיכולוגיים ל-AI?

האמת היא שאין לזה סוף, וכאן נכנסים לעניין הדמיון שלכם, תחומי העניין שלכם והסיבות שבגללן בא לכם להשתמש במידג'רני. חפשו, נסו, חקרו, כתבו שטויות, דברו עם אחרים (מוזמנים לקבוצת ה-AI בטלגרם) ואל תעצרו את עצמכם. אפילו השמים הם לא הגבול כשמדובר במידג'רני.

פרמטרים (לשעבר סוויצ'ים)

בחלק מהמקרים צריך להשתמש בפרמטרים – שני מקפים שמוסיפים בסוף הפרומפט, עם פקודה כלשהי. הנה דוגמא לפרומפט עם פרמטר:

במקרה הזה ביקשתי תמונה בפרופורציות של 3:2 (כלומר, מלבנית במקום ריבוע, שהוא ברירת המחדל). יש לא מעט פרמטרים כאלה, שמאפשרים לבקש דברים ספציפיים כמו פרופורציות, תמונות שאין בהן משהו (למשל no text), הפרדה גבוהה (HD) ועוד. כאן יש רשימה מלאה.

שימו לב שמדובר בשני מקפים רצופים, והפרמטר צמוד אליהם, ללא רווחים.

עבודה עם תמונות במידג'רני

דרך מעניינת נוספת לעבוד עם מידג'רני היא להעלות תמונות ולבקש ממנו לבצע בהן כל מיני שינויים. אישית, לא התלהבתי מהתוצאות שמופקות בשיטה הזו, אבל אולי לכם זה יתאים יותר.

כדי לעבוד עם תמונות במידג'רני, צריך להעלות את התמונה לדיסקורד. עושים זאת באמצעות הקלקה על כפתור הפלוס שבשורת הפקודה בתחתית המסך, ובחירת Upload a file (אפשר להעלות קובץ גם באמצעות דאבל קליק על הפלוס).

בחרו את התמונה הרצויה והקליקו על אנטר בשורת הפקודה. לאחר שהתמונה תסיים לעלות, הקליקו עליה, ואז על Open in browser. העתיקו את הלינק משורת הכתובת בדפדפן. הוא אמור להיות בפורמט כזה:

https://cdn.discordapp.com/attachments/955514843207729246/1068129618218979398/123.jpg

לאחר מכן, חזרו לחלון הדיסקורד שלכם, והזינו פרומפט כרגיל, עם פקודת /imagine. לאחר הפקודה, הזינו את הלינק שהעתקתם ואז את הפרמטרים השונים כמו בפרומפט רגיל.

זה המקום להזכיר שוב שהתמונות פומביות וכולם רואים אותן, אלא אם יש לכם מנוי ב-60 דולר לחודש ואתם עובדים במצב Stealth, כך שמומלץ להימנע מהעלאת תמונות ללא רשות או תמונות אישיות.

 

יש שני אספקטים עיקריים לזכויות יוצרים על תמונות שנוצרות באמצעות Midjourney – הזכויות שלכם מול החברה שמספקת את השירות, וזכויות היוצרים באופן כללי.

נושא זכויות היוצרים של תמונות AI נמצא כרגע בדיונים סוערים, מאחר שאמנים רבים טוענים שהמודל מאומן על תמונות שלהם, ולכן בעצם מדובר בהעתקה. לא ניכנס לדיון המרתק הזה עכשיו, ואתמקד בהגדרות של זכויות היוצרים כפי שמופיעות באתר של מידג'רני.

בארה"ב, החוק אומר שאין זכויות יוצרים על תמונות או חומרים אחרים שנוצרו באמצעות AI, ולמרות זאת מידג'רני מתעקשים שכן יש. המדרגות הן כאלה:

אם יש לכם חשבון בתשלום במידג'רני, מה שאתם יוצרים שייך לכם, או ליתר דיוק, מידג'רני לא יטענו שזה שלהם. במקרה של חשבון חינמי, היצירות הן "שלהם" אבל התמונות ברשיון Creative Commons, מה שאומר שכל אחד יכול לקחת, לערוך מחדש, לעבד ולהפיץ וכו', תחת תנאי הרישיון. אם יש לכם מחזור של יותר ממיליון דולר, צריך לקנות תוכנית אחרת – אבל בואו נניח שאין לכם.

אם אתם רוצים לקרוא עוד על זכויות יוצרים בעולם של AI, מומלץ להתעמק במדריך שכתב עו"ד יהונתן קלינגר.

מידג'רני – טיפים ודגשים

  • כל התמונות שאתם מייצרים הן פומביות, אלא אם כן אתם בוחרים במנוי היקר ביותר, שעלותו 60 דולר בחודש, ואז אתם יכולים לעבוד ב-stealth mode שמאפשר תמונות פרטיות. קחו את זה בחשבון אם אתם מתכננים לייצר תמונות אישיות או להתבסס על תמונות שלכם או של אנשים הקרובים לכם.
  • יש לא מעט מילים שהמנוע לא מרשה להשתמש בהן בפרומפט – בעיקר עירום ואלימות ונאצים וכאלה. אל תנסו להתחכם יותר מדי, שלא יחסמו אתכם.
  • אחרי שמשחקים איתו קצת, מגלים שיש למידג'רני סגנון מאוד מובחן, שמזכיר קצת גרפיקה של משחקי מחשב איכותיים או פנטזיה אפלה. אם לא תבקשו משהו אחר – תקבלו את הסגנון הספציפי הזה.
  • ל-Midjourney יש נטייה מצערת לייצר תמונות קלוז אפ או מדיום שוט כמעט בכל פרומפט. ביחד עם העובדה שהתמונות ריבועיות כברירת מחדל, זה גם יוצר חזרתיות מסוימת, אלא אם מגדירים לו אחרת.
  • יש למנוע בעיה קשה עם רשימות של פריטים מרובים. למשל, אם תבקשו סוס, חתול ועורב, סביר להניח שהוא יתבלבל ויציג רק אחד או שניים מהם.
  • עוד משימה שמידג'רני מתקשה איתה, היא יצירה של הרבה פריטים כמו קהל גדול בהופעה, הפגנה, עדר של הרבה חיות וכו'. גם כאשר מציינים מספר, הוא לא מנפיק תמונות שיוצרות תחושה של "הרבה".
  • ידיים ועיניים: למרות שיש שיפור ניכר, הרבה פעמים כפות הידיים והעיניים של הדמויות המופקות (במיוחד אם רציתם בני אנוש ריאליסטיים) נראות מוזרות ומעוותות.
  • טקסט: כאן כבר אין על מה לדבר. מידג'רני ומנועי AI ליצירת תמונות לא עובדים טוב עם טקסט. למשל, אם תבקשו עיצוב לוגו עם שם של חברה, זה יופיע בג'יבריש. לפעמים מידג'רני יוצר טקסט היכן שלא צריך – במקרה כזה, פשוט הוסיפו פקודה "no text" בפרמטר וזה יפתור את הבעיה (ברוב המקרים).
  • צריכים תמונה שיהיה לכם נוח לעבוד איתה בפוטושופ? בקשו רקע אחיד בצבע ספציפי (green solid background), כך שתוכלו לצרוב את האלמנטים הגרפיים, להחליף את הרקע וכו'.
  • התמונות שמידג'רני יוצר די חשוכות כברירת מחדל, כנראה כחלק מהסגנון המאוד מובחן שלו. לפעמים זה שמיש ובסדר כמו שזה, ולפעמים אני פשוט מעבירה את התמונות בפוטושופ ומסדרת את התאורה. בכלל, יש הרבה סיבות להעביר את היצירות של מידג'רני בפוטושופ או תוכנת עריכת תמונות אחרת – במקרים לא מעטים, זה עושה להן רק טוב.
  • קיבלתם גריד של 4 תמונות נחמדות, אבל לא בא לכם לבזבז קרדיט על Upscale? לשימוש בסיסי באתרי אינטרנט ובעיקר ברשתות חברתיות, אתם לגמרי יכולים לגזור את התמונה הקטנה ישירות מהגריד, אפילו להגדיל אותה מעט בפוטושופ, והיא תעשה את העבודה.

לחלק א' של מדריך מידג'רני

מה, כבר נגמר?

עצרתי את עצמי לפני שתצמח פה אנציקלופדיה. אי אפשר לכסות במדריך אחד את כל האפשרויות. מידג'רני הוא כלי שדורש הרבה למידה עצמית והתנסות וחיפושים. מצד שני, לא חייבים להיות מומחים, ואפשר סתם לשחק איתו בשביל הכיף, ולאו דווקא לחפש תוצרים מדויקים. כל אחד ומה שעושה לו נעים. בקצב ההתפתחות של כלי הבינה המלאכותית, יש להניח שיהיו עוד הרבה שינויים, עדכונים ותהפוכות. אני עוקבת בעניין ואשתדל לעדכן.

בינתיים, קחו תמונה של סוס וחתול משחקים בשדה פרחוני. את החתול והסוס שלי לא אוכל להפגיש לעולם, כנראה, אבל נחמד שיש בינה מלאכותית שעוזרת לדמיין.

אתם מוזמנים להצטרף לקבוצת הטלגרם שלי שעוסקת בתמונות בינה מלאכותית, או לעקוב אחריי בטוויטר. אם אתם רוצים, אפשר גם ליצור איתי קשר.

—-

אודותיי:

קוראים לי רויטל סלומון, ולחברה שלי, שעוסקת בניהול וקידום אתרים, קוראים The Shark Lady. יש לי ותק וניסיון של למעלה מ-25 שנה בתחום האינטרנט והתוכן, כולל ניהול אתרים, פיתוח אתרים, SEO, ניהול תוכן, כתיבה עיתונאית, בינה מלאכותית וגם הרצאות והדרכות (הכל בעברית וגם באנגלית).

ניהול אתרים - 25 שנות ניסיון ומקצועיות ללא פשרות!

צרו קשר והזניקו את האתר שלכם קדימה!