מידג'רני V5 – הגירסה החדשה של Midjourney
נכתב ב-18 במרץ 2023
מחולל התמונות באמצעות בינה מלאכותית, מידג'רני, התעדכן בגירסה חדשה – V5. ברירת המחדל בייצור תמונות היתה עד עכשיו V4, והיא גם זו שהביאה לזינוק בפופולריות של Midjourney.
גירסה 5 זמינה כעת למנויי מידג'רני (כלומר, מי שמשלם על חבילה כלשהי), והיא כרגע בגירסה אלפא – כלומר, די ראשונית. על מנת לקבל תמונה באמצעות V5, אתם צריכים להוסיף פרמטר בסוף הפרומפט:
כלומר: שני מקפים צמודים, האות V, רווח והספרה 5.
מה ההבדל בין V4 של מידג'רני ו-V5?
עיקר ההבדל נעוץ בריאליזם של התמונות. מידג'רני התקשה ביצירת ידיים ריאליסטיות (ולפעמים גם עיניים ושיניים), ונראה שהגירסה החדשה מטפלת לא רע בבעיה. באופן כללי, גירסה 5 של מידג'רני מייצרת תמונות ריאליסטיות יותר כברירת מחדל, אלא אם תגדירו לה אחרת (למשל, באמצעות הוספת digital art לפרומפט). גירסה 5 מציגה טקסטורות עור פנים טובות וריאליסטיות יותר, תאורה מדויקת יותר, השתקפויות וצללים טובים יותר.
הנה השוואה בין V4 ו-V5 (פרומפטים זהים):
הנרי קאוויל עם סוודר אדום – V5
הנרי קאוויל עם סוודר אדום – V4
נראה כאילו יש כעת למידג'רני נטייה חזקה לכיוון תמונות סטוק גנריות. הנה עוד דוגמא – ביקשתי ממנו אשת עסקים עובדת על מחשב. זה מה שהניבה גירסה 5:
תמונות די שבלוניות ומשעממות, שמי שמשוטט באתרי אינטרנט מכיר היטב, וראה הרבה יותר מדי מהן. הוא אמנם בחר לייצר גם איורים ולא רק תמונה ריאליסטית, אבל עדיין, מדובר ביצירות די גנריות.
ואלה התוצאות של V4. לטעמי, הן הרבה יותר מעניינות וטובות יותר כתמונות סטוק או תמונות אווירה. בכלל, בכל הניסיונות שעשיתי, התפוקה של V5 היתה שטוחה ופחות מוצלחת בעיניי, אם כי זה מן הסתם תלוי בשימוש שעושים במידג'רני, ומה המטרה של התמונות. מי שמעוניין לייצר תמונות מדויקות ויש לו מטרה ברורה בראש – כנראה יאהב יותר את מידג'רני 5.
אפשר לראות שברירת המחדל היא עדיין תמונות ריבועיות. אם אתם רוצים תמונות מלבניות, תצטרכו להוסיף את הפרמטר ar 3:2.
עוד חידוש קטן ב-V5 – התמונות הראשוניות שנוצרות בגריד כבר באיכות יותר גבוהה מתמונות גריד ב-V4, ולכן בקשות ה-upscale מיוצרות הרבה יותר מהר.
התמונות הריאליסטיות להפליא שנוצרות על ידי V5 מעלות שוב את הדיון לגבי זכויות יוצרים על התמונות ושימוש בפנים של אנשים ללא רשותם (גם אם הם מפורסמים). ההמלצה שלי: צרו מה שבא לכם בשביל הכיף, אבל הפעילו שיקול דעת רציני לגבי שימוש בתמונות באתרים, בלוגים ומדיה חברתית, במיוחד אם אתם מפעילים עמוד עסקי כלשהו. Better safe than sorry.
ברור לחלוטין שהתמונות של מידג'רני V5 ישמשו ביצירת פייק ניוז ויסייעו להפצת שקרים. בשלב הזה של ההתקדמות הטכנולוגית בבינה המלאכותית, כדאי מאוד להטיל ספק חמור בכל תמונה שרואים – הסיכוי שהיא מזויפת עלה פי כמה מונים.
כך למשל, הנה תמונות של הפגנה שלא היתה, לא נבראה ולא התקיימה מעולם. יש פה בהחלט כמה שגיאות בולטות, אבל במבט חטוף, עוד אפשר לחשוב שמדובר בתמונה אמיתית. והסיטואציה הזו רק תחמיר.