כיצד להתאים אישית את יצירת טקסט בשנאים

Kyzd Lht Ym Ysyt T Yzyrt Tqst Bsn Ym



בלמידה עמוקה, יצירת טקסט מתייחסת לתהליך של התאמה אוטומטית של הטקסט בשפה טבעית בעזרת רשתות עצביות מלאכותיות (ANN) . יתר על כן, מודלים שונים של שפה משמשים למטרה מסוימת, אשר מאומנים מראש על מערכי נתונים גדולים לניבוי המילה הקרובה ברצף בהתאם למילה הקודמת. בנוסף, ניתן להשתמש בטקסט מותאם עבור יישומים מרובים, כולל תרגום שפה, יצירת תוכן, צ'אטבוטים ועוד רבים.

בבלוג זה נסקור את התוכן הבא:

כיצד להתאים אישית את יצירת הטקסט על ידי טעינת הדגם עם פונקציית 'צינור' מ-Transformers?

ה ' צנרת הפונקציה משמשת להורדה אוטומטית של מודל הבינה המלאכותית שהוכשר מראש בהתאם לדרישות המשתמש. כדי להשתמש בפונקציה הספציפית הזו, המשתמשים צריכים להתקין את ' רוֹבּוֹטרִיקִים 'חבילות. חבילה זו מעניקה גישה למודלים מתקדמים מבוססי רובוטריקים שיכולים לבצע ניתוח סנטימנטים כמו גם מספר רב של מודלים אחרים עיבוד שפה טבעית (NLP) משימות.







כדי לבדוק את ההדגמה המעשית של התרחיש המתואר לעיל, עבור לשלבים המפורטים להלן!



שלב 1: התקן חבילות 'רובוטריקים'.

בתחילה, בצע את ה-'! צִפצוּף' פקודה להתקנת חבילות השנאים:



! pip להתקין שנאים

כפי שאתה יכול לראות, החבילה שצוינה הותקנה בהצלחה:





שלב 2: ייבוא ​​מודל מבוסס שנאי

לאחר מכן, ייבא את הדגם הנדרש מבוסס שנאי. לשם כך, ראשית, ייבא את ה-' צנרת 'פונקציה מ' רוֹבּוֹטרִיקִים '. לאחר מכן, השתמש בפונקציה המיובאת והעביר את ' יצירת טקסט ' כטיעון אליו יחד עם שם הדגם הנדרש ' gpt2 '. לאחר מכן, העבר אותם ל' לִיצוֹר משתנה:



מ רוֹבּוֹטרִיקִים יְבוּא צנרת

לִיצוֹר = צנרת ( 'יצירת טקסט' , דֶגֶם = 'gpt2' )

שלב 3: צור טקסט מותאם אישית

כעת, העבר את הטקסט הרצוי כטיעון ל' לִיצוֹר '. כפי שמוצג מטה:

לִיצוֹר ( 'על ידי שימוש במודל gpt2 להפקת טקסט בשנאים' )

על פי הפלט שסופק, ההורדה מאומנת מראש ' gpt3 ' המודל נוצר טקסט בהצלחה:

אתה יכול גם להשתמש בטיעונים האחרים, כגון:

מיידי = 'על ידי שימוש במודל gpt2 להפקת טקסט בשנאים'

הדפס ( גֵן ( מיידי , num_return_sequences = 5 , אורך מקסימלי = עשרים ) )

כאן:

  • ' מיידי ' משמש כארגומנט המחזיק קלט.
  • ' num_return_sequence ארגומנט ' משמש ליצירת מספר הרצפים של הטקסט שסופק.
  • ' אורך מקסימלי ארגומנט ' משמש כדי לציין את אורך הטקסט שנוצר. במקרה שלנו, זה מוגבל ל' 30 ' אסימונים (מילים או סימני פיסוק):

הערה: הטקסט המותאם יהיה המשך להנחיה שצוינה המבוססת על נתוני ההדרכה של המודל.

כיצד להשתמש במודל מבוסס שנאי להפקת טקסט ב- PyTorch?

משתמשים יכולים גם להתאים אישית את הטקסט ב' PyTorch 'שזה' לפיד מסגרת למידת מכונה מבוססת. הוא משמש עבור יישומים שונים, כגון NLP ו-Computer Vision. כדי להשתמש במודל מבוסס שנאי להתאמה אישית של הטקסט ב- PyTorch, ראשית, ייבא את ' GPT2Tokenizer ' ו' דגם GPT2 ' פונקציות מתוך ' רוֹבּוֹטרִיקִים ”:

מ רוֹבּוֹטרִיקִים יְבוּא GPT2Tokenizer , דגם GPT2

לאחר מכן, השתמש ב' GPT2Tokenizer 'אסימון לפי הדגם המיומן מראש הרצוי שלנו בשם ' gpt2 ”:

אסימון = GPT2Tokenizer. from_pretrained ( 'gpt2' )

לאחר מכן, הצגת המשקולות מדגם מאומן מראש:

דֶגֶם = דגם GPT2. from_pretrained ( 'gpt2' )

לאחר מכן, הכריז על ' gen_text ' משתנה שמכיל את הטקסט שברצוננו להתאים אישית:

gen_text = 'על ידי שימוש במודל gpt2 להפקת טקסט בשנאים'

עכשיו, העבר את ' gen_text ' ו' return_tensors='pt' ' כארגומנט שיצור את הטקסט ב- PyTorch ויאחסן את הערך שנוצר ב-' קלט_מקודד משתנה:

קלט_מקודד = אסימון ( gen_text , return_tensors = 'פט' )

לבסוף, העבר את ' קלט_מקודד ' משתנה שמחזיק את הטקסט המותאם ל' דֶגֶם ' כפרמטר וקבל את הפלט המתקבל באמצעות ' אורך מקסימלי ' ארגומנט שמוגדר כ' עשרים ' המציין שהטקסט שנוצר יהיה מוגבל לאסימונים שסופקו, ה' num_return_sequences ' שנקבע ל' 5 ' שמראה שטקסט שנוצר יתבסס על 5 רצפים של טקסט:

תְפוּקָה = דֶגֶם ( **קלט_מקודד )

גֵנֵרָטוֹר ( gen_text , אורך מקסימלי = עשרים , num_return_sequences = 5 )

תְפוּקָה

כיצד להשתמש במודל מבוסס שנאי להפקת טקסט ב- TensorFlow?

להפקת הטקסט ב-Transformers, ' TensorFlow נעשה שימוש גם במסגרות למידת מכונה מבוססות. לשם כך, ראשית, ייבא את הפונקציות הנדרשות, כגון ' GPT2Tokenizer ' ו' דגם TFGPT2 ' מ ה ' רוֹבּוֹטרִיקִים '. שאר הקוד זהה לעיל, רק אנחנו משתמשים ב-' דגם TFGPT2 הפונקציה ' במקום ' דגם GPT2 ' פונקציה. כדלקמן:

מ רוֹבּוֹטרִיקִים יְבוּא GPT2Tokenizer , דגם TFGPT2

אסימון = GPT2Tokenizer. from_pretrained ( 'gpt2' )

דֶגֶם = דגם TFGPT2. from_pretrained ( 'gpt2' )

טֶקסט = 'על ידי שימוש במודל gpt2 להפקת טקסט בשנאים'

קלט_מקודד = אסימון ( טֶקסט , return_tensors = 'tf' )

תְפוּקָה = דֶגֶם ( קלט_מקודד )

גֵנֵרָטוֹר ( gen_text , אורך מקסימלי = עשרים , num_return_sequences = 5 )

כפי שאתה יכול לראות, הטקסט המותאם נוצר בהצלחה:

זהו זה! הרחבנו על התאמה אישית של יצירת טקסט ב-Transformers.

סיכום

כדי להתאים אישית יצירת טקסט ב-Transformers, ישנן דרכים שונות כגון טעינת המודל עם פונקציית הצינור, שימוש במודל מבוסס שנאי ב' PyTorch ' ו' TensorFlow ' המבוססים על מסגרות למידת מכונה. במדריך זה, סיפקנו מידע קצר יחד עם הדגמה מעשית של יצירת טקסט בהתאמה אישית ב-Transformers.