כיצד להתאים אישית את יצירת טקסט בשנאים

בלמידה עמוקה, יצירת טקסט מתייחסת לתהליך של התאמה אוטומטית של הטקסט בשפה טבעית בעזרת רשתות עצביות מלאכותיות (ANN) . יתר על כן, מודלים שונים של שפה משמשים למטרה מסוימת, אשר מאומנים מראש על מערכי נתונים גדולים לניבוי המילה הקרובה ברצף בהתאם למילה הקודמת. בנוסף, ניתן להשתמש בטקסט מותאם עבור יישומים מרובים, כולל תרגום שפה, יצירת תוכן, צ'אטבוטים ועוד רבים.

בבלוג זה נסקור את התוכן הבא:

כיצד להתאים אישית יצירת טקסט על ידי טעינת דגם עם פונקציית 'צינור' מ-Transformers?
כיצד להשתמש במודל מבוסס שנאי להפקת טקסט ב- PyTorch?
כיצד להשתמש במודל מבוסס שנאי להפקת טקסט ב- TensorFlow?

כיצד להתאים אישית את יצירת הטקסט על ידי טעינת הדגם עם פונקציית 'צינור' מ-Transformers?

ה ' צנרת הפונקציה משמשת להורדה אוטומטית של מודל הבינה המלאכותית שהוכשר מראש בהתאם לדרישות המשתמש. כדי להשתמש בפונקציה הספציפית הזו, המשתמשים צריכים להתקין את ' רוֹבּוֹטרִיקִים 'חבילות. חבילה זו מעניקה גישה למודלים מתקדמים מבוססי רובוטריקים שיכולים לבצע ניתוח סנטימנטים כמו גם מספר רב של מודלים אחרים עיבוד שפה טבעית (NLP) משימות.

כדי לבדוק את ההדגמה המעשית של התרחיש המתואר לעיל, עבור לשלבים המפורטים להלן!

שלב 1: התקן חבילות 'רובוטריקים'.

בתחילה, בצע את ה-'! צִפצוּף' פקודה להתקנת חבילות השנאים:

! pip להתקין שנאים

כפי שאתה יכול לראות, החבילה שצוינה הותקנה בהצלחה:

שלב 2: ייבוא מודל מבוסס שנאי

לאחר מכן, ייבא את הדגם הנדרש מבוסס שנאי. לשם כך, ראשית, ייבא את ה-' צנרת 'פונקציה מ' רוֹבּוֹטרִיקִים '. לאחר מכן, השתמש בפונקציה המיובאת והעביר את ' יצירת טקסט ' כטיעון אליו יחד עם שם הדגם הנדרש ' gpt2 '. לאחר מכן, העבר אותם ל' לִיצוֹר משתנה:

מ רוֹבּוֹטרִיקִים יְבוּא צנרת

לִיצוֹר = צנרת ( 'יצירת טקסט' , דֶגֶם = 'gpt2' )

שלב 3: צור טקסט מותאם אישית

כעת, העבר את הטקסט הרצוי כטיעון ל' לִיצוֹר '. כפי שמוצג מטה:

לִיצוֹר ( 'על ידי שימוש במודל gpt2 להפקת טקסט בשנאים' )

על פי הפלט שסופק, ההורדה מאומנת מראש ' gpt3 ' המודל נוצר טקסט בהצלחה:

אתה יכול גם להשתמש בטיעונים האחרים, כגון:

מיידי = 'על ידי שימוש במודל gpt2 להפקת טקסט בשנאים'

הדפס ( גֵן ( מיידי , num_return_sequences = 5 , אורך מקסימלי = עשרים ) )

כאן:

' מיידי ' משמש כארגומנט המחזיק קלט.
' num_return_sequence ארגומנט ' משמש ליצירת מספר הרצפים של הטקסט שסופק.
' אורך מקסימלי ארגומנט ' משמש כדי לציין את אורך הטקסט שנוצר. במקרה שלנו, זה מוגבל ל' 30 ' אסימונים (מילים או סימני פיסוק):

הערה: הטקסט המותאם יהיה המשך להנחיה שצוינה המבוססת על נתוני ההדרכה של המודל.

כיצד להשתמש במודל מבוסס שנאי להפקת טקסט ב- PyTorch?

משתמשים יכולים גם להתאים אישית את הטקסט ב' PyTorch 'שזה' לפיד מסגרת למידת מכונה מבוססת. הוא משמש עבור יישומים שונים, כגון NLP ו-Computer Vision. כדי להשתמש במודל מבוסס שנאי להתאמה אישית של הטקסט ב- PyTorch, ראשית, ייבא את ' GPT2Tokenizer ' ו' דגם GPT2 ' פונקציות מתוך ' רוֹבּוֹטרִיקִים ”:

מ רוֹבּוֹטרִיקִים יְבוּא GPT2Tokenizer , דגם GPT2

לאחר מכן, השתמש ב' GPT2Tokenizer 'אסימון לפי הדגם המיומן מראש הרצוי שלנו בשם ' gpt2 ”:

אסימון = GPT2Tokenizer. from_pretrained ( 'gpt2' )

לאחר מכן, הצגת המשקולות מדגם מאומן מראש:

דֶגֶם = דגם GPT2. from_pretrained ( 'gpt2' )

לאחר מכן, הכריז על ' gen_text ' משתנה שמכיל את הטקסט שברצוננו להתאים אישית:

gen_text = 'על ידי שימוש במודל gpt2 להפקת טקסט בשנאים'

עכשיו, העבר את ' gen_text ' ו' return_tensors='pt' ' כארגומנט שיצור את הטקסט ב- PyTorch ויאחסן את הערך שנוצר ב-' קלט_מקודד משתנה:

קלט_מקודד = אסימון ( gen_text , return_tensors = 'פט' )

לבסוף, העבר את ' קלט_מקודד ' משתנה שמחזיק את הטקסט המותאם ל' דֶגֶם ' כפרמטר וקבל את הפלט המתקבל באמצעות ' אורך מקסימלי ' ארגומנט שמוגדר כ' עשרים ' המציין שהטקסט שנוצר יהיה מוגבל לאסימונים שסופקו, ה' num_return_sequences ' שנקבע ל' 5 ' שמראה שטקסט שנוצר יתבסס על 5 רצפים של טקסט:

תְפוּקָה = דֶגֶם ( **קלט_מקודד )

גֵנֵרָטוֹר ( gen_text , אורך מקסימלי = עשרים , num_return_sequences = 5 )

תְפוּקָה

כיצד להשתמש במודל מבוסס שנאי להפקת טקסט ב- TensorFlow?

להפקת הטקסט ב-Transformers, ' TensorFlow נעשה שימוש גם במסגרות למידת מכונה מבוססות. לשם כך, ראשית, ייבא את הפונקציות הנדרשות, כגון ' GPT2Tokenizer ' ו' דגם TFGPT2 ' מ ה ' רוֹבּוֹטרִיקִים '. שאר הקוד זהה לעיל, רק אנחנו משתמשים ב-' דגם TFGPT2 הפונקציה ' במקום ' דגם GPT2 ' פונקציה. כדלקמן:

מ רוֹבּוֹטרִיקִים יְבוּא GPT2Tokenizer , דגם TFGPT2

אסימון = GPT2Tokenizer. from_pretrained ( 'gpt2' )

דֶגֶם = דגם TFGPT2. from_pretrained ( 'gpt2' )

טֶקסט = 'על ידי שימוש במודל gpt2 להפקת טקסט בשנאים'

קלט_מקודד = אסימון ( טֶקסט , return_tensors = 'tf' )

תְפוּקָה = דֶגֶם ( קלט_מקודד )

גֵנֵרָטוֹר ( gen_text , אורך מקסימלי = עשרים , num_return_sequences = 5 )

כפי שאתה יכול לראות, הטקסט המותאם נוצר בהצלחה:

זהו זה! הרחבנו על התאמה אישית של יצירת טקסט ב-Transformers.

סיכום

כדי להתאים אישית יצירת טקסט ב-Transformers, ישנן דרכים שונות כגון טעינת המודל עם פונקציית הצינור, שימוש במודל מבוסס שנאי ב' PyTorch ' ו' TensorFlow ' המבוססים על מסגרות למידת מכונה. במדריך זה, סיפקנו מידע קצר יחד עם הדגמה מעשית של יצירת טקסט בהתאמה אישית ב-Transformers.

כיצד להתאים אישית את יצירת טקסט בשנאים

כיצד להתאים אישית את יצירת הטקסט על ידי טעינת הדגם עם פונקציית 'צינור' מ-Transformers?

שלב 1: התקן חבילות 'רובוטריקים'.

שלב 2: ייבוא מודל מבוסס שנאי

שלב 3: צור טקסט מותאם אישית

כיצד להשתמש במודל מבוסס שנאי להפקת טקסט ב- PyTorch?

כיצד להשתמש במודל מבוסס שנאי להפקת טקסט ב- TensorFlow?

סיכום

קטגוריה

רשום פופולרי

כיצד להשתמש ב-Java Duration Class

כיצד לבצע ניקוי נתונים עם Python ו-Pandas

כיצד להוסיף ספריות Arduino בעורך האינטרנט Arduino

פונקציית Sleep() בשפת C

כיצד ליצור מפתח SSH ב-Windows 11

כיצד להשתמש ב-DALL-E לתרגום תמונה לתמונה?

כיצד להשתמש במקליט מסך בלינוקס

כיצד להגדיר את סגנון קישוט הטקסט ב-Tailwind CSS

כיצד להתאים את החדות של תמונה ב- PyTorch?

כיצד להוסיף/להסיר את Windows Media Player ב-Windows 10?

מהי החלופה של JavaScript לפונקציית השינה?

כיצד להתחבר למופע לינוקס באמצעות EC2 Instance Connect?

מה זה While Loop ב-C++?

מה זה שרת AWS?

כיצד להשתמש במאגר סיכום שיחה ב-LangChain?

כיצד להגדיר את תמונת סגנון הרשימה ב-Tailwind

כיצד לבצע Dockerize יישום Node.js

MongoDB ב-C++

קסנדרה צור סוג

כיצד לבדוק אם ערך הוא מספר ב-JavaScript

כיצד להתאים אישית את יצירת טקסט בשנאים

כיצד להתאים אישית את יצירת הטקסט על ידי טעינת הדגם עם פונקציית 'צינור' מ-Transformers?

שלב 1: התקן חבילות 'רובוטריקים'.

שלב 2: ייבוא ​​מודל מבוסס שנאי

שלב 3: צור טקסט מותאם אישית

כיצד להשתמש במודל מבוסס שנאי להפקת טקסט ב- PyTorch?

כיצד להשתמש במודל מבוסס שנאי להפקת טקסט ב- TensorFlow?

סיכום

קטגוריה

רשום פופולרי

שלב 2: ייבוא מודל מבוסס שנאי