מה RAG באמת אומר, בלי הז'רגון

RAG הוא קיצור של retrieval-augmented generation. אלה שלוש מילים שעובדות קשה, אז הנה הגרסה הפשוטה. כשלקוח שואל AI chatbot "באיזו שעה אתם פותחים ביום ראשון?", אחד משני דברים קורה מאחורי הקלעים. או שהבוט עונה ממה שהוא קלט באימון — שלא כולל את העסק שלכם — וממציא משהו. או שהבוט קודם מחפש את התשובה בתוכן הספציפי שלכם, מוצא את עמוד שעות הפעילות שלכם, וכותב תשובה על בסיס מה שכתוב שם באמת. השני זה RAG. תחשבו על זה כמו מבחן עם ספר פתוח. בלי RAG, ה-chatbot עושה מבחן בספר סגור על העסק שלכם — והוא מעולם לא ראה את ספר הלימוד. עם RAG, יש לו את ספר הלימוד פתוח, הוא דפדף לעמוד הנכון, וקורא את התשובה לפני שהוא עונה.

בלי RAG מול עם RAG: דוגמת מחיר

נגיד שאתם מוכרים חבילות אימון: $99 התחלה, $299 פרו, $599 אליט. לקוח שואל: "כמה עולה תוכנית הפרו?" בלי RAG:

"המחירים משתנים לפי ספק ותוכנית. רוב חבילות האימון נעות בין $50 ל-$1,000 בחודש. אני ממליץ לבדוק עם החברה ישירות לתמחור מדויק." נכון מבחינה טכנית. חסר תועלת לחלוטין. הלקוח עוזב. עם RAG: "תוכנית הפרו עולה $299 לחודש וכוללת מפגשי 1-על-1 שבועיים, הודעות ללא הגבלה, ותוכנית צמיחה מותאמת אישית. רוצה קישור להתחלה?" ספציפי, מדויק, שימושי. זה ההבדל ש-RAG עושה — וזה ההבדל בין בוט שלוכד לידים לבוט שמאבד אותם.

איך זה עובד, במבט מהיר

אתם לא צריכים להבין את ההנדסה, אבל הנה תמונה של 3 שלבים כדי שתדעו על מה המוכרים מדברים.

  1. אינדקס. המערכת קוראת את האתר שלכם, השאלות הנפוצות, ומסמכים שהעלית — ומפרקת אותם לקטעים שניתן לחפש. זה קורה פעם אחת בהקמה, ואז שוב בכל פעם שהתוכן שלכם משתנה.
  2. שליפה. כשלקוח שואל שאלה, המערכת מחפשת בקטעים האלה את החתיכות הרלוונטיות ביותר. לא התאמת מילות מפתח — חיפוש סמנטי. היא מבינה ש"כמה" ו"מה המחיר" זו אותה שאלה.
  3. יצירה. הקטעים הרלוונטיים נמסרים למודל ה-AI יחד עם השאלה של הלקוח. המודל כותב תשובה על בסיס הקטעים האלה, לא על בסיס האימון הכללי שלו. הלקוח רואה תשובה שוטפת אחת. מאחורי הקלעים, שלושה דברים קרו.

למה RAG מנצח fine-tuning לרוב העסקים

החלופה ל-RAG היא fine-tuning — לקיחת מודל AI בסיסי ואימונו ספציפית על נתוני העסק שלכם. זה נשמע מושך. עבור רוב העסקים הקטנים והבינוניים זו הבחירה הלא נכונה. עלות. fine-tuning בדרך כלל עולה בערך פי 100 יותר מהפעלת chatbot מבוסס RAG על אותם נתונים. המתמטיקה נהיית אכזרית בכל סקייל. מהירות עדכון. כשאתם משנים מחירים, שעות, או שירותים, RAG מתעדכן באותה מהירות שאתם יכולים לעשות אינדקס מחדש לתוכן — דקות, לעיתים קרובות אוטומטי. מודלי fine-tuned צריכים להתאמן מחדש, מה שלוקח ימים עד שבועות. שינו תמחור ביום שני ובוט fine-tuned עדיין יצטט מחירים ישנים ביום שישי. שקיפות. מימושי RAG טובים יכולים לציין את עמוד המקור לכל תשובה ("זה מעמוד התמחור שלכם"). מודלי fine-tuned לא יכולים — הם בלעו את המידע לתוך המשקלים שלהם. כשלקוח שואל "מאיפה השגת את זה?" אין לכם תשובה. עבור רוב העסקים, RAG זו התשובה הנכונה. fine-tuning הגיוני למקרים צרים — אוצר מילים מאוד מתמחה, מערכי נתונים קנייניים גדולים — וגם שם, RAG לעיתים קרובות מונח מעל.

מה יכול להשתבש עם RAG

RAG הוא לא קסם. מצב הכשל הנפוץ ביותר: אם תוכן האתר שלכם חסר, מיושן, או סותר, התשובות של הבוט יהיו כאלה גם. Garbage in, garbage out. דברים אחרים שמשתבשים:

  • תוכן מיושן. אם אינדקס מחדש קורה רק חודשי, לקוחות רואים מחירים ישנים שבועות. שאלו מוכרים איך אינדקס מחדש מתוזמן.
  • חיתוך גרוע. אם המערכת מפרקת את התוכן שלכם לחתיכות גדולות מדי או קטנות מדי, התשובה הנכונה לא צפה. הלקוח מקבל שטויות שנשמעות בטוחות.
  • אין ציון מקור. אם הבוט לא יכול להגיד לכם מאיזה עמוד באה התשובה, אתם לא יכולים לבקר או לתקן.
  • דליפה בין-לקוחות. פלטפורמות מולטי-טננט חייבות לשמור את התוכן של כל לקוח מופרד בקפדנות. שאלו איך זה נאכף — ראו את מדריך הקונה למה תשובה טובה נראית. אלה בעיות מוכר, לא בעיות RAG. כדאי לבדוק לפני חתימה.

4 שאלות לשאול מוכרים על הקמת RAG שלהם

ארבע שאלות מפרידות בין מוכרים רציניים לקשקוש שיווקי.

  1. באיזו תדירות התוכן שלי עושה אינדקס מחדש? תשובה טובה: "אוטומטית כשהתוכן משתנה, פלוס מעבר מלא יומי". תשובה רעה: "בכל פעם שאתה לוחץ על כפתור הרענון".
  2. האם הבוט יכול לציין את עמוד המקור לכל תשובה? אם כן, אתם יכולים לבקר ולתקן. אם לא, שאלו למה.
  3. כמה מהר עדכון תוכן מופיע בתשובות הבוט? שאפו לדקות, לא שעות, ובוודאי לא ימים.
  4. איך התוכן שלי נשמר נפרד מלקוחות אחרים? אתם צריכים לקבל תשובה ברורה, טכנית, שכוללת בידוד בשכבת הנתונים. אם הם מנופפים בידיים, זה דגל. אם מוכר משתמש ב-RAG אבל לא יכול לענות על אלה, הוא משתמש בו רע. אם הם בכלל לא משתמשים ב-RAG והתוכן שלכם מתעדכן באופן קבוע — תמשיכו לחפש.