איכות התמלול תלויה באיכות ההקלטה. הנה 5 דברים שכדאי לעשות לפני שאתם מעלים קובץ למילה AI, ששוים עד 30% באיכות הטקסט הסופי.
1. מיקרופון קרוב לדובר
זה הכי חשוב. מיקרופון בפלאפון על השולחן במרחק של מטר קולט הד ורעשי רקע. USB microphone (מסדרת Blue Yeti, Audio-Technica ATR2100x או Shure MV7) מחובר ישירות למחשב, במרחק של 20-30 ס"מ, נותן איכות טובה פי שלושה.
אם אין מיקרופון ייעודי — עדיף להקליט באוזניות-מיקרופון של הפלאפון מאשר לסמוך על מיקרופון רחוק.
2. הימנע מרעשי רקע
- כבה מזגן/מאוורר אם אפשר.
- סגור חלונות.
- הזיז את ההקלטה לחדר עם שטיח, וילונות וספות — החדר סופג צליל ומפחית הד.
- אל תשאיר את הפלאפון ליד המחשב — הוא פולט צפצופים כל כמה דקות.
למילה AI יש פיצ'ר ניקוי רעשי רקע (מופעל בבחירה ב-Upload) שעוזר, אבל מקור נקי מלכתחילה עדיף תמיד.
3. פורמט קובץ
הטובים ביותר: WAV, FLAC, MP3 באיכות 192kbps+, OGG/Opus 96kbps+.
להימנע: הקלטות WhatsApp (קידוד מאוד דחוס), קבצי OGG מתחת ל-64kbps, או MP3 מתחת ל-96kbps. המודל עדיין מתמודד, אבל איכות יורדת במיוחד במילים לא מוכרות (שמות פרטיים, מונחים תורניים).
4. דובר יחיד או שניים הם אידיאליים
Gemini טוב מאוד עם 1-2 דוברים. ב-3+ דוברים הוא עלול להתבלבל — במיוחד אם הם מדברים באותו זמן.
לפאנלים וריבוי דוברים, הפעל את זיהוי דוברים אמין (pyannote.audio) באפשרויות ההעלאה — הוא ינתח את האודיו ויתייג כל קטע עם SPEAKER_00, SPEAKER_01, וכן הלאה. אתה תעבור עליהם בעורך ותיתן להם שמות.
5. השתמש ב-prompt מותאם ז'אנר
מילה AI בוחר אוטומטית את ה-prompt הנכון ע"פ הז'אנר. אך אם יש מונחים ייחודיים או שמות — ציין אותם בשדה "הנחיות מיוחדות" לפני העלאה.
למשל, אם אתה מתמלל שיעור על מסכת ברכות, כדאי לכתוב: "שמות המסכת והפרק: ברכות פרק ט. מקורות: רמב"ם, שו"ע, מגן אברהם."
זה מפחית דרמטית שגיאות כתיב בשמות ומונחים ספציפיים.
יש טיפ משלך? שלח לנו ב-/dpo ונוסיף אותו לרשימה.