תמלול הקלטות לעברית - בדיוק מלא
-
@dovid איזה מודל של גוגל?
לי יצא משהו אחר לגמרי עם Gemini 3 Pro Preview (פרומפט: תתמלל בקפדנות)הקדוש ברוך הוא אמר לו אחר כך, ויאמר השם אל משה שלח ידך ואחוז בזנבו, תחזיק את זה - מיד נהפך בחזרה למטה. קודם נהיה מהמטה נחש, אחר כך מהנחש נהיה מטה.
אומר רב שמשון רפאל הירש: המהות של המטה, מה זה מטה? זה משענת שהבן אדם נשען על זה, הוא נסמך על זה. נחש הוא בדיוק ההיפך, הגמרא אומרת אין אדם דר עם נחש בכפיפה אחת, אי אפשר לחיות עם זה. נחש זה בדיוק ההיפך. מטה זה המשענת שבן אדם נסמך על זה, נשען על זה, ומצד שני הנחש זה הדבר שכולם בורחים מזה.
וזה האות והסימן שאין עוד מלבדו. תראה את המטה הזה? זה נהפך לנחש. הנחש הזה - נהפך למטה. תגיד, השונא הזה, הרודף הזה - הוא יכול להיות המשענת שלך. והמשענת שלך יכולה להיהפך לשונא. הכל זה תלוי רק בי.
את זה הקדוש ברוך הוא אמר למשה רבינו כשהוא אמר להקדוש ברוך הוא "והן לא יאמינו לי". ככה הוא אמר למשה רבינו. משה רבינו אמר להקדוש ברוך הוא "והן לא יאמינו לי", מה אני אומר להם? "כי יאמרו לא נראה אליך השם". אמר לו הקדוש ברוך הוא: תרים את המטה הזה שיש, "האייבישטער" בעולם. שהמטה הזה...
הלשון שלו אומר: "נמצא שדבר השם אל משה הוא כך: נשלח תעודת האות הלזה על ידי עוקר או איחוד והייחוד(?), אשר אם יחפוץ בכך - יוכל לגרום לדבר עצמו שעליו האדם נשען ונתמך, המטה, וזה יהיה כלי מריתו למרוד בו". המטה הזה יהיה הנחש המורד. "ומצד שני הוא אומר, להיפך, אם יחפוץ אחרת - יוכל לקחת כוח מתנגד ושונא שהאדם ירא ממנו ונס מפניו, ולתת בידו כמשענת נוכה וככלי העושה את רצונו". כמו שהנחש נהפך למטה. זה הקדוש ברוך הוא ירמז (?). השונא הכי גדול הוא יכול להיות המטה שלך, והמטה שלך... המטה, תבין שרק הקדוש ברוך הוא.
אומרים שה"הייליגער רוז'ינער" אמר, כשהיה לו רדיפות מ... מלכות הרשעה במדינת רוסיה, הוא היה נרדף מהם. אז הוא אמר: דוד המלך, כשהתעורר עליו קנאת שאול, שאול המלך, וקמו וביקשו את נפשו, רצו... רצו להרוג אותו. עם כל זה, מה הוא אמר דוד המלך? "שרים רדפוני חינם". כל הרדיפות של השרים האלו, של שאול המלך ואנשי ביתו, זה בחינם, כי הם לא יכולים להזיק לשום דבר. אני לא מפחד מהם. זה בחינם. רק מה? "ומדברך פחד ליבי", אני מפחד כי אתה שלחת עליהם, כי זה יצא מאיתו יתברך. "ומדברך" - בגלל הגזירה שלך הם רודפים אחרי, על זה פחד ליבי. "שרים רדפוני" - מה שהם רודפים אותי - "חינם", אני לא מפחד מזה, כי הם לא יכולים לעשות שום דבר. רק מה? "ומדברך פחד ליבי", כי זה הגזירה שלך, לכן פחד ליבי.
וזה כתוב השבוע באמת בפרשה מיד אחרי שני: "ופרעה הקריב, וישאו בני ישראל את עיניהם והנה מצרים נוסע אחריהם, וייראו מאוד ויצעקו בני ישראל אל השם". השואלים, איך כתוב "וישאו בני ישראל את עיניהם והנה מצרים נוסע אחריהם"? שואלים למה לא כתוב "ויראו בני ישראל והנה מצרים נוסע אחריהם"? למה "וישאו בני ישראל את עיניהם"? רק זה הפירוש אומר, שכשכלל ישראל ראו את מצרים נוסע אחריהם, אז נשאו עיניהם כלפי מעלה. "וישאו בני ישראל את עיניהם" - זה לא המצרים, זה "האייבישטער". אין כוח ביד המצרים לרדוף אם השם לא ציווה, אם לא נגזר זאת מן השמיים. ולכן "ויצעקו בני ישראל אל השם", לכן צעקו להקדוש ברוך הוא. כי "וישאו בני ישראל את עיניהם", הם הבינו שזה מהקדוש ברוך הוא. לדעת בכל עת ובכל דבר לחיות בזה, שזה הקדוש ברוך הוא ורק מהקדוש ברוך הוא.
פרשת המן. כולם יודעים, יום שלישי בשלח, סגולה של פרשת המן. וזה מה שכתוב, אתם יודעים שבהלכה כתוב בשולחן ערוך בסימן א', כתוב סימן א' סעיף ה': "טוב לומר" - בכל יום, המחבר אומר - "טוב לומר פרשת העקידה ופרשת המן". אומר הט"ז, שמה העניין בפרשת המן? שהוא כדי שיאמין האדם שכל מזונותיו באים בהשגחה מלמעלה. כדי להאמין שהכל בא... געלט, כסף, מגיע... מאני (Money), מגיע מלמעלה. הכל רק מלמעלה.
אומר על זה המשנה ברורה בסעיף קטן י"ג, מסביר את זה קצת יותר: "להורות שריבוי ההשתדלות לא יועיל מאומה". שום דבר לא יועיל לך ריבוי ההשתדלות, כי כך היה בפרשת המן. מה היה? "וימודו בעומר, לא העדיף המרבה והממעיט לא החסיר". כל אחד היה צריך לקבל עומר לגולגולת. זה שלקח הרבה וזה לקח מעט - אותו דבר, מדדו אחר כך בבית, ראו - היה עומר לגולגולת, שום דבר לא עזר.
האמת היא, כתוב ברבינו בחיי אומר בפרשת השבוע, או ב... כתוב זה הלשון: "וקבלה ביד חכמים: כי כל האומר פרשת המן בכל יום - מובטח לו, מובטח לו, שלא יבוא לידי... שלא יבוא לעולם לידי חסרון מזונות". אף פעם הוא לא יבוא לידי חסרון מזונות. קבלה ביד חכמים. עוד הפעם: "כי כל האומר פרשת המן בכל יום, מובטח לו שלא יבוא לעולם לידי חסרון מזונות".
התשב"ץ בסימן רנ"ו אומר בשם ירושלמי, מביא ירושלמי, שכל האומר פרשת המן בכל יום מובטח לו שלא יתמעטו מזונותיו, והתשב"ץ מוסיף שתי מילים: "ואני ערב". הוא "ואני ערב". שמה? שעל הבטחה - מובטח לו שלא יתמעטו מזונותיו.
איך אומרים פרשת המן? הציבור מתחיל, אומרים "ויאמר השם אל משה הנני ממטיר". אומרים מה זה "ממטיר"? "הנני ממטיר לכם לחם מן השמים". מה זה ממטיר? שממטיר זה מטר. גשם. כשהולך ברחוב ויש גשם, יש גשם חזק - אתה רוצה לעצור את זה שיהיה יותר חלש, אתה יכול? לא. ואם יש חלש אתה רוצה שיהיה יותר חזק - אתה רוצה, אתה יכול? לא. אותו דבר לחם מן השמים. אתה לא יכול שום דבר. יש מצווה של השתדלות, אבל ריבוי ההשתדלות לא יועיל מאומה. אתה לא יכול שום דבר לעשות.
על זה אמרו חז"ל: "מאן דיהיב חיי", הגמרא אומרת בתענית דף ח', מי שנותן חיים - "יהיב מזוני". מה הפירוש? שיהיה עשיר הכי גדול, המלך הכי גדול, עשיר, טריליונר - הוא יכול להוסיף עוד יום בחיים? לחיות? לא. אותו דבר "יהיב מזוני", "מאן דיהיב חיי יהיב מזוני", עוד דולר גם לא יכול להוסיף. שום דבר. יש מצווה של השתדלות אבל אנחנו חייבים להאמין שהכל קצוב מהשמיים.
ברור שצריכים לעשות השתדלות. ברור. אבל זה כמו, אתם יודעים, שהולכים השבוע בשבת שירה הולכים לתת לציפורים לאכול. לציפורים. למה נותנים לציפורים? עוד מעט נראה אולי את הטעם האמיתי... אבל לא נותנים לציפורים... ראיתם איך ציפור אוכל? הייתם? עם הראש, מכופף את הראש - ומיד מעלה. כמו קפיץ. מוריד ומיד מעלה. מוריד ומיד מעלה. ככה תעשה את ההשתדלות. השתדלות צריך לעשות, אבל מיד תשא עיניו לשמיים. תרים את העיניים לשמיים. תרים את הראש למעלה. "וישאו בני ישראל". תאמין שהכל מהקדוש ברוך הוא. לעשות השתדלות אבל להאמין מיד שהכל מהקדוש ברוך הוא.
לעשות השתדלות, ודאי צריך לעשות השתדלות. ודאי צריך לעשות השתדלות.
@צדיק-תמים
https://speech.googleapis.com/v1/speech
אם אתה משתמש בAI, תוכל להביא לו את הפלט של elevenlabs, יכול להיות שהוא יגיע עם זה לתוצאות עוד יותר טובות. -
@צדיק-תמים
https://speech.googleapis.com/v1/speech
אם אתה משתמש בAI, תוכל להביא לו את הפלט של elevenlabs, יכול להיות שהוא יגיע עם זה לתוצאות עוד יותר טובות. -
@צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
ברור לי שGPT עצמו ייתן תוצאה טובה יותר.@dovid @צדיק-תמים לא הבנתי, יש אפשרות לתמלל בגוגל עם המודול של ג'מיני פרו (בAPI)? כי לפי מה שהביא @צדיק-תמים זה מאוד מדויק ומובן
-
@dovid @צדיק-תמים לא הבנתי, יש אפשרות לתמלל בגוגל עם המודול של ג'מיני פרו (בAPI)? כי לפי מה שהביא @צדיק-תמים זה מאוד מדויק ומובן
-
@ששא ודאי שאפשר
ופרומפט מתאים ישפר את התוצאה עוד יותר
יש מגבלות קצב כל עוד החשבון שלך לא הוציא X כסף (תגגל gemini rate limits)@צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:
ופרומפט מתאים
דהיינו?
לא הוציא X כסף
לא הבנתי
תגגל gemini rate limits
מגבלות די נמוכות - 1,500 ליום זה ממש לא הרבה...
-
@צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:
ופרומפט מתאים
דהיינו?
לא הוציא X כסף
לא הבנתי
תגגל gemini rate limits
מגבלות די נמוכות - 1,500 ליום זה ממש לא הרבה...
-
@ששא
פרומפט הכוונה לבקש במפורט את סגנון הפלט הרצוי, רקע על הדובר, מילים רלוונטיות, כל הדברים שמשפרים תפוקה של מודל שפה כמו גמיני

לא יודע מאיפה המספר 1500@צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:
לא יודע מאיפה המספר 1500
1.זה לא קשור לדף הזה?
2.ממש לא הבנתי מה אומר המלל שם ומה פירושם
ואשמח גם אם אחרי ההסבר תוכל גם להגיד לי אם אתה יודע מה באמת המגבלה -
@צדיק-תמים כתב בתמלול הקלטות לעברית - בדיוק מלא:
לא יודע מאיפה המספר 1500
1.זה לא קשור לדף הזה?
2.ממש לא הבנתי מה אומר המלל שם ומה פירושם
ואשמח גם אם אחרי ההסבר תוכל גם להגיד לי אם אתה יודע מה באמת המגבלה -
יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.
-
יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.
@dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:
יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.
אני רואה שהזכירו את האתר שלי לעיל
כמה הערות מנסיוני כאחד שהשקיע הרבה בירור ועבודה של חודשים בנושא:
-
בשונה מהמקובל - למודלים כמו וויספר ודומיהם יש הזיות לא פחות ממודלים מבוססי LLM
באופן אישי נתקלתי בהזיות האלו בשימוש די בסיסי אפילו עבור תמלול תוכן באנגלית
הנה לדוגמה כתבה בנושא שנתקלתי בה בעבר -
LLMs אכן הוזים לפעמים כאשר מדובר על תוכן שפחות נמצא בנתוני האימון, כמו יידיש או הברה אשכנזית כבדה
אבל בעברית סטנדרטית עם איכות הקלטה סבירה, רמת הדיוק שלהם קרובה מאוד ל-100%, ברמה שיתכן שניתן לוותר אפילו על הגייה אנושית (אם כי לא הייתי סומך על זה בעיניים עצומות) -
המחיר הוא אכן שיקול משמעותי ולשימוש יומיומי בסיסי בהחלט אין טעם בשימוש ב-LLMs, אבל עבור כל מה שמעבר (עריכת ספרים, תמלול סרטונים ליוטיוב, תמלול פודקאסטים), אין ספק ששימוש ב-LLMs (או באתר שלי...) יהיה הרבה יותר יעיל ויחסוך הרבה עבודה, ביחוד עבור מי שגם ככה משקיע מאות ואלפי שקלים עבור תמלול אנושי
-
הכוכבית היחידה הוא תמלול כתוביות לפי זמנים - שבו LLMs בהחלט עשויים להזות ולהמציא זמנים או לא לדייק בהם
גם יצירת תוכן בפורמט קבוע כמו SRT עדיין בעייתית וגורמת להרבה תקלות
@dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:
@צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
ברור לי שGPT עצמו ייתן תוצאה טובה יותר.- מידע בונוס: האיכות של GPT עבור תמלול לא מרשימה בכלל ולא שווה הרבה. נראה ש-OpenAI די הזניחו תכונות מולטי-מודאליות מסויימות בשונה מגוגל
למעשה, נראה לי שהמודל האחרון שתומך ב-API של TTS הוא GPT 4o
-
-
@dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:
יש שתי נקודות שבמקרים מסויימים יכולים להיות סיבות למה לא להשתמש בג'מיני (או כל LLM מולטי), אלא בAPI ייעודי:
א. מחיר - הLLM יותר יקר ופחות ניתן לחיזוי בלי ניסיון בפועל.
ב. טמפרטורה ודטרמניזם - הLLM עלול - תיאורטית לפחות - להפתיע לרעה, או בכלל להפתיע.יכול להיות שאני טועה בשניהם (כלומר שיש דרך להעריך בקלות את המחיר, ושכיום או תמיד היה ניתן להדק את הודאות של הפלט ל99.99 אחוזים), אני התמודדתי עם שני הדברים האלה כמה פעמים. גם בתרגום טקסט לטקסט, וגם באילוץ מבנה תשובה ששמה לכאורה לא יכולים להיות הפתעות.
אני רואה שהזכירו את האתר שלי לעיל
כמה הערות מנסיוני כאחד שהשקיע הרבה בירור ועבודה של חודשים בנושא:
-
בשונה מהמקובל - למודלים כמו וויספר ודומיהם יש הזיות לא פחות ממודלים מבוססי LLM
באופן אישי נתקלתי בהזיות האלו בשימוש די בסיסי אפילו עבור תמלול תוכן באנגלית
הנה לדוגמה כתבה בנושא שנתקלתי בה בעבר -
LLMs אכן הוזים לפעמים כאשר מדובר על תוכן שפחות נמצא בנתוני האימון, כמו יידיש או הברה אשכנזית כבדה
אבל בעברית סטנדרטית עם איכות הקלטה סבירה, רמת הדיוק שלהם קרובה מאוד ל-100%, ברמה שיתכן שניתן לוותר אפילו על הגייה אנושית (אם כי לא הייתי סומך על זה בעיניים עצומות) -
המחיר הוא אכן שיקול משמעותי ולשימוש יומיומי בסיסי בהחלט אין טעם בשימוש ב-LLMs, אבל עבור כל מה שמעבר (עריכת ספרים, תמלול סרטונים ליוטיוב, תמלול פודקאסטים), אין ספק ששימוש ב-LLMs (או באתר שלי...) יהיה הרבה יותר יעיל ויחסוך הרבה עבודה, ביחוד עבור מי שגם ככה משקיע מאות ואלפי שקלים עבור תמלול אנושי
-
הכוכבית היחידה הוא תמלול כתוביות לפי זמנים - שבו LLMs בהחלט עשויים להזות ולהמציא זמנים או לא לדייק בהם
גם יצירת תוכן בפורמט קבוע כמו SRT עדיין בעייתית וגורמת להרבה תקלות
@dovid כתב בתמלול הקלטות לעברית - בדיוק מלא:
@צדיק-תמים כשכתבתי גוגל הבנת שאני מתכוון לג'מיני?
גם GPT אני מתכוון לAPI הייעודי שלהם לזיהוי טקסט,
ברור לי שGPT עצמו ייתן תוצאה טובה יותר.- מידע בונוס: האיכות של GPT עבור תמלול לא מרשימה בכלל ולא שווה הרבה. נראה ש-OpenAI די הזניחו תכונות מולטי-מודאליות מסויימות בשונה מגוגל
למעשה, נראה לי שהמודל האחרון שתומך ב-API של TTS הוא GPT 4o
-